靠口罩振動收音 為吵鬧工廠打造專用麥克風
日本電子零件大廠村田製作所,在 CEATEC 2025 上公開口罩語音夾(Mask Voice Clip)裝置,使用了村田自己的「Picoleaf」壓電薄膜感測器這個關鍵零件,可在吵鬧環境收到清晰的聲音。它的收音方式非常特別,不像傳統麥克風是接收空氣中的聲音,而是僅靠感應說話時口罩表面產生的細微振動來偵測語音。正因為它是直接從振動「抓取」聲音,這項技術最大的好處就是能完全隔絕周圍的背景噪音和環境音。即使在好幾台機器同時運作的工廠或生產線等非常吵鬧的環境,使用者還是能靠講話來操作設備或輸入資料,完全不會被干擾。村田製作所認為,隨著 AI 技術(例如大型語言模型 LLM)越來越進步,未來用自然語言
7 個月前
隔幾步遠也能偷聽 雷達抓手機微震動重現對話
賓州州立大學的研究團隊展示了一種新型遠距監聽技術,利用毫米波雷達偵測手機聽筒播放聲音時產生的極細微震動,能在幾英尺外重建通話內容。這些震動雖然人耳聽不到、一般麥克風也錄不到,但雷達能測到,之後再用電腦分析即可轉成文字。因為雷達收到的訊號通常很雜,研究團隊用了開源語音辨識模型 Whisper,並透過「低秩適應」方法微調,只調整了約 1% 的模型參數,就能專門處理這種嘈雜訊號,將震動數據轉換成文字。目前最高能達到 60% 的文字轉錄準確率,而且詞彙量可達一萬字。雖然只轉出零碎的字詞,也可能讓人猜到對話內容。這是他們 2022 年技術的升級版。當時雷達必須靠手機超近,大概一隻手掌的距離,辦識度約有八
9 個月前
AI語音辨識也可找蛀蟲 雲科大發表AI木雕蟲聲自動檢測技術
苗栗三義木雕博物館推動藏品保存維護計畫,與國立雲林科技大學智慧辨識產業服務研究中心合作,引入低氧除蟲、AI木雕蟲聲自動檢測、蟲蛀洞智慧等技術,有助守護木雕藏品。 苗栗縣政府文化觀光局表示,目前三義木雕博物館藏品約1300件,面對人力短缺的挑戰,藏品維護壓力與日俱增,以往部分木雕創作僅賴目測檢視,當發現蛀蟲問題時,以加熱煙燻方式除蟲;透過113年「三義木雕博物館藏品保存維護計畫」與雲科大團隊合作,導入AI科技,可更精準、有效率地協助木雕藝品脫離蟲蟲危機。 文觀局今天在三義木雕館舉辦成果發表,由雲科大教授張傳育團隊領導開發的「AI木雕蟲聲自動檢測技術」,精確監聽木材內部微弱的蛀蟲聲音,無需破壞文物
1 年前
可以輸出成影片字幕檔的語音轉文字Mac辨識軟體:MacWhisper
MacWhisper這個Mac專用軟體,其實就是整合OpenAI推出的Whisper語音轉文字演算法包裝成套專軟體讓一般人使用。這樣說來平平無奇,但在我使用免費版10分鐘後,就馬上付了20歐元來升級付費版本(買斷制、買一次就可),好搭配更多不同的演算模型和輸出格式。 結論來說這個工具真的太厲害了,讓我深深感受到這次人工智慧來臨是真的,把過去總是只能做70-80分的功能做到非常滿意,例如翻譯和語音辨識。而且為了求得這個提升生產力的工具,馬上願意付費。但所謂的聽打這樣的工作也將會被MacWhisper或大大小小的AI工具給取代,有如過去謄寫的寫字元一樣被淘汰,還是有一點歔欷。 ▲AI工具真的有用:
2 年前
Google IO 2022 : Google 展示可進行即時翻譯並以增強實境呈現的 AR 眼鏡
被視為 AR 眼鏡先驅的 Google Glasses 曾一度成為產業吹捧的殺手級產品,不過畢竟當時的技術成熟度不足,最終僅成為收藏家的夢幻產品;今年 Google IO 的尾聲, Google 再度釋出一段形象短片,介紹結合即時翻譯與增強實境的 AR 眼鏡概念,不過 Google 並未將提到是未來規劃的商品,只是作為技術概念宣傳,也不確定 Google 是否會推出新一代 AR 眼鏡產品。 ▲在短片中介紹結合增強實境的內容顯示方式 這段短片把 Google 強大的 AI 辨識功能與 AR 眼鏡結合,或許可視為 Pixel Buds 的 AR 眼鏡版本,透過接收對方的聲音後,會進行即時翻譯並將結
4 年前
GTC 2022 : NVIDIA AI 宣布在語音、推薦系統與大規模推論多項進展與升級工具
NVIDIA 已多次重申 NVIDIA 是軟體與硬體相輔相成的公司,尤其在以 GPU 加速為基礎的 AI 技術驅動 AI 產業發展, NVIDIA 屢屢推出針對不同領域的 AI 工具,以及持續改善工具使效率更為提升,在今年 GTC 大會, NVIDIA 也宣布其 AI 技術在語音、推薦系統與超大規模推論的重大進展,此次 NVIDIA 在 GTC 大會宣布更新達 60 款 SDK ,使其具備更高的效率,並首度針對作業研究、量子演算、 6G 研究與圖形分析科學家提供全新工具。 NVIDIA 在此次 GTC 大會宣布啟動 NVIDIA AI 加速計畫,能確保由 NVIDIA 軟體與解決方案合作夥伴開
4 年前
傳 Pixel 6a 也將採用 Google Tensor 處理器,只是螢幕更小、相機模組降級
Google 在宣布自主處理器 Google Tensor 與兩款旗艦機 Pixel 6 、 Pixel 6 Pro 後,外界也開始關注下一款中階機種 Pixel 6a 的動向,原本預估可能採用高通平台 Snapdragon 785G ,但根據最新的謠言指稱, Pixel 6a 也將採用 Tensor 處理器,只是除了尺寸略小以外,相機模組也會被換成較低階的模組。不過依照慣例 Pixel 6a 至少也還要半年才會亮相,故屆時 Tensor 的生產成本或許已經降低不少。 ▲ Tensor 的 AI 加速仍比此世代 Android 旗艦平台強,藉此實現即時翻譯與影像 HDR 等特色功能 Pixel
4 年前
加上透明螢幕和語音辨識的防疫隔板 根本戀愛養成遊戲場景
在戀愛養成遊戲玩家可以利用打字和角色對話,文字會在螢幕下方出現,京瓷公司開發了一種防疫隔板,同樣可以把你說的話出現在透明壓克力板上,這種既視感就像在玩虛擬遊戲一樣。 開發的理念是想讓戴著口罩和隔著距離的彼此溝通更順利,即時的語音辨識可以邊聽聲音邊看文字,再加上預先設定的圖或是文字,可以加強傳達的意思,若是聽力受損或是老年人有了文字的輔助可以縮短理解的時間。由智慧手機和投影機組成,利用現有的隔板即可輕鬆部署。 特殊的設計你不會看到對方在板子上所顯示的反轉文字,但可以同時看到自己和對方對話的文字以利確認是否辨識成功。預計11月將在橫濱市區公所高齡殘障支援課窗口先行示範使用。這裡看更多。
4 年前
蘋果正利用「Siri Speech Study」app 邀請使用者分享在地語音資料 強化 Siri 語音辨識與互動能力
蘋果將透過此款app蒐集更多在地語音資料,除了讓Siri能更進一步理解使用者語言,同時也能了解更多慣用語,以及各地語言表意上的差異,藉此讓Siri數位助理服務有更精準互動表現。 讓Siri更能與Alexa、Google Assistant抗衡 蘋果近期悄悄推出一款名為「Siri Speech Study」的app,將藉此蒐集更多使用者語音相關資料,讓蘋果能進一步強化Siri數位助理服務表現。 由於app本身實際運作前,必須由使用者簽署同意內容進行參與,加上蘋果並未在App Store刻意推廣此款app,甚至使用者透過關鍵字等方式搜尋,基本上也不會在App Store看見此款app,而蘋果更僅透
4 年前
Google IO 2021: Google 宣布下一代自然語意理解 AI 技術 LaMDA ,超越目前只能回答正確答案的 BERT 、宛若與好友進行閒聊對話
Google 的 AI 自然語言理解技術在業界是有目共睹的,當前我們平日所使用的自然語言理解技術是基於 BERT ,然而 Google 當然不光只滿足於 BERT ,在今年的 Google IO 宣布新一代的自然語言理解技術 LaMDA / Language Model for Dialogue Applications 。目前 LaMDA 仍在開發階段,還未有具體導入 Google 服務的時程規劃。 不同於 BERT 基於理解與對話, LaMDA 進一步把自然語意對話 AI 昇華到能夠如真人一般在對話中參雜閒聊,關鍵在於 LaMDA 不同於 BERT 等傳統對話 AI 圍繞在與談話主題相關的
5 年前
友站推薦
專為台灣用語、口音設計的 AI!聯發科推出語音辨識開源模型「MR Breeze ASR 25」
INSIDE - INSIDE 硬塞的網路趨勢觀察
敢說、敢用、敢表達!台師大陳浩然如何用AI助理幫助學生全面強化英文?
關鍵評論 - 精選轉載
「吐槽大師」社群爆紅:底層技術難以超車美國,中國在AI應用磨出自己的新玩法
關鍵評論 - 楚焱堯
Meta 斥資打造 2 個 2.4 萬 GPU 叢集,訓練 Llama 3 等 AI 巨獸
INSIDE - INSIDE 硬塞的網路趨勢觀察
蘋果要將 Siri AI 團隊集中至德州!不搬遷的員工將被解雇,影響上百人
INSIDE - Sisley
I'm hating it!麥當勞 AI 得來速出現多次失誤,自行幫顧客加餐點
INSIDE - Jocelyn
如何使用Windows 11「語音輸入」繁體中文,快速完成會議紀錄、思考筆記?
關鍵評論 - Esor Huang
【Howie 商業投資】結盟康乃爾!Google為何跨入鳥類語音辨識領域?
INSIDE - Howie Su
Nvidia 新 AI 語音合成技術,揮別 Google 小姐實現真人聲發音
INSIDE - Archer

相關文章