語音辨識全攻略 (49469)

最新 | 熱門

新奇搞笑語音辨識穿戴式裝置村田製作所壓電薄膜聲音分離

靠口罩振動收音為吵鬧工廠打造專用麥克風

日本電子零件大廠村田製作所，在 CEATEC 2025 上公開口罩語音夾（Mask Voice Clip）裝置，使用了村田自己的「Picoleaf」壓電薄膜感測器這個關鍵零件，可在吵鬧環境收到清晰的聲音。它的收音方式非常特別，不像傳統麥克風是接收空氣中的聲音，而是僅靠感應說話時口罩表面產生的細微振動來偵測語音。正因為它是直接從振動「抓取」聲音，這項技術最大的好處就是能完全隔絕周圍的背景噪音和環境音。即使在好幾台機器同時運作的工廠或生產線等非常吵鬧的環境，使用者還是能靠講話來操作設備或輸入資料，完全不會被干擾。村田製作所認為，隨著 AI 技術（例如大型語言模型 LLM）越來越進步，未來用自然語言

Twelve

7 個月前

新奇搞笑語音辨識隱私安全毫米波雷達遠距監聽震動偵測

隔幾步遠也能偷聽　雷達抓手機微震動重現對話

賓州州立大學的研究團隊展示了一種新型遠距監聽技術，利用毫米波雷達偵測手機聽筒播放聲音時產生的極細微震動，能在幾英尺外重建通話內容。這些震動雖然人耳聽不到、一般麥克風也錄不到，但雷達能測到，之後再用電腦分析即可轉成文字。因為雷達收到的訊號通常很雜，研究團隊用了開源語音辨識模型 Whisper，並透過「低秩適應」方法微調，只調整了約 1% 的模型參數，就能專門處理這種嘈雜訊號，將震動數據轉換成文字。目前最高能達到 60% 的文字轉錄準確率，而且詞彙量可達一萬字。雖然只轉出零碎的字詞，也可能讓人猜到對話內容。這是他們 2022 年技術的升級版。當時雷達必須靠手機超近，大概一隻手掌的距離，辦識度約有八

Twelve

9 個月前

雲端服務 AI 語音辨識人工智慧台灣科技

AI語音辨識也可找蛀蟲雲科大發表AI木雕蟲聲自動檢測技術

苗栗三義木雕博物館推動藏品保存維護計畫，與國立雲林科技大學智慧辨識產業服務研究中心合作，引入低氧除蟲、AI木雕蟲聲自動檢測、蟲蛀洞智慧等技術，有助守護木雕藏品。苗栗縣政府文化觀光局表示，目前三義木雕博物館藏品約1300件，面對人力短缺的挑戰，藏品維護壓力與日俱增，以往部分木雕創作僅賴目測檢視，當發現蛀蟲問題時，以加熱煙燻方式除蟲；透過113年「三義木雕博物館藏品保存維護計畫」與雲科大團隊合作，導入AI科技，可更精準、有效率地協助木雕藝品脫離蟲蟲危機。文觀局今天在三義木雕館舉辦成果發表，由雲科大教授張傳育團隊領導開發的「AI木雕蟲聲自動檢測技術」，精確監聽木材內部微弱的蛀蟲聲音，無需破壞文物

中央社

1 年前

App youtube 語音辨識 Mac app OpenAI 語音轉文字 MacWhisper

可以輸出成影片字幕檔的語音轉文字Mac辨識軟體：MacWhisper

MacWhisper這個Mac專用軟體，其實就是整合OpenAI推出的Whisper語音轉文字演算法包裝成套專軟體讓一般人使用。這樣說來平平無奇，但在我使用免費版10分鐘後，就馬上付了20歐元來升級付費版本（買斷制、買一次就可），好搭配更多不同的演算模型和輸出格式。結論來說這個工具真的太厲害了，讓我深深感受到這次人工智慧來臨是真的，把過去總是只能做70-80分的功能做到非常滿意，例如翻譯和語音辨識。而且為了求得這個提升生產力的工具，馬上願意付費。但所謂的聽打這樣的工作也將會被MacWhisper或大大小小的AI工具給取代，有如過去謄寫的寫字元一樣被淘汰，還是有一點歔欷。 ▲AI工具真的有用：

atticus

2 年前

科技應用 Google 網路開發年會 Google 翻譯 AR 語音辨識增強實境

Google IO 2022 ： Google 展示可進行即時翻譯並以增強實境呈現的 AR 眼鏡

被視為 AR 眼鏡先驅的 Google Glasses 曾一度成為產業吹捧的殺手級產品，不過畢竟當時的技術成熟度不足，最終僅成為收藏家的夢幻產品；今年 Google IO 的尾聲， Google 再度釋出一段形象短片，介紹結合即時翻譯與增強實境的 AR 眼鏡概念，不過 Google 並未將提到是未來規劃的商品，只是作為技術概念宣傳，也不確定 Google 是否會推出新一代 AR 眼鏡產品。 ▲在短片中介紹結合增強實境的內容顯示方式這段短片把 Google 強大的 AI 辨識功能與 AR 眼鏡結合，或許可視為 Pixel Buds 的 AR 眼鏡版本，透過接收對方的聲音後，會進行即時翻譯並將結

Chevelle.fu

4 年前

產業消息 nvidia AI 語音辨識

GTC 2022 ： NVIDIA AI 宣布在語音、推薦系統與大規模推論多項進展與升級工具

NVIDIA 已多次重申 NVIDIA 是軟體與硬體相輔相成的公司，尤其在以 GPU 加速為基礎的 AI 技術驅動 AI 產業發展， NVIDIA 屢屢推出針對不同領域的 AI 工具，以及持續改善工具使效率更為提升，在今年 GTC 大會， NVIDIA 也宣布其 AI 技術在語音、推薦系統與超大規模推論的重大進展，此次 NVIDIA 在 GTC 大會宣布更新達 60 款 SDK ，使其具備更高的效率，並首度針對作業研究、量子演算、 6G 研究與圖形分析科學家提供全新工具。 NVIDIA 在此次 GTC 大會宣布啟動 NVIDIA AI 加速計畫，能確保由 NVIDIA 軟體與解決方案合作夥伴開

Chevelle.fu

4 年前

產業消息翻譯 AI Pixel 語音辨識 Tensor Pixel 6a

傳 Pixel 6a 也將採用 Google Tensor 處理器，只是螢幕更小、相機模組降級

Google 在宣布自主處理器 Google Tensor 與兩款旗艦機 Pixel 6 、 Pixel 6 Pro 後，外界也開始關注下一款中階機種 Pixel 6a 的動向，原本預估可能採用高通平台 Snapdragon 785G ，但根據最新的謠言指稱， Pixel 6a 也將採用 Tensor 處理器，只是除了尺寸略小以外，相機模組也會被換成較低階的模組。不過依照慣例 Pixel 6a 至少也還要半年才會亮相，故屆時 Tensor 的生產成本或許已經降低不少。 ▲ Tensor 的 AI 加速仍比此世代 Android 旗艦平台強，藉此實現即時翻譯與影像 HDR 等特色功能 Pixel

Chevelle.fu

4 年前

新奇搞笑語音辨識防疫隔板戀愛養成遊戲

加上透明螢幕和語音辨識的防疫隔板根本戀愛養成遊戲場景

在戀愛養成遊戲玩家可以利用打字和角色對話，文字會在螢幕下方出現，京瓷公司開發了一種防疫隔板，同樣可以把你說的話出現在透明壓克力板上，這種既視感就像在玩虛擬遊戲一樣。開發的理念是想讓戴著口罩和隔著距離的彼此溝通更順利，即時的語音辨識可以邊聽聲音邊看文字，再加上預先設定的圖或是文字，可以加強傳達的意思，若是聽力受損或是老年人有了文字的輔助可以縮短理解的時間。由智慧手機和投影機組成，利用現有的隔板即可輕鬆部署。特殊的設計你不會看到對方在板子上所顯示的反轉文字，但可以同時看到自己和對方對話的文字以利確認是否辨識成功。預計11月將在橫濱市區公所高齡殘障支援課窗口先行示範使用。這裡看更多。

Twelve

4 年前

蘋果新聞 Siri 語音辨識蘋果

蘋果正利用「Siri Speech Study」app 邀請使用者分享在地語音資料強化 Siri 語音辨識與互動能力

蘋果將透過此款app蒐集更多在地語音資料，除了讓Siri能更進一步理解使用者語言，同時也能了解更多慣用語，以及各地語言表意上的差異，藉此讓Siri數位助理服務有更精準互動表現。讓Siri更能與Alexa、Google Assistant抗衡蘋果近期悄悄推出一款名為「Siri Speech Study」的app，將藉此蒐集更多使用者語音相關資料，讓蘋果能進一步強化Siri數位助理服務表現。由於app本身實際運作前，必須由使用者簽署同意內容進行參與，加上蘋果並未在App Store刻意推廣此款app，甚至使用者透過關鍵字等方式搜尋，基本上也不會在App Store看見此款app，而蘋果更僅透

Mash Yang

4 年前

科技應用 Google 網路開發年會 Google AI google io 語音辨識語意分析 Google Assistan 自然語意互動 LaMDA BERT

Google IO 2021： Google 宣布下一代自然語意理解 AI 技術 LaMDA ，超越目前只能回答正確答案的 BERT 、宛若與好友進行閒聊對話

Google 的 AI 自然語言理解技術在業界是有目共睹的，當前我們平日所使用的自然語言理解技術是基於 BERT ，然而 Google 當然不光只滿足於 BERT ，在今年的 Google IO 宣布新一代的自然語言理解技術 LaMDA / Language Model for Dialogue Applications 。目前 LaMDA 仍在開發階段，還未有具體導入 Google 服務的時程規劃。不同於 BERT 基於理解與對話， LaMDA 進一步把自然語意對話 AI 昇華到能夠如真人一般在對話中參雜閒聊，關鍵在於 LaMDA 不同於 BERT 等傳統對話 AI 圍繞在與談話主題相關的

Chevelle.fu

5 年前

友站推薦