即時熱門政治軍武社會生活健康國際地方蒐奇影音財經娛樂藝文汽車時尚體育 3C 評論玩咖食譜地產專區求職

百度新語音辨識系統「Deep Speech」準確率達81%

2014/12/22 11:06 3C 科技頻道／綜合報導　

中國搜尋引擎巨頭百度表示，已開發出可以在嘈雜環境中使用的語音辨識系統「Deep Speech」，它在餐廳等嘈雜環境下可以達到81%的辨識準確度，領先同業Bing、Google以及Wit.AI等的65%，這款語音辨識系統將來有機會搭載到百度開發的智慧型裝置中。

中國搜尋引擎巨頭百度開發可以在嘈雜環境中使用的語音辨識系統「Deep Speech」。

百度首席科學家吳思達表示，Deep Speech不只辨識準確率相當高，也把其他語音識別系統那些返回空白字符串的結果排除在外，Deep Speech跟頂級的學術型語音識別模型Hub5'00相比也高出9%。

Deep Speech的訓練集是由7000小時的語音會話數據與飯店、電視、自助餐廳、火車內等場景噪音背景合成。

而百度也考慮將Deep Speech放進可穿戴設備使用的語音識別軟體當中，包括百度還在開發的「CoolBox」－與Amazon Echo類似的語音家電產品，另外，百度正在開發的智慧自行車也將利用Deep Speech技術。

Deep Speech捨棄傳統聲學模型，而使用GPU點到點的深度學習基礎模式。

百度為開發Deep Speech，收集了7000小時的語音會話數據，再與飯店、電視、自助餐廳、火車內等場景噪音背景合成，形成約10萬小時的訓練集，而Hub5'00 的數據總共只有2300小時。

百度考慮將Deep Speech放進可穿戴設備使用的語音識別軟體當中，包括百度還在開發的「CoolBox」。

吳恩達表示，Deep Speech捨棄傳統聲學模型，而使用GPU點到點的深度學習基礎模式，給Deep Speech提供大量的數據，然後讓它自行學習所有需要學習的東西，這種做法除了有效提高辨識的準確率，也大幅縮減了代碼庫的規模。

熱門賽事、球星動態不漏接

不用抽不用搶現在用APP看新聞保證天天中獎　點我下載APP　按我看活動辦法

Deep Speech 百度網路服務科學新知

看更多！加入3C科技粉絲團

網友回應