即時 熱門 政治 軍武 社會 生活 健康 國際 地方 蒐奇 影音 財經 娛樂 藝文 汽車 時尚 體育 3C 評論 玩咖 食譜 地產 專區 求職

百度新語音辨識系統「Deep Speech」準確率達81%

2014/12/22 11:06 3C 科技頻道/綜合報導 

中國搜尋引擎巨頭百度表示,已開發出可以在嘈雜環境中使用的語音辨識系統「Deep Speech」,它在餐廳等嘈雜環境下可以達到81%的辨識準確度,領先同業Bing、Google以及Wit.AI等的65%,這款語音辨識系統將來有機會搭載到百度開發的智慧型裝置中。

中國搜尋引擎巨頭百度開發可以在嘈雜環境中使用的語音辨識系統「Deep Speech」。

百度首席科學家吳思達表示,Deep Speech不只辨識準確率相當高,也把其他語音識別系統那些返回空白字符串的結果排除在外,Deep Speech跟頂級的學術型語音識別模型Hub5'00相比也高出9%。

Deep Speech的訓練集是由7000小時的語音會話數據與飯店、電視、自助餐廳、火車內等場景噪音背景合成。

而百度也考慮將Deep Speech放進可穿戴設備使用的語音識別軟體當中,包括百度還在開發的「CoolBox」-與Amazon Echo類似的語音家電產品,另外,百度正在開發的智慧自行車也將利用Deep Speech技術。

Deep Speech捨棄傳統聲學模型,而使用GPU點到點的深度學習基礎模式。

百度為開發Deep Speech,收集了7000小時的語音會話數據,再與飯店、電視、自助餐廳、火車內等場景噪音背景合成,形成約10萬小時的訓練集,而Hub5'00 的數據總共只有2300小時。

百度考慮將Deep Speech放進可穿戴設備使用的語音識別軟體當中,包括百度還在開發的「CoolBox」。

吳恩達表示,Deep Speech捨棄傳統聲學模型,而使用GPU點到點的深度學習基礎模式,給Deep Speech提供大量的數據,然後讓它自行學習所有需要學習的東西,這種做法除了有效提高辨識的準確率,也大幅縮減了代碼庫的規模。

不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法

看更多!加入3C科技粉絲團
TOP