天聰智能—AI語音安全專家，聲紋識別行業標準制定者

語音大數據：即將到來的網絡數據浪潮

日期：：2013-12-20 來源：

　　語音操控與大數據這兩個2012年互聯網產業的熱點，很少被聯系在一起。目前所說的大數據多是指網絡上文字信息儲存、清洗、分析與利用，重點在于對人類行為特點的把握。語音操控則指Siri類依靠機器語音識別的人機互動，用于新型網絡服務與改善用戶交互體驗，還沒有將聲音作為一種數據資源加以利用。

　　眾多產品中的語音應用興起告訴我們：語音數據的浪潮即將襲來。英國“竊聽門”與美國“棱鏡門”都在提醒人們聲音數據的重要。

　　語音數據為何會興起？首先，語音交流是最本能的溝通方式，傳播技術的發展是要便捷人類溝通，將會趨于人類最自然的交流形式——語音傳播。互聯網語音識別技術及語音傳播應用的增加正符合了這一趨勢，記錄語音的數據將大量增加。

　　語音數據有很多其他類型數據無法比擬的優勢，如準確、快速完成身份識別。聲紋如同指紋，每個人都不相同，國內已有幾家科技公司在從事聲紋識別（speaker recognition或voiceprint recognition）技術開發，依靠聲音波紋，輕松地在數十億人中鎖定一個人。如此一來，網絡身份可以不再依賴IP地址或移動設備編號來確定。

　　此外，語音數據包含更多“無意識”信息，更符合大數據特點——無意間流露，有意識分析。個人說話的語調、語速、音量、換氣頻率等都可以轉化為反映個人區域、心理、健康的數據。2013年，瑞士聯邦理工學院視聽通訊實驗室(LCAV)依靠聲音數據已能構建出簡單的空間凸起的三維地圖[1]。同時，語音數據相對于文字數據更為準確反映意義。如網上流行的段子“冬天：能穿多少穿多少；夏天：能穿多少穿多少”。同樣的文字，語音更能明確表達意圖。

　　最后，語音識別技術已經基本成熟，可以較為準確地轉換為文字，使語音信息具備了文字信息的潛質，通過這一處理，所有基于文字的數據處理方法都可以用來分析轉換過的語音信息。

資料參考：http://yjy.people.com.cn/n/2013/0813/c245082-22549844.html

上一篇：“Ok Google”Chrome瀏覽器中的語音識別下一篇：智能語音：觸發“生活大爆炸”