語音操控與大數據這兩個2012年互聯網產業的熱點,很少被聯系在一起。目前所說的大數據多是指網絡上文字信息儲存、清洗、分析與利用,重點在于對人類行為特點的把握。語音操控則指Siri類依靠機器語音識別的人機互動,用于新型網絡服務與改善用戶交互體驗,還沒有將聲音作為一種數據資源加以利用。
眾多產品中的語音應用興起告訴我們:語音數據的浪潮即將襲來。 英國“竊聽門”與美國“棱鏡門”都在提醒人們聲音數據的重要。
語音數據為何會興起?首先,語音交流是最本能的溝通方式,傳播技術的發展是要便捷人類溝通,將會趨于人類最自然的交流形式——語音傳播。互聯網語音識別技術及語音傳播應用的增加正符合了這一趨勢,記錄語音的數據將大量增加。
語音數據有很多其他類型數據無法比擬的優勢,如準確、快速完成身份識別。聲紋如同指紋,每個人都不相同,國內已有幾家科技公司在從事聲紋識別(speaker recognition或voiceprint recognition)技術開發,依靠聲音波紋,輕松地在數十億人中鎖定一個人。如此一來,網絡身份可以不再依賴IP地址或移動設備編號來確定。
此外,語音數據包含更多“無意識”信息,更符合大數據特點——無意間流露,有意識分析。個人說話的語調、語速、音量、換氣頻率等都可以轉化為反映個人區域、心理、健康的數據。2013年,瑞士聯邦理工學院視聽通訊實驗室(LCAV)依靠聲音數據已能構建出簡單的空間凸起的三維地圖[1]。同時,語音數據相對于文字數據更為準確反映意義。如網上流行的段子“冬天:能穿多少穿多少;夏天:能穿多少穿多少”。同樣的文字,語音更能明確表達意圖。
最后,語音識別技術已經基本成熟,可以較為準確地轉換為文字,使語音信息具備了文字信息的潛質,通過這一處理,所有基于文字的數據處理方法都可以用來分析轉換過的語音信息。
資料參考:http://yjy.people.com.cn/n/2013/0813/c245082-22549844.html