近年來人工智能的火爆帶動了不少產業騰飛,而語音系統作為未來人工智能產業鏈上的一個重要節點,在這片熱潮之中獲得了快速發展。日前,訊飛輸入法Android新版全面升級智能語音輸入,中文語音識別率先突破98%。新版的訊飛輸入法構建自然語言理解的優化模型,讓語音系統不僅僅只是“聽話”,更能做到“聽懂”的效果。而從現實來看,語音交互已成為下一個互聯網入口。
巨頭搶灘智能語音市場
智能系統走進人們的日常生活,智能語音則是人機交互的主要途徑之一。智能語音系統是基于語音輸入的基礎上,通過人聲就可以得到反饋效果。訊飛輸入法不僅中文語音識別率達到了98%,還突破1分鐘語音輸入400字的極限。
新版訊飛開啟方言模式,支持多達21種方言,對特殊詞匯和語法均有很好的支持。全新升級隨聲譯,實時提供中文與英、日、韓互譯,提供個性化的輸入體驗,結合LSTM的語音識別,優化輸入法的智能聯想,使該模型下的個人語音識別結果越用越準確。
國內外科技巨頭在人工智能語音市場爭奪上毫不相讓。國內市場上,百度AI在其開發者大會上發布了DuerOS對話式人工智能系統,搭載DuerOS的設備可讓用戶以自然語言對話的方式進行人機交互;阿里巴巴發布了首款人工智能音箱產品天貓精靈 X1,這款音箱內置智能語音助手AliGenie,能夠聽懂中文普通話語音指令,并實現智能家居控制、語音購物、手機充值、音樂播放等功能。
在國外,亞馬遜、谷歌、蘋果、微軟都已經投入巨大的人力來推動這個時代的變革。從亞馬遜的Echo到谷歌Google home以及蘋果公司的HomePod,似乎每家國外巨頭公司都參與了進來。
為何競相爭奪用戶語音數據?
眾科技巨頭都在搶灘語音識別技術,語音技術到底有何價值?
首先是為了卡位物聯網。語音輸入可以做到精準識別,應對多種語言,更加靈活多變。真正的語音助手應是無處不在,連接萬物,無論是音箱還是家電、汽車,都應以語音交互為核心。智能語音站在用戶“懶”的立場上,利用AI技術增加互動速度和效率。目前巨頭們正逐步搭建智能家居生態體系,搶占市場份額。
其次,智能語音市場前景廣闊。市場研究公司Tractica估計,到2021年將有4000萬家庭使用基于語音的數字助手。調研機構Strategy Analytics指出,2016年全球智能音箱出貨量為590萬臺,預計到2022年將增長10倍,市場規模達到55億美元。
最后,智能語音市場用途廣闊。語音設備的快速擴展足以促使第三方技能和應用的生態系統加快形成,有助于引導用戶消費需求,從而實現增值收入。以亞馬遜為例,亞馬遜在2014年推出Echo后,就宣布將Alexa系統開放給第三方,不但包括智能家居軟件的開發人,也包括智能家居硬件制造商。如今,Alexa已經成為許多智能硬件產品的標配,開拓了全新的操作系統,為亞馬遜進入移動互聯網市場開辟了新入口。Alexa對亞馬遜的財務支持將體現在三個方面:設備銷售收入、增值語音推動購物收入和平臺收入。
何時真正進化到AI陣營?
實現人機間自由的語音交互成為未來AI的發展趨勢。一項新技術投入市場伴隨著一些興奮點,但也會存在一定的改善空間。
首先,智能語音市場需要針對特定的人群,特定的場景做適當的改變。目前來看人機交互在實時性、準確性等方面還需提高。以機器人為例,機器人從“聽見”到理解語音,從而應對復雜應用場景仍困難重重,智能語音這塊要突破,第一還需要巨大的數據、好的算法,根據用戶的需求落實到具體的產品上,甚至可能牽涉到現在計算機的結構,以迎合市場的訴求。
其次,語音輸入的內容會涉及各種各樣專業的知識,智能語音系統在了解人類語言表面意思的基礎上,更進一步識別其深層含義,所以智能語音系統的知識圖譜也是很大的挑戰,對輸入輸出、編碼譯碼都要做很高的要求,才能讓人機交互達到一個爆發點。
此外,要在市場中長久存活,就必須發展用戶量,許多用戶只對一些經常使用的軟件或應用有了解,智能語音系統應該引導用戶發現并使用更多的人工智能,讓智能語音更加的市場化和智能化。將智能語音系統運用于生活中,意味著的是語音交互功能帶來的互聯網服務的一場大變革。
轉自:全景網