日前舉行的蘋果開發者大會上,SIRI智能音響與蘋果智能家居平臺Homekit深度融合帶來的語音交互方面的新體驗,成為業內關注的焦點。這也引發音響制造廠商、消費電子芯片商、聲學元件廠商、軟件平臺企業、家用服務機器人公司、平臺內容提供商等產業鏈上眾多公司近期集體有所動作。業內人士表示,歷經數十年發展,隨著技術不斷沉淀以及交互場景的不斷拓展,語音技術發展即將突破大規模商用節點,行業將進入爆發期。
新一代人機交互模式
“語音交互有望成為下一代人機交互的新模式。”美國最大的風險投資基金合伙人瑪麗·米克爾表示,語音是最有效的計算輸入形式。語音具有快速溝通、簡單方便、個性化且無需鍵盤等特點。隨著技術不斷成熟,語音交互時代即將到來。
事實上,語音交互技術已在逐步商用,如蘋果手機上的Siri等應用。業內人士表示,早期蘋果公司的Siri等語音助手,主要依賴腳本對話,對特定指令做出應答。但去年收購VocalIQ技術后,用戶以會話方式而非過去的提示性語音與設備交互。
亞馬遜的Echo音箱熱賣,是語音識別技術發展的一個重要標志。該款音響可以根據語音指令回答問題、創建購物清單、播放音樂,甚至能開關電燈。自2014年發布以來,該款音響累計銷量突破300萬臺,僅今年第一季度銷量就超過100萬臺。同時,第三方開發服務數量近千項,有望成為亞馬遜下一個10億美元的業務。
對語音識別技術興起的原因,業內分析師表示,智能手機在去年迎來爆發后,計算機行業需要一個新的觸發點。而傳統的交互方式難以全方位滿足用戶需求,以語音交互為基礎構成包括圖像、體感在內的第三代人機交互模式有望加速啟動。
國泰君安分析師認為,深度學習算法大幅提升語音識別正確率。在語音識別率方面,目前百度、谷歌等主流平臺在單詞語音識別準確率方面都超過了90%,科大訊飛、云知聲等智能語音識別企業的識別率達到96%以上。
百度首席科學家吳恩達表示,如果語音識別準確率從95%上升到99%,使用人數將大幅增加。搜索業務中,5年后至少50%為圖像搜索或者語音搜索。
目前語音識別已廣泛應用于智能手機。瑪麗·米克爾表示,2013-2015年,美國智能手機用戶使用語音助手的比例從30%上升到65%。谷歌2016年語音搜索量較2008年增加了35倍以上,較2010年增加7倍以上。百度語音從2014年第二季度起,語音輸入增加4倍以上,輸出增加26倍以上。
融合多種人工智能技術
智能語音技術包括識別和交互環節,融合了多種人工智能尖端技術。安信證券分析師認為,人機語音交互應用的關鍵是準確率與響應時間,語音識別技術日益成熟,即將突破量變到質變的臨界點。隨著語音識別技術和硬件發展,驅動語音交互滲透率迅速提升。
據了解,亞馬遜的Echo音箱最早只是一個有趣的實驗,目的是測試語音激活功能,并希望通過收集消費者的行為數據來制定可行的戰略方案,吸引消費者前往購物。而Echo音箱的銷售大大超出預期。目前蘋果、谷歌等已經發布類似產品。科大訊飛去年與京東成立合資公司,切入點是其新推出的叮咚智能音響。
隨著語音技術應用范圍不斷擴寬,并衍生出一系列對語音交互存在剛性需求的場景。如以可穿戴設備為代表的小型化、便攜式終端交互;遠距離、大屏幕終端交互,包括智能電視、智能家居、消費機器人等;汽車等不方便使用雙手場景中的人機交互。
應用需求推動技術進步。智能可穿戴設備屏幕一般不大,甚至沒有觸控屏幕,因此使用語音更加便于人機交互。如可穿戴設備的先驅谷歌眼鏡就搭載了智能語音系統。在網絡環境下,可以通過語音發送短信。隨著可穿戴設備滲透率不斷提升,語音交互應用領域將不斷拓寬。
在大屏領域的應用集中在智能電視,康佳、長虹、TCL、LG、樂視等均搭載語音交互功能,通過語音輸入可實現查收影視劇、聽歌、發送微博、開關電視等功能。在智能家居領域,搭載語音方案成標配。其中,蘋果發布的智能家居HomeKit采取與Siri協作的方式,用戶可以使用自然語句發出命令。隨著家用消費市場興起,語音技術將迎來更廣闊的市場。
汽車領域則是另一爭奪焦點。在駕駛汽車過程中,使用按鍵或觸控存在安全隱患,各大車廠在前裝控制系統中搭載了語音控制方案。
多路資本加快入場
隨著語音交互技術的發展,促使智能家居相關產品成為焦點,多路資本紛紛加入搶占市場。如谷歌已布局聲控操作智能家居入口系統,其語音助手基于人工智能和深度學習功能,可應用于多種硬件產品;聲控智能硬件產品GoogleHome有望成為智能家居的控制中樞。京東發布的叮咚智能音響平臺,為基于語音交互控制的智能家居產品,目標是打造家庭全數據服務分發平臺。
音響的普及帶動了音樂版權落地。安信證券分析師表示,全球進入數字音樂時代,智能音響滿足聲音的輸出要求。智能語音技術逐漸成熟,信息的輸入與輸出在智能音響上得到完美詮釋,聲學將是互聯網的新入口,基于聲音的商業模式將得以快速發展。
“預計智能音響行業有望成為新的互聯網和物聯網入口,互聯網廠商加速切入。”安信證券分析師表示,音樂支出占娛樂消費的18%,商業模式在數字時代正在變化,內容收費需要與硬件結合。智能音響更多的價值體現在家庭物聯網的整合控制和人工智能的實際載體。
硬件將成為入口,軟件平臺處于產業核心地位。“未來人工智能將像水和電一樣,融入人們的生活。”科大訊飛相關負責人表示,公司占據中文語音市場70%以上的份額。該公司針對人與人之間自由交流語音的正確率突破85%實用門檻,針對會議演講等場景達到95%以上的識別率;同時布局了圖像識別、大數據以及腦科學等領域。
版權及免責聲明:凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章,不代表本網觀點和立場。版權事宜請聯系:010-65363056。
延伸閱讀

版權所有:中國產業經濟信息網京ICP備11041399號-2京公網安備11010502003583