目前,車載用戶對智能車載的接受程度已是越來越高,而人機(jī)交互技術(shù)無疑能讓車載更加智能。來自相關(guān)調(diào)研機(jī)構(gòu)的數(shù)據(jù)顯示,在消費(fèi)者最感興趣、最實(shí)用的智能車載功能里面,語音交互已經(jīng)排到了第二位,僅次于被盜車輛定位之后。另外,在一些車載設(shè)備里,包括智能車機(jī)、智能后視鏡、行車記錄儀、HUB和車載音箱等產(chǎn)品里,人機(jī)語音交互已無處不在。

“實(shí)際上,在智能車載系統(tǒng)1.0到3.0的迭代更新過程中,人機(jī)語音交互的作用和重要性已經(jīng)越來越得到車主的認(rèn)可。”思必馳信息科技有限公司的副總裁雷雄國認(rèn)為,在車載領(lǐng)域,人機(jī)語音交互已成為車載設(shè)備的標(biāo)配。20160607-SIRI-1

語音交互需攻克三大難點(diǎn)

不過,值得注意的是,車載語音在應(yīng)用的過程中尚有一些難點(diǎn)需要去攻克。

雷雄國指出,首先是駕車環(huán)境下的噪音干擾。在駕車環(huán)境里,人與車載硬件的距離在0.3-1m以內(nèi)。在近場距離里,存在各種噪音干擾、聲音反射和混合,加大了機(jī)器對自然人聲的辨識難度。“能夠在車載的環(huán)境下,把噪聲問題解決掉是人機(jī)交互第一步的基礎(chǔ)。解決這個問題的方向包括:在出現(xiàn)錯誤時,允許糾正打斷;對一些車載噪聲以及環(huán)境噪聲的抑制自適應(yīng);車設(shè)備在播放音樂或聲音的時候,能夠隨時打斷它等。”他說。20160607-SIRI-2其次是智能交互。實(shí)際上,在交互的過程中,很多的語音控制依然要結(jié)合手動操作,這給用戶的體驗(yàn)非常不好。“全自然語言交互、完全解放雙手,是用戶的核心訴求,也是車載生態(tài)蓬勃的根本。” 雷雄國稱,這其實(shí)更多的包括人工智能的核心技術(shù)引進(jìn),包括跟車內(nèi)業(yè)務(wù)的整合,使得車內(nèi)的人機(jī)語音交互能達(dá)到更好的用戶體驗(yàn),這里面就包括對于語音的理解,以及人機(jī)多人的交互對話,基于任務(wù)式的深度的交互理解。20160607-SIRI-3三是更貼合用戶需求的產(chǎn)品設(shè)計。這包括ID設(shè)計;麥克、喇叭等硬件結(jié)構(gòu)布局;硬件的問題只會通過軟件體驗(yàn)的不足來體現(xiàn);用戶體驗(yàn)邏輯;語音交互與后端服務(wù)的結(jié)合,進(jìn)行系統(tǒng)優(yōu)化。“其實(shí)技術(shù)的發(fā)展達(dá)到一定階段后,需要上下游合作伙伴一起來針對車聯(lián)網(wǎng)產(chǎn)品進(jìn)行多方位、多層次的結(jié)合與設(shè)計。”他舉例稱,在車載語音交互里面比較重要的一塊是回聲消除,包括喚醒打斷,這實(shí)際上需要考慮麥克風(fēng)與喇叭的一些結(jié)構(gòu)設(shè)計,產(chǎn)品也需要在這一塊做些配合。再比如,語音技術(shù)怎樣與業(yè)務(wù)結(jié)合,怎樣與導(dǎo)航結(jié)合,怎樣把第三方的音樂資源對接得更加地緊密、無縫,這里面也需要投入大量的產(chǎn)品設(shè)計以及開發(fā),才能把用戶體驗(yàn)做到極致。20160607-SIRI-4“語音交互只是手段,不是目的。交互的目的,是為了讓機(jī)器更好地完成任務(wù)。因此,后端的第三方服務(wù)顯得更為重要。”雷雄國稱,在車載語音交互技術(shù)上,思必馳與上下游合作伙伴進(jìn)行了整合,把導(dǎo)航、電臺、個人社交、周邊搜索、音樂等與車主相關(guān)的第三方服務(wù)整合在一起。他直言,打造一個在車的環(huán)境下能夠?qū)崿F(xiàn)全程真正解放雙手的交互模式,這是非常重要的。

多模態(tài)交互是發(fā)展方向

“從交互的角度來看,語音僅僅是占人機(jī)交互其中的一個環(huán)節(jié),在接下來的車載智能化的過程中,我們希望看到更多交互技術(shù)與語音結(jié)合在一塊的,包括體感、手勢、圖象等一系列的人工智能的技術(shù)能夠迅速進(jìn)入到車內(nèi),即多模態(tài)交互。”雷雄國如是說。20160607-SIRI-5思必馳是國內(nèi)一家專注于智能硬件領(lǐng)域的語音公司,主要面向智能硬件三個垂直領(lǐng)域:智能車載、智能家居和智能機(jī)器人,提供自然語言交互解決方案。其中,車載在思必馳整體的業(yè)務(wù)中所占比重最大 ,其次是家居。思必馳市場總監(jiān)龍夢竹在接受國際電子商情采訪時表示,思必馳在智能車載領(lǐng)域側(cè)重于后裝市場,這部分的市場份額大概占40%的比例。從具體的應(yīng)用市場來看,在智能后視鏡市場估計占60%左右的市場份額。龍夢竹還透露,在車載前裝市場,思必馳目前已進(jìn)入前裝車廠的測試階段,合作的互聯(lián)網(wǎng)汽車包括小鵬、智車優(yōu)行等。

目前,思必馳能提供的語音技術(shù)包括語音識別、語音合成、語音識別++、語義理解和智能對話等。雷雄國稱,當(dāng)前語義理解和智能對話已慢慢在研究使用階段,未來多模態(tài)的交互是很重要的一個方向,如語音與手勢、圖象識別等第三方的交互融合。另外一個方向就是與核心技術(shù)往云端移植,因?yàn)楝F(xiàn)在大部分的技術(shù)在云端,IoT發(fā)展起來之后,很多端上面會有云交互的需求,因此整個核心技術(shù)往端上移植也是一個大的方向。而人工智能是最重要的,人工智能與大數(shù)據(jù)融合,對大數(shù)據(jù)進(jìn)行分析,這也是未來人工智能與語音的發(fā)展方向。

雷雄國透露,思必馳的研發(fā)方向與核心就在于人工智能。在多模態(tài)交互方面,思必馳也在與第三方合作推動。“我們做過手勢識別、圖象識別、虹膜識別、體感識別等與語音技術(shù)結(jié)合的多模態(tài)交互。”雷雄國稱,未來一定是從單一的輸入輸出互動形式向多模態(tài)交互發(fā)展,從被動服務(wù)向主動式服務(wù)及智能服務(wù)方向發(fā)展。