智能汽車包括,車聯(lián)網(wǎng)、車內(nèi)及車際通訊、智能交通基礎(chǔ)設(shè)施等要素,融合了傳感器、雷達(dá)、GPS定位人工智能等技術(shù),使汽車具備感知環(huán)境的能力,這樣汽車就能夠自己判斷當(dāng)前環(huán)境下汽車處于安全還是危險(xiǎn)等狀態(tài)。通過這種感知,汽車就會(huì)自動(dòng)規(guī)劃路線,無人駕駛到達(dá)目的地。同時(shí),車內(nèi)所有的操控都是智能化進(jìn)行,解放雙手。
最有可能落地的智能--語音識(shí)別控制 智能汽車作為一個(gè)集環(huán)境感知、規(guī)劃決策、多等級輔助駕駛等功能于一體的綜合系統(tǒng),已經(jīng)被各國列為汽車發(fā)展的重點(diǎn)。而相比于市場上被炒的大紅大紫的自動(dòng)駕駛技術(shù)而言,語音識(shí)別控制技術(shù)便顯得不那么火熱了,但語音識(shí)別控制技術(shù)對智能汽車的發(fā)展是至關(guān)重要的。 無人駕駛的核心:語音識(shí)別控制技術(shù)面臨的障礙 實(shí)現(xiàn)真正的智能有一個(gè)前提,那就是人機(jī)交流。智能汽車的標(biāo)志就是解放雙手,也就是說不用雙手去操控方向盤、功能按鈕等,那么怎樣讓汽車能夠正確領(lǐng)會(huì)你的意圖?讓它真正做到“隨心所欲”?拋開腦電波這類離量產(chǎn)遙遙無期的技術(shù)外,車載語音實(shí)現(xiàn)人機(jī)交流目前是最有可能落地的。你只需動(dòng)動(dòng)嘴,便可以操控整個(gè)汽車的所有功能,這就是語音識(shí)別所能達(dá)到的地步。 語音識(shí)別正在被重塑,成為人機(jī)交互的新范式,在過去75年里,每10年就有一次人機(jī)交互的重大革新,人類對機(jī)器的操作,從物理手柄按鍵,到物理鍵盤鼠標(biāo),再到觸摸屏,而這些變革無疑也會(huì)帶來我們對汽車新的控制模式,而目前語音識(shí)別人工在大數(shù)據(jù)的訓(xùn)練和學(xué)習(xí)下,已經(jīng)可以到達(dá)90%的識(shí)別成功率,完全能部分替代人工。國內(nèi)語音識(shí)別技術(shù)發(fā)展如火如荼 目前國內(nèi)語音識(shí)別廠商遍地開花,如科大訊飛、思必馳、云知聲等專注語音領(lǐng)域的,搜狗、百度這類互聯(lián)網(wǎng)公司,甚至做智能硬件的小米也在發(fā)展自己的語音識(shí)別技術(shù)。拿科大訊飛來說,自從科大訊飛的訊飛語音輸入法面世以來,其詞庫和識(shí)別率不斷提升,而后推出的靈犀語音助手的識(shí)別率已經(jīng)可以達(dá)到97%的準(zhǔn)確率,也有不少基于科大訊飛SDK開發(fā)的智能語音機(jī)器人。但是在目前的商業(yè)模式和市場環(huán)境下,像科大訊飛這樣靠提供技術(shù)解決方案的方式實(shí)現(xiàn)商業(yè)價(jià)值的企業(yè),在國內(nèi)并沒有那么好的市場前景。對于提供這些技術(shù)解決方案的公司,需要下沉到某一個(gè)垂直產(chǎn)業(yè),做更上游的事情,才能更好的實(shí)現(xiàn)商業(yè)價(jià)值。所以就出現(xiàn)了各類跨領(lǐng)域的合作,如廣汽傳祺GS8,其搭載的語音識(shí)別控制技術(shù)就是和科大訊飛共同開發(fā)的。 無人駕駛的核心:語音識(shí)別控制技術(shù)面臨的障礙 傳祺GS8可以通過語音控制完成地圖導(dǎo)航、空調(diào)控制、車窗升降、調(diào)整座椅、雨刮器啟動(dòng)等多項(xiàng)功能的操作,甚至可以通過說話啟動(dòng)和熄滅發(fā)動(dòng)機(jī)。雖然只是一些普通的控制操作,但已經(jīng)有智能化的影子了。語音識(shí)別控制技術(shù)面臨的障礙 雖然語音識(shí)別控制技術(shù)已經(jīng)發(fā)展可以應(yīng)用到汽車上了,但也只能操控簡單的功能。目前語音識(shí)別技術(shù)還有許多需要解決的障礙。 一:使用場景有限。觸覺的人機(jī)交互可以隨時(shí)隨地進(jìn)行,但是語音識(shí)別目前在嘈雜的地方卻不行,特別是背景音存在其他人的聲音的時(shí)候,也是無法分辨。比較可喜的是,語音識(shí)別目前已經(jīng)能夠記憶用戶的聲線,未來要做的就是怎樣讓系統(tǒng)能夠在嘈雜的背景下識(shí)別特定的聲音曲線。 無人駕駛的核心:語音識(shí)別控制技術(shù)面臨的障礙 二:中文識(shí)別技術(shù)難度高。中文博大精深,不像單詞一樣有特定的含義,不同的語境,不同的口氣,說出來的同一個(gè)詞,可能并不是一個(gè)意思。并且中文的多音字也繁多,更別說幾十種各地的方言。當(dāng)然國內(nèi)領(lǐng)先的語音識(shí)別公司已經(jīng)可以破譯粵語、上海話、四川話等十幾種方言,但還遠(yuǎn)遠(yuǎn)達(dá)不到顧及所有詞語含義的地步。 三:交互模式不成熟。目前市面上搭載的車載語音需要“你好,xx”“嘿,xx”的特定詞匯喚醒,需要一定的反應(yīng)交互時(shí)間,并不能像觸覺控制那樣立即反饋,并且大部分交互的回答語音比較生硬,冷漠,沒有情感變化。 四:誤操作幾率大。即便語音識(shí)別的準(zhǔn)確率國內(nèi)已經(jīng)可以做到最高97%,但實(shí)際使用中還是會(huì)產(chǎn)生誤操作或者無法識(shí)別,并且汽車控制不像手機(jī)操作,手機(jī)誤操作還可以返回,但汽車作為高速行駛的產(chǎn)品,一旦發(fā)生誤操作,嚴(yán)重時(shí)會(huì)影響安全。 總結(jié):語音識(shí)別控制技術(shù)對于智能汽車有著不可或缺的重要性,一但語音識(shí)別技術(shù)可以達(dá)到精準(zhǔn)無誤的地步,智能汽車便會(huì)迎來高速發(fā)展的時(shí)期,距量產(chǎn)也就不遠(yuǎn)了。我們也期待著這一天。
掃一掃在手機(jī)上閱讀本文章