【中國安防展覽網(wǎng) 企業(yè)關(guān)注】通過利用機(jī)器學(xué)習(xí)技術(shù)進(jìn)行自然語言的的深度理解,一直是工業(yè)和學(xué)術(shù)界關(guān)注的焦點(diǎn)。在人工智能的各項(xiàng)領(lǐng)域中,自然語言處理是最為成熟的技術(shù),由此引來各大企業(yè)紛紛進(jìn)軍布局。在未來3年內(nèi),成熟化的語音產(chǎn)品將通過云平臺和智能硬件平臺快速實(shí)現(xiàn)商業(yè)化部署,前景十分廣闊。
目前,語音交互賽道已匯集了互聯(lián)網(wǎng)巨頭、知名硬件企業(yè)、電商平臺、傳統(tǒng)家電廠商以及各類人工智能初創(chuàng)公司,特別是近幾年以智能音箱為代表的語音交互產(chǎn)品在國內(nèi)外的火爆,極大地激發(fā)了語音交互技術(shù)的應(yīng)用和發(fā)展。
語音識別應(yīng)用領(lǐng)域不斷擴(kuò)展
在汽車及互聯(lián)網(wǎng)領(lǐng)域,語音交互功能已經(jīng)很普及。福特的SYNC系統(tǒng)專為手機(jī)和數(shù)字媒體播放器配備的福特車載多媒體通信娛樂系統(tǒng),是目前車載系統(tǒng)中采用語音交互技術(shù)的成功的案例,已經(jīng)廣泛應(yīng)用在福特多個(gè)系列汽車中。互聯(lián)網(wǎng)巨頭蘋果在其iPhone 4S中推出智能語音助理應(yīng)用Siri后,Google公司也在其安卓智能手機(jī)操作系統(tǒng)中推出了GoogleNow智能語音搜索及問答服務(wù),微軟公司也將語音技術(shù)應(yīng)用于WindowsPhone。
在智能家居領(lǐng)域,不管是智能家電還是機(jī)器人,語音識別技術(shù)都是必備的基本功能之一。在控制方式上,除了部分智能家電之外,語音控制已經(jīng)成為了市場的主流,而這就是語音識別市場的商機(jī)。未來,作為人機(jī)自然交互的前提之一,語音識別必然是智能家居的發(fā)展趨勢,只有語音識別的準(zhǔn)確率接近完美,人機(jī)的自然交互才能繼續(xù)開展。在智能家居市場的推動下,語音識別技術(shù)必將成為重點(diǎn)發(fā)展對象。
此外,在新零售領(lǐng)域,智能語音技術(shù)的應(yīng)用也在不斷擴(kuò)展。比如2017年12月18日,科大訊飛和紅星美凱龍發(fā)布戰(zhàn)略合作計(jì)劃,未來由科大訊飛研發(fā)的智能導(dǎo)購機(jī)器人“美美”將在全國紅星美凱龍門店上市。
時(shí)至今日,資本的涌入、政策的扶持、市場的一再擴(kuò)容,使得語音技術(shù)日益成熟,全球語音市場也迎來了一個(gè)應(yīng)用落地的黃金發(fā)展期。根據(jù)相關(guān)統(tǒng)計(jì)數(shù)據(jù)顯示,2016年智能語音產(chǎn)業(yè)規(guī)模直逼60億元大關(guān),2017年將破百億,同比增長69%左右。
語音識別技術(shù)突破總是艱難而緩慢
盡管技術(shù)趨向成熟,但在實(shí)際應(yīng)用中語音識別技術(shù)仍存在著這樣那樣的問題,這些短板時(shí)刻阻礙著語音技術(shù)的進(jìn)一步發(fā)展與落地。在實(shí)際應(yīng)用中,識別率主要受到以下幾個(gè)因素的影響:
對于漢語語音識別,方言或口音會降低識別率;
背景噪聲。公共場所的強(qiáng)噪聲對識別效果影響甚大,即使是在實(shí)驗(yàn)室環(huán)境下,敲擊鍵盤、移動麥克風(fēng)都會成為背景噪聲;
“口語”問題。它既涉及到自然語言理解,又與聲學(xué)有關(guān)。語音識別技術(shù)的最終目的是要讓用戶在“人機(jī)對話”時(shí),能夠像進(jìn)行“人與人對話”一樣自然,而一旦用戶以跟人交談的方式進(jìn)行語音輸入時(shí),口語的語法不規(guī)范和語序不正常的特點(diǎn)會給語義的分析和理解帶來困難。
此外,識別率還與說話人的性別、說話時(shí)間長短等有關(guān)。
科技巨頭重磅加碼
在國際巨頭紛紛布局智能語音市場時(shí),中國制造企業(yè)也正在蠢蠢欲動。中國企業(yè)擁有完善的硬件產(chǎn)業(yè)鏈,而這些行業(yè)智慧化升級的訴求愈發(fā)強(qiáng)烈。以科大訊飛、BAT為首的互聯(lián)網(wǎng)巨頭都蓄謀已久,瞄準(zhǔn)這個(gè)風(fēng)口,加速布局智能開放平臺,提升產(chǎn)品的競爭力。
2017年,百度AI開發(fā)者大會上,百度發(fā)布DuerOS對話式人工智能系統(tǒng),搭載DuerOS的設(shè)備可讓用戶以自然語言對話的方式進(jìn)行人機(jī)交互;同天下午,阿里人工智能實(shí)驗(yàn)室召開了新品發(fā)布會,發(fā)布第一款智能音箱產(chǎn)品天貓精靈 X1,這款音箱內(nèi)置智能語音助手AliGenie,能夠聽懂中文普通話語音指令,并實(shí)現(xiàn)智能家居控制、語音購物、手機(jī)充值、音樂播放等功能。
2018年5月3日,從阿里巴巴獲悉,由于阿里對北京先聲互聯(lián)科技有限公司(以下簡稱“先聲互聯(lián)”)的全資收購,先聲互聯(lián)創(chuàng)始人、中科院聲學(xué)所前研究員付強(qiáng)博士,近日入職阿里達(dá)摩院機(jī)器智能技術(shù)實(shí)驗(yàn)室,負(fù)責(zé)語音交互前端處理技術(shù)和方案的研發(fā)。
結(jié)語
毫無疑問,語音智能應(yīng)用正在飛速發(fā)展。在過去的一年里有了極大的發(fā)展,從算法到模型都有了質(zhì)的變化,在加上語音領(lǐng)域(語音合成等)的其他研究,語音技術(shù)陸續(xù)進(jìn)入工業(yè)、家庭機(jī)器人、通信、車載導(dǎo)航等各個(gè)領(lǐng)域中。當(dāng)有一天,機(jī)器能夠真正“理解”人類語言,并作出回應(yīng),那時(shí)我們必將迎來一個(gè)嶄新的時(shí)代。
(本文據(jù)千家網(wǎng)、中國科學(xué)院網(wǎng)站、csdn、OFweek智能家居網(wǎng)、慧聰安防網(wǎng)、中國智能制造網(wǎng)、大數(shù)據(jù)文摘、機(jī)器之心信息轉(zhuǎn)載,中國安防展覽網(wǎng)整理)