//Logo Image
「世大智科/天才家居」-我們創業囉
PDF Version
作者:徐業良(2017-02-13);推薦:徐業良(2017-02-13)
附註:本文發表於汽車購買指南雜誌,2017年三月號,史丹福專欄。

汽車語音控制系統大革新

今年CES中最火紅的名字就是「Alexa」,是由亞馬遜(Amazon)公司開發的智慧語音助理軟體,汽車、家電,Alexa幾乎無所不在。亞馬遜在CES中沒有租任何一個攤位,也沒有主辦產品發表會,但Alexa卻幾乎主宰了CES,成為了最大贏家。

今年CES在汽車電子方面的頭條新聞是,福特汽車公司宣布和亞馬遜公司合作,不久的將來福特車主可以在汽車內使用亞馬遜公司的Alexa語音控制助理。

很稀奇嗎?您說,語音控制不是早就有的技術了?!

上個月我換了新車之後,在車上撥打電話方便多了。坐進車內,手機直接藍牙和汽車連線,按下方向盤左側下方的語音輸入按鈕,語音提示嗶聲之後說一聲「媽媽」,便可以自動撥號給住在台中的媽媽,用免持聽筒的方式和媽媽講電話。整個過程雙手不必離開方向盤,眼睛視線也不必離開前方路面。

很稀奇嗎?您說,不是幾乎所有新車都有這樣的語音控制功能?!

的確,和CES中展示的語音控制技術比較起來,這好像是石器時代的語音控制技術。這裡可能要從語音控制技術發展的演進說起。

最早語音控制技術的例子就是前面提到汽車上語音控制撥打電話的方式,我得事先預錄好簡短的指令,像是「媽媽」;我按下語音輸入按鈕、說「媽媽」時,處理器接收聲波和事先預錄指令的聲波比對,找出符合的指令來執行。這種語音控制技術的處理器都是在近端面板上,計算能力和記憶容量都有限,只是作簡單聲波特徵的比對,並不真正理解我說話的涵義。如果我說「徐媽媽」,即使指的明明是同一個人,但汽車上的語音控制系統不會理解我的「語意」,找不到一模一樣的指令便回我一句,「系統無法辨識您的命令」。

即使這樣簡單的語音控制技術,已經讓我在車上撥打電話方便許多,但是如果要做更複雜一點兒的語音輸入,像是導航位置輸入之類的,就需要結合雲端技術了。

常和學生一起開車外出洽公,注意到現在二十來歲這一輩的駕駛人,似乎非常倚賴Google導航,即使從學校開車到高速公路口,也要看著Google指示的路線。有一次問一個學生,「在有Google導航功能之前你是怎麼開車的?」

學生回答也很直接,「我開始開車就有Google導航了!」

導航最麻煩的是要輸入導航目的地,Google導航目的地可以用語音輸入,您打開Google導航App,按著手機上輸入鍵盤的麥克風符號、連上雲端後,對著手機說出導航目的地,不管是簡單地說「元智大學」,或者是一長串詳細地址,系統都能夠自動辨識、找到目的地,而且正確率非常高,不用一面開車一面在觸控螢幕上打字。

噢,您早就知道了,您在Android手機上回覆FBLine、簡訊也都是用語音輸入的。

Google的語音輸入把接收到的聲波回傳至雲端,用雲端更快速的處理器和更大的資料庫做比對。您用電腦做Google搜尋時,只要用鍵盤敲進幾個字,Google搜尋常用的關鍵字便會自動被比對出來;Google的語音輸入基本上也是如此,例如您對手機說出「徐業良」,Google會正確顯示「徐業良」,而不會像我用的微軟注音輸入,每次都呆呆地顯示「徐夜涼」。

哦,您用的手機是iPhone,那麼您一定玩過Siri語音助理囉!蘋果公司在語音控制上開始時一直大幅領先,語音助理Siri2011起就是iPhone標準功能。除了辨識語音輸入之外,Siri對於「語意」的理解程度更高,很多宅男沒事喜歡和Siri「搭訕」,像是要求Siri「講笑話給我聽」,或者詢問Siri「生命的意義是甚麼」之類的無聊對話,Siri都能理解並且回覆資料庫中事先準備好的答案。

這種語音輸入的方式叫做「自然語言使用者介面(natural language user interface)」,意思就是語音輸入的方式和您平常說話的方式完全相同,像是「打電話給媽媽」,而且絕對不會因為沒有事先預錄指令而被回覆一句「系統無法辨識您的命令

當然Google不會落後給蘋果太久,2012年也將語音助理升級成為Google Now,也就是您的Android手機桌面上的那一行Google視窗。您點按麥克風之後,直接用「自然語言」問一些「今天天氣如何」、「最近的加油站在哪裡」、「開車到元智大學要多久」之類的問題,或者「請播放音樂」、「打電話給媽媽」之類的指令,Google Now也會在網路搜尋後以語音方式告知(例如「從您所在位置到元智大學車流順暢,目前所需時間7分鐘」),或是執行您的命令打電話給媽媽。

如果您還沒試過,趕緊試試看,直接要求Google Now「導航至元智大學」,所有導航設定便自動搞定,完全不需要操作手機。但是如果您問像是「講笑話給我聽」之類的冷問題,Google Now不會像Siri一樣做一些有趣的回答,只是冷冰冰地把搜尋到的結果呈現在螢幕上

微軟公司也有一個語音數位助理芳名Cortana,可以在Windows 10個人電腦或AndroidiOS手機上執行。對著電腦說「Hey Cortana」,就可以和Cortana對話聊天,和「Hey Siri」差不多(Google Now的啟動語音的關鍵詞是「Hey Google」,就挺沒有搭訕的感覺的)。Cortana也會說中文,中國官方名稱「小娜」(名字實在有夠俗),目前還沒引進台灣。

OK,有這麼多語音數位助理,蘋果的SiriGoogle Now、微軟的小娜,亞馬遜公司的Alexa為什麼還有爆紅的空間?

答案是「物聯網」。SiriGoogle NowCortana基本上假設是在有一個觸控螢幕的智慧型手機上使用,物聯網時代燈光、音響、門鎖、微波爐、電冰箱都要成為「智慧型裝置」,能夠接受、執行語音命令,但是這些裝置都沒有觸控式螢幕。

亞馬遜公司的Alexa簡單地說,就是一個不需要智慧型手機、觸控式螢幕的語音助理,是設計來運用在各種不同的裝置上,使用者操作只需要聲音就行了。如果您想打開客廳的燈,只要對著空氣說「Alexa,打開客廳的燈」,想聽新聞只要說「Alexa,播放新聞」就好。

Alexa是亞馬遜在2014年底發表的智慧語音助理軟體,剛推出時只是藍芽喇叭「Echo」裡頭的智慧助手,現在Echo累積銷量已經超過五百萬台。亞馬遜為Alexa建立了類似Google Play商店的機制,亞馬遜稱為「skills」,目前已經超過7,000種,使用者可以呼叫這些skills,執行朗讀食譜、健身教學、或者控制屋裡智慧裝置等等功能。

汽車其實是最需要語音控制的空間,您知道,駕駛人雙手要操作方向盤,雙眼要緊盯路面,腳要踩踏油門、煞車-只有嘴巴還閒著。而且駕駛人在汽車這個小小空間中所能進行的活動類型有限,駕駛這樣有安全性考量的活動當然不適合使用語音控制,其他活動就只有設定導航,聽聽音樂、新聞、天氣,查詢行事曆,接收、播打電話之類的。以智慧型手機為核心的語音助理,雖然還是可以和汽車連結,但不管如何還是需要操作手機,而福特汽車公司結合亞馬遜的Alexa,則有潛力把這一切功能內建在汽車上,成為完全不需要動手來操作的語音介面。當然除了汽車內設備的操作之外,福特也強調駕駛人坐在車內也能使用Alexa所有功能,像是「Hey Alexa,在Amazon訂購一束花送回家」。

蘋果公司的「物聯網」戰略一直都是以iPhone為中心,他們建立了HomeKit平台,可以允許人們用iPhone控制智慧燈泡、門鎖等裝置,也吸引了不少公司加入,但前提是必須使用iPhoneGoogle似乎意識到亞馬遜公司物聯網戰略的正確性,試圖急起追趕,20165Google升級了Google Now並且推出了GoogleAlexa11Google又推出了智慧揚聲器Google Home,也就是Google版的Echo

微軟則是聚焦在汽車市場,NissanBMW寶馬都宣布將與微軟合作,提供支援Cortana的汽車語音控制系統;其他車廠像是Mercedes Benz、通用汽車,也宣布要將其車內語音控制系統升級到聽得懂「自然語言」。

文章結尾,不免又想到這個老掉牙的梗,我們這種年紀的LKK才記得的「霹靂遊俠李麥克」,這部1982年拍攝的電視影集中,李麥克和這部叫做「夥計」的霹靂車部段使用自然語言聊天式的「溝通」。

2017年,汽車自然語言語音控制完全成為真實,您的愛車真的可以成為和您對話的「夥計」。