//Logo Image
作者:巫佳哲(2009-07-17);推薦:徐業良(2009-07-17)

語音控制輪椅文獻探討

電動輪椅通常利用搖桿來控制其移動,為了讓使用者能夠更簡單、直覺地操控電動輪椅,許多研究嘗試發展語音控制(voice control)技術來控制電動輪椅。本文首先對語音辨識技術與工具作一簡介,接下來探討語音控制輪椅相關文獻。

1.     語音辨識技術簡介

語音辨識(Speech Recognition)簡單的說,就是一種希望電腦能夠聽得懂人類說話技術。語音辨識基本流程如圖1,透過麥克風等輸入裝置,將聲音的類比訊號轉換為數位訊號並傳送給電腦,電腦擷取聲音的特徵,並搜尋已建立好的聲音樣本資料庫來進行比對,找出最相近的聲音樣本。

1. 語音辨識基本流程

語音辨識基本流程中比較困難的部分是語音特徵比對。目前常用的語音特徵比對方法有以下二種:

(1)   動態時間軸校準(Dyanmic Time Warping, DTW)

DTW計算兩個長度不同的語音之間的相似程度,解決了同一語音但發音時間長短不同的問題,是語音辨識中出現較早、較為經典的一種演算法,在1960年代便開始發展。DTW做語音辨認仍有許多限制,在待辨認語音是連續語音、非特性語者或待辨認詞彙數加大時,語音辨認系統的複雜度會大幅提高。

(2)   隱藏式馬可夫模型(Hidden Markov Model, HMM)

1960-70年代在CMUIBM兩個研究單位都提出了隱藏的馬可夫模型方法,利用一個隱藏的馬可夫鍊(Markov chain)來模擬人類語音信號特性隨時間改變的特性,在馬可夫鍊中落入每一個狀態的音框將具有相同的統計特性(或語音信號具有相同特性)。HMM語音辨認器中比較困難的問題是如何由一些訓練語料中求取辨認模型中的參數。

語音辨識發展至今已有許多應用,例如電腦的語音輸入軟體(微軟語音輸入法等)、手機的語音撥號功能、GPS導航系統、甚至汽車音響等的操作等,都可以發現語音控制功能。目前市面上有許多語音辨識的軟體,如IBM ViaVoice語音辨識軟體、蒙恬聽寫王、SpeakQMicrosoft speech等。大多數的語音辨識軟體只支援語音轉文字等文字輸入法功能。若是需要自行開發的話,必須選擇提供開發工具(SDK)的軟體,如Microsoft speech等。

Microsoft speech SDK是一套微軟視窗系統的開發工具,可以用來在微軟視窗作業系統下建立一套語音控制系統,若是未來輪椅上的人機介面選擇以微軟視窗系統(Windons VistaWindons XPWindons CE...etc)為系統作業軟體的話,就可以透過Microsoft speech SDK來開發輪椅的操作介面。

除了透過軟體來架構語音控制系統,也可以利用語音辨識晶片來達成。語音辨識晶片也是利用與軟體相同的辨識原理,首先晶片必須經過語音訓練,之後當有語音輸入後,晶片會自動判斷比對並且輸出結果。目前市面上有許多語音辨識晶片,表1列出了幾個語音辨識晶片與其規格。

1. 語音辨識晶片

型號

簡介

HM2007系列(HMC)

CMOS晶片,外接64Kbyte SRAM,支援最多40組字

RSC-3x系列(Sensory)
http://www.sensoryinc.com/

8位元組理器,支援Sensory Speech™ 6技術

RSC-4x系列(Sensory)

8位元組理器,支援FluentChip™技術

2.     語音控制輪椅文獻探討

語音控制功能應用在輪椅方面,主要應用對象是針對行動不便但是還擁有正常說話能力的高齡者或病患。早在1970年代末期,Rehabilitation Medicine in New York就將輪椅上加入了利用語音來控制環境的功能[Youdin, et al., 1980],環境控制的項目包含了電話、電風扇、收音機和對講機等家電,讓行動不便了人能夠更方便地操控家中的家電,提升獨立自主的能力[Manasse, 1999],但此時尚未將移動控制加入在語音控制系統中。1980年代語音控制輪椅開始出現,如圖2Mr. Kotz和他的語音控制電動輪椅,從1982年使用到1996年,伴隨他走過超過4000公里

wheelchair user

2. Mr. Robert Kotz和他的電動輪椅[http://www.katalavox.com/wheelch1.htm]

ClarkRoemer [1977]研究指出,語音控制系統應用在設計輪椅時必須考慮低耗電、尺寸、重量、以及和輪椅其他控制方式的協調等,研究重點則在提高語音辨識率和降低環境噪音對語音控制系統的影響。

SimpsonLevine [2002]研究指出,語音控制電動輪椅尚不能商品化主要問題是很難僅利用聲音來頻繁地控制輪椅速度,仍須和輪椅其他控制方式結合,例如結合導航系統,且在導航的路徑上利用感應器來躲避障礙物。

PiresNunes[2002]發表一款採用語音控制的半自動導航輪椅,當遇到障礙物時,系統會避免自動閃避障指令與使用者語音指令混淆,實驗結果證實系統可以有效的幫助操作者。

Ha Q. P.Tran T. H.Dissanayake G. [2005]指出語音控制系統很早就被認為是一個可幫助輪椅使用者的技術,但是主要困難是語音辨識系統如何辨別出特定使用者的聲音,使語音控制系統不受其他人聲影響。他們提出一個以“continuous wavelet transform phase”為基礎的新方法來檢查聲音的pitch,實驗結果可以成功辨識出男聲與女聲。

SukKojima[2007]也提出環境噪音干擾的問題,當有非語音的輸入,例如咳嗽、呼吸或機械噪音等,語音控制系統必須拒絕輸入,使用者在實際環境中才能利用語音安全操作電動輪椅。他們的研究也提出一些方法辨識發音不清晰的語音與非語音的輸入。

最近在2008年美國麻省理工學院(Massachusetts Institute of Technology) Age Lab的研究人員,也製作出一種新型輪椅(如圖3),是利用語音控制方式來進行控制,並且搭載了GPS定位系統,可以自行定位導航。

3. MIT的新式語音控制輪椅(新聞照片)

3.     結論

語言對人類來說是最簡單的表達方式,所以早在1970年代開始就有人將語音控制系統加入到輪椅上,提供使用者最簡單且最直覺的操作方式。探討語音控制輪椅相關研究文獻,可以得到下列幾點結論:

(1)   目前語音辨識系統已經趨近成熟,相關的產品、工具已有廣泛應用。以語音控制方式控制輪椅移動,必須提高語音辨識的成功率,並且能辨別出特定使用者的聲音,此外也要降低環境噪音對系統的影響,減少系統誤判的機率。

(2)   單以語音控制方式控制輪椅,可能會衍生出一些方便性甚至安全性的問題,例如無法以聲音頻繁地控制輪椅細微移動等,設計上應思考和其他控制方式結合,如閃避障礙物系統、導航系統等。

4.     References

Clark, J. A., Roemer, R.B., “Voice controlled wheelchair,” Archives Of Physical Medicine And Rehabilitation., v. 58. n. 4, pp. 75-169, 1977.

Ha, Q. P., Tran, T. H., Dissanayake, G., “A Wavelet and Neural Network-based voice interface system for wheelchair control,” International Journal of Intelligent Systems Technologies and Applications., v. 1, n. 1-2, pp. 49-56, 2005.

Pires, G., Nunes, U. “A wheelchair steered through voice commands and assisted by a reactive fuzzy-logic controller,” JOURNAL OF INTELLIGENT & ROBOTIC SYSTEMS., v. 34, n. 3, pp. 301-314, 2002.

Simpson, R. C., Levine, S. P., “Voice control of a powered wheelchair,” IEEE TRANSACTIONS ON NEURAL SYSTEMS AND REHABILITATION ENGINEERING., v. 10, Iss. 2, pp. 122-125, 2002.

Suk, S., Kojima, H., “Voice-activated powered wheelchair for severely disabled persons,” IEICE ELECTRONICS EXPRESS, v. 4, n. 18, pp. 569-574, 2007.