//Logo Image
作者:邱智煇(2009-07-10);推薦:徐業良(2009-07-11)

RSC-300建立智慧型機器人輪椅語音控制模組基本指令

過去的數十年來,對於具有獨立行為能力機器人架構的研究一直都沒有間斷其中如何與機器人交談,一直是研發的重點。近年來隨著號處理技術的進步,語音辨識的應用已日趨成熟,利用語音聲控與機器溝通也不再是遙不可及目標了。

語音辨識技術數十年前便已經有相關的研究報告出現,AT&T Bell實驗室約於50年代,便開發出第一個可以辨識多個英文字母的語音辨識系統。60年代在計算機的輔助下更加速推動了語音辨識的發展,這個時期的重要成果是提出了動態規劃和線性預測分析技術,其中後者解决了語音號產生模型的問題,對語音辨識的發展產生了深遠的影響。近年來語音處理及辨識的技術更是飛快的進步,無論是針對特定人士的語音辨識技術亦或適合大眾使用的語音辨識模型,取得了相當的技術突破,同時進一步結合人工神經網路等理論應用,成功將語音辨識技術推向一個新的紀元。

本計劃中智慧型機器人輪椅,強調其機器人的特徵,能夠自主判斷、與使用者對答、配合使用者意願,進而以互動性協同控制機制共同完成輪椅的作動。本文利用用RSC-300的語音辨識晶片為核心,利用其專人專用的高辨識率,嘗試建立智慧型機器人輪椅語音控制模組基本指令。

1.     VCM語音辨識模組介紹

本計劃中所使用的語音辨識模組(Voice Control Module, VCM),是利用8051單晶片為系統核心用以控制語音辨識晶片RSC-300動作,達到語音辨識之目的。整套系統亦可做為跨平台聲控使用,經由RS-232通訊介面便可命令VCM完成聲音辨識工作。因整體系統是採用模組化設計,因此控制板可以適用於不同的硬體工作平台,具良好之擴充性。

RSC 300語音辨識晶片為一顆8 bit微處理器,具有高準確性、反應時間快速和低成本且多功能之特色。1RSC-300內部方塊圖,晶片內部包括了麥克風訊號放大、數據轉換、以及語音識別等功能

1. RSC-300內部方塊圖

依照VCM的使用手冊,VCM的訓練演算法是採用維特比演算法,來對模組進行重新評,將語音訊號以一些狀態编號來代表,即對觀測序列來進行狀態分割,再由分割後的狀態重新來評估模組的參數。2語音模組訓練流程,其中各區塊功能概述如下:

2. 語音模組訓練流程

(1)   輸入訓練語句:把語音樣本輸入系統,用以得出語音樣本參數。

(2)   模組初始化:將訓練語句均勻分為N個訓練模組的狀態數,分別設定每個狀態之期望值與變異數矩陣,作為系統初始化值。

(3)   計算相似度:重新將訓練語句輸VCM訓練模組中,利用維特比演算法求得語音觀測序列對應於狀態的相似度,同時重新計算模組參數。

(4)   重新評估:利用新的模組參數,評估模組是否收斂。若否,則重新計算模組的參數直至收斂為止。

(5)   建立模組:將收斂參數紀錄下來,以為辨識的樣本模組。

2.     系統建置及操作

根據智慧型機器人輪椅初步設定之應用情境,本研究開發了語音控制模組雛形,建立其基本指令。本系統包含了語音辨識模組及電腦,語音辨識模組主要的功能是進行語音辨識,並將辨識結果經由RS-232通訊介面傳送給電腦,而電腦收到辨識結果後會做出對應的動作。在電腦端的操作介面是用Borland C++ Builder 5 來作為開發工具,使用者可以直接經由電腦介面操作語音辨識模組,圖3為電腦操作介面。

3. 電腦介面

本系統的操作敘述如下:

(1)       訓練語音樣本

電腦介面中的「連續辨識後,系統會開始進行語音辨識本系統一次訓練一組語音樣本,訓練完成後會將語音樣本儲存在記憶體中,目前系統中的樣本有前、後、左、右、停、靠左、靠右、廚房、浴室、客廳、確認,共11組基本指令樣本。

(2)       進行語音辨識

按下電腦介面中的「連續辨識後,系統會開始進行語音辨識,整體操作流程如4所示依照辨識結果的不同,電腦畫面會顯示出以下的結果:

4. 操作流程圖

a.       無法辨識:當無語音輸入或輸入的語音不存在樣本中會在「辨識結果」下顯示「無法辨識」如圖5

5. 「無法辨識」的顯示畫面

b.      辨識成功:當輸入的語音在樣本中存在的話,系統會依輸入的指令不同會出現下面的三種狀況:

Ÿ   輸入指令不為「停」或「確認」:系統會顯示並記錄指令並要求確認指令,如「前進,請確認」並由電腦喇叭發出提示音,結果如圖6(a)所示。

Ÿ   輸入指令為「確認」:系統會顯示確認指令並執行,如「前進,確認」並由電腦喇叭發出提示音,結果如圖6(b)所示。

Ÿ   輸入指令為「停」:系統會直接執行停止的動作,這項指令不用經由確認就可執行。

            

6. 系統對不同輸入指令的顯示畫面

3.     結論

本文以RSC-300建立智慧型機器人輪椅語音控制模組基本指令,同時能將辨識結果利用個人電腦加以顯示。未來將配合智慧型機器人輪椅之應用情境,持續修正、增加語音控制指令,並進而將語音指令轉換成馬達命令,用以控制輪椅動作。