//Logo Image
作者:盧嘉泓(2011-07-30);推薦:盧俊銘徐業良(2011-07-30)
附註:本文為九十九學年度元智大學機械工程研究所盧嘉泓碩士論文「基於人際溝通互動元素開發遠端臨場機器人-TRiCmini」第二章。

第二章 TRiCmini設計概念與系統架構

如第一章所述,為改善遠端臨場技術溝通互動機器人TRIC體積龐大、系統複雜等缺點,並更加強人際溝通的元素如肢體動作、表情等,使遠端的親友、照護者可利用TRIC與高齡者進行更深入而直覺的互動,增強陪伴與關懷的效果,本研究強調人際溝通互動元素,重新設計一台應用於人際溝通互動之遠端臨場迷你機器人—TRiCmini

2.1 使用情境

根據與遠端臨場機器人之間的互動關係,可將TRiCmini使用者分為「近端」與「遠端」兩種,分別為與機器人處於同一空間的「近端使用者」以及身處另一空間操作機器人的「遠端使用者」,簡單地說,近端使用者即為與TRiCmini直接面對面互動高齡者,而「附身」在TRiCmini上的親友或照護者則為遠端使用者。

TRiCmini使用網際網路作為通訊媒介,身上備有攝影機、麥克風、喇叭與表情、肢體動作等互動溝通的元素,擺放於高齡者家中,可被親友或照護者由遠端登入操作,除了使其自由走動以了解家中環境或高齡者的情況外,亦能移動到高齡者的身旁寒暄問暖;配合對話的情境,遠端使用者還可操作TRiCmini做出不同的肢體動作與臉部表情,將自身的情緒投射到TRiCmini上,彷彿「附身」在TRiCmini身上一般,而高齡者則藉由與TRiCmini對話與互動中感受到親友或照護者彷彿就在身旁一般的貼心關懷。為了營造此使用情境,本研究勾勒了如下之設計概念與系統構成。

2.2 設計概念

本研究是TRIC新一代版本,除了是與高齡者溝通互動之遠端臨場機器人,更希望被定位為家電產品,即是容易使用、系統穩定且適合於居家環境中使用期盼能成為商業化的產品並實際推廣至一般家庭,因此外型比起前代更加輕巧,系統也更加簡化、穩定、容易使用。整體而言,TRiCmini的設計概念有兩大思考主軸:

(1)   應用遠端臨場技術與人溝通互動

TRiCmini應用遠端臨場技術進行遠距溝通,複製了人們於三度空間中真實面對面接觸的經驗,期望近端與遠端的人們有共處於同一空間的真實感,是種截然不同的遠距溝通方式。如圖2-1所示,遠端使用者(親友、照護者)透過網際網路操作近端環境中的TRiCmini,將自身投射在TRiCmini身上,近端使用者(高齡者)則同時擔任觀察者和對話者的角色,觀察TRiCmini的行為,認同其為遠端使用者的「替身」,而與之產生互動、對話,遠端使用者也透過影音等訊號傳輸,讓自己產生如在近端環境的錯覺,如此一來,雙方都能感受到彷彿在同一環境與對方互動、對話。

2-1. 遠端臨場技術之實際應用情境示意

針對過去在遠端臨場應用的相關研究,歸納出遠端臨場機器人應具有的6種設計元素如表2-1所示,並逐項檢視TRiCmini為滿足各項設計元素之達成方式

2-1. TRiCmini達成遠端臨場設計元素之方式

設計元素

達成方式

資料傳輸[Paul et al., 1975]

(Data transmission)

應用網際網路與無線網路技術,並結合自行開發之PIC單晶片嵌入式網路伺服器為核心

遠端操作[Tzafestas et al., 1997]

(Tele operation)

TRiCmini具有全向輪平台可作多種方向的移動

感官[Daniel et al., 1998]

(Supersensory)

透過影音設備傳遞視覺與聽覺訊息、使用感測器偵測四周環境

擬人化[Stoker et al., 1995]

(Anthropomorphic elements)

擬人化外型與行為

眼神接觸[Engelberger, 2001]

(Eye contact)

設計讓TRiCmini眼睛看向使用者

自主行為[Spudis, 2001]

(Autonomous behaviors)

跟隨與障礙閃避功能

TRiCmini最主要的功能是進行溝通互動,因此本研究希望近端使用者(高齡者)與TRiCmini對話時感覺到有如與真人面對面談話一般。根據研究顯示,人類在面對面溝通時,語言表達的部份其實只佔了7% [Mehrabian, 1972],反倒是非語言表達佔了大部分,而非語言表達可歸類為7種形式[Knapp, 1972],如表2-2所示。TRiCmini設計時除了基本的語言表達外,非語言的表達當然也被特別考慮:在身體動作方面,TRiCmini擁有擬人化的肢體動作與臉部表情,根據Ekman[1972]的研究,雖然人類的表情組合高達7,000種,但就算是在不同的民族與文化背景下,還是可大致歸納出6大「通用臉部表情(universal facial expression)」分別為高興、難過、生氣、驚訝、厭惡、害怕,(圖2-2),因此,TRiCmini也將會具備這些基本的表情與情緒動作;在注視行為上,因TRiCmini體型遠小於普通人,所以將眼睛設計看向上方,希望與對話者有眼神的接觸,這是因為當機器人與使用者有眼神上的接觸時,使用者可更加注意機器人,並且更容易了解機器人所要傳達的事物[Imai et al., 2003],此外,TRiCmini眼睛的位置設置於攝影機鏡頭旁,所以當近端使用者注視TRiCmini眼睛時,也會同時看向攝影機鏡頭,透過攝影機傳回來的影像,期望遠方的操作者也可感覺到與近端使用者有著眼神的接觸;身體特徵方面,TRiCmini的外型設計以「小巧可愛」為原則,如小孩一般,應用流線圓弧造型搭配柔和的顏色,希望可以更加吸引使用者與之互動;人工佩飾方面,使用者能夠幫TRiCmini更換衣服,依照喜好與情境變化搭配衣飾,增加了TRiCmini的個人化設計與趣味;接觸行為方面,TRiCmini雖不會主動接觸使用者,但外型設計摒棄一般機器人常用的硬式外殼,改採如絨毛玩具般軟質設計,即是希望使用者可主動接觸甚至抱起TRiCmini,增加互動時的親切感;貼近性方面,TRiCmini在與使用者對話時約與相距90~120 cm,根據Hall [1966]所定義人際對話距離的四個等級如圖2-3所示,正好屬於「個人距離」的範圍,是適合與親友談話的距離,此外,當機器人與使用者談話距離座落於個人距離或社會距離時,其非語言表達也能發揮最大的效果[Cindy et al., 2006];而準語言與環境因素的控制因素並非取決於TRiCmini本身,而是由遠端使用者透過聲音傳輸表達,或需搭配近端環境的配置,故不影響TRiCmini的設計,亦不在此討論。

2-2. 非語言表達分類與說明

類型

說明

身體動作

(body movement)

(1)       姿態(gestures)

(2)       表情(facial expressions)

(3)       注視行為(eye behavior)

http://i.ehow.co.uk/images/a06/jp/dc/activities-teach-nonverbal-communication-1.1-800X800.jpghttp://www.topnews.in/files/facial-expression.jpghttp://www.illcommunicating.com/wp-content/uploads/2010/07/sexy-smile.jpg

身體特徵

(physical characteristics)

體態、身高、耳朵尺寸、手指長度、膚質、膚色等

http://faculty.washington.edu/jrees/edspectrum1.GIF http://mylifeasanalien.files.wordpress.com/2008/05/babiesbacks.jpg

人工佩飾

(artifacts)

個人所穿戴之所有的物件,如衣服、珠寶、眼鏡、化妝品、購物袋、手提箱、雨傘等。

http://t0.gstatic.com/images?q=tbn:ANd9GcQp9QlcwOTKVDMWaHyERUIJ3ns1BtDqfrN23w6qaOlbGDbQ-Bh3nw&t=1 http://www.salawed.com/bride/news/h000/h23/img200906021512570.jpg

接觸行為

(touching behavior)

握手、粗魯的推擠、擁抱、摑耳光、愛撫等

http://images.sogua.com/ent_pic/tietu/2007/1/4/132253/c4d372d97ce54747383549d46bfd2dac.jpg http://pic1a.nipic.com/2008-10-30/2008103065846753_2.jpg

貼近性

(proxemics)

談話時在空間的接近程度

proxemics http://ikinesics.com/?p=51&getfile=53

準語言

(paralanguage)

有聲音但非使用言語(words)的溝通,包括音調(pitch)、音色(timbre)、音量(volume)、速率(rate)、節奏(rhythm)、發音(articulation)等。

環境因素

(environmental factors)

地理特性、氣候、建築、擺設、採光、溝通的時間(時段)(時間長短)等

2-2. 通用臉部表情

2-3. 人際溝通中空間距離分類

(2)   定位為適用於一般居家環境使用的家電產品

TRiCmini以家電產品自我定位,即是希望其容易使用、系統穩定且適用於居家環境之中,因此設計上特別強調外型輕巧、適合於家中使用,大小、重量參考家庭常用的小型家電如熱水瓶、果汁機等,而在不影響整體功能的前提下,系統也必須更加簡化、穩定且容易使用;為適用於居家環境,TRiCmini的通訊架構將以一般家中常用之寬頻網路環境與無線網路設備為基礎,充電方式也以家庭使用者直接插入插座的方式設計;另外由於居家環境空間往往擁擠、複雜,加以減輕使用者操作負擔的考量,TRiCmini將使用全向輪平台作為移動載具,不僅可以自由、順利地做出多種行走方式,也會更接近人類的行走模式,搭配直覺易懂的操作介面,遠端操作者將可輕鬆地移動TRiCmini

根據前述的使用情境與設計概念,TRiCmini的開發策略與方向已經相當明確,接著便是要依循這些原則規劃合適的硬體設備與程式,並將各項技術整合,建構TRiCmini的整體系統。

2.3 TRiCmini系統架構

TRiCmini整體系統運作架構如圖2-4所示,TRiCmini7項技術模組所組成來達成設定的使用情境與設計概念。TRiCmini擁有包括影音通訊、情緒展現、全向移動、障礙物閃避與跟隨等功能,另備有攝影機、麥克風與喇叭,可讓親友、照護者看見高齡者的影像並透過喇叭發聲,而高齡者的回應會被麥克風接收傳回給親友、照護者,達成影音通訊的功能,另外為讓對話更加生動,TRiCmini可透過不同的表情與肢體動作,將親友、照護者的情緒傳達給高齡者,TRiCmini本身也可移動,經由親友或照護者操作,在高齡者家中行走並查看環境與高齡者個人狀況,配合障礙物閃避與跟隨功能,可簡化遠端操作並增加近端互動,提供附加的娛樂效果。

遠端使用者(親友或照護者)利用「遠端使用者介面」,透過網際網路登入操作近端(高齡者所在處)的TRiCmini近端則由「通訊模組」接收訊號,傳給「情緒模組」或「移動模組」控制TRiCmini動作,同時透過「影音模組」將近端的狀況呈現給遠端使用者,「電源模組」則供給TRiCmini的電力,而TRiCmini的整體外型與骨架即形成「近端使用者介面」。

2-4. TRiCmini整體系統運作架構圖

以下將說明TRiCmini各個模組的詳細的功能與運作情形:

(1)   通訊模組

通訊模組包含了自行開發之PIC單晶片嵌入式網路伺服器與市售無線網路卡,以達成無線網路功能,當遠端使用者利用遠端使用者介面發出命令後,經由網際網路將命令傳送給設置於近端環境的無線網路路由器並以無線方式傳送給TRiCmini通訊模組負責接收、處理網路傳來的命令,隨後將再傳送給其他模組,讓TRiCmini依據遠端命令執行動作。

(2)   情緒模組

情緒模組負責TRiCmini情緒的展現,包含了LED陣列、伺服馬達與控制晶片。臉部表情以LED陣列構成,搭配不同的排列組合與顏色變化,可表現出高興、生氣、難過、驚訝、厭惡、害怕等六種通用臉部表情,配合對應的表情TRiCmini可控制伺服馬達讓雙手擺動及命令移動模組讓身體移動展現不同的情緒狀態

(3)   移動模組

移動模組負責TRiCmini的移動,包含了全向輪平台、自製之PIC單晶片控制器與超音波距離感測器。通訊模組接收訊號、解碼後,將命令傳送至移動模組使TRiCmini移動,可選擇的行走方式有前進後退、左右平移、順逆時針旋轉等,移動模組同時也具閃避障礙物與跟隨人的功能,接收超音波距離感測器的訊息並經演算處理後,即可控制TRiCmini自動避障或跟隨。

(4)   影音模組

影音模組包含市售的網路攝影機(IP Cam)與喇叭,將近端的影像與聲音傳回遠端使用者介面,同時也將遠端使用者的聲音傳回近端,攝影機鏡頭可透過網路控制其轉動及仰角,讓遠端使用者更可以掌握近端的狀況。

(5)   電源模組

電源模組負責TRiCmini電力供給與充電管理,由充電電池與電源電路板組成。當TRiCmini電力不足時會閃燈提示使用者,充電時直接使用變壓器連接插座,充電完成後會自動切斷充電以保護電池。

(6)   近端使用者介面

近端使用者介面即是TRiCmini本身的外型與骨架,TRiCmini必須要吸引使用者與之互動,因此外型以小巧可愛為原則,採用如絨毛玩具般軟性材料,並允許使用者幫TRiCmini更換衣服,增加了個人化、趣味性與互動性。

(7)   遠端使用者介面

遠端使用者介面建構於電腦軟體之上,使遠端使用者(親友或照護者)下達的命令透過網際網路傳達至TRiCmini,與近端使用者(高齡者)進行雙向溝通與互動。遠端使用者介面採用Visual Basic程式開發,除了驅動各項功能的控制畫面,也會呈現鏡頭所拍攝到的近端畫面,另透過音訊輸出可聽到近端傳回的聲音,使用者利用滑鼠點擊的方式操作,介面設計則主張操作簡單、直覺與外觀宜人之原則。

參考資料

Cindy, L. B., and Robin, R.M., 2006, “Affective Expression in Appearance-Constrained Robots,” Institute for Safety Security & Rescue Technology, Tampa, Florida, USA.

Daniel, R. W. and McAree, P. R., 1998, “Fundamental limits of performance for force reflecting teleoperation,” International Journal of Robotics research, 17(8), 811-830.

Ekman, P., 1972, “Universals and cultural differences in facial expressions of emotion,” Nebraska Symposium on Motivation , vol. 19, pp. 207283, University of Nebraska Press, Lincoln, NE

Engelberger, G., 2001, “NASA's Robonaut,” Industrial Robot, 28(1), 35-39.

Hall, E. T., 1966, “The Hidden Dimension,” New York: Doubleday & Company.

Imai, M., Ono, T., and Higuro, H., 2003, “Physical Relation and Expression: Joint Attention for Human- Robot Interaction,” IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS, VOL. 50, NO. 4.

Knapp, M., 1972, Nonverbal Communication in Human Interaction,” Reinhart and Winston Inc, New York.

Mehrabian, A., 1972, “Nonverbal Communication,” Chicago: Aldine-Atherton

Paul, E., and Friesen, W. V., 1975, “Unmasking the Face,” Englewood Cliffs, N.J. Prentice-Hall.

Spudis, P. D., 2001, “The case for renewed human exploration of the Moon,” Earth Moon and Planets, 87(3), 159-169.

Stoker, C. R., Burch, D. R., Hine, B. P., III, and Barry, J., 1995, “Antarctic undersea exploration using a robotic submarine with a telepresence user interface,” Expert, IEEE, 10(6), 14-23.

Tzafestas, S. G., and Prokopiou P. A., 1997, “Compensation of teleoperator modeling uncertainties with a sliding mode controller,” Robotics and Computer-Integrated Manufacturing, 13(1), 9-20.