//Logo Image
作者:盧嘉泓(2011-07-30);推薦:盧俊銘徐業良(2011-07-30)
附註:本文為九十九學年度元智大學機械工程研究所盧嘉泓碩士論文「基於人際溝通互動元素開發遠端臨場機器人-TRiCmini」第四章。

第四章 TRiCmini的基礎性能測試與系統評估

透過軟硬體架構建置與整合,TRiCmini的設計概念已獲得實踐。本章首先進行TRiCmini基本性能測試,提供基本規格、充電時間等資訊,確保產品能幫助使用者達成目的之「實用性(utility)」,接下來並進行使用者評估,確保TRiCmini具備良好的「可用性(usability)」。國際標準組織將可用性定義為「一個產品有效力、有效率地達到使用目的,且讓使用者感到滿意」[ISO 9241-11, 1998],更具體來說,產品的可用性可以Nielsen [1994]提出的五大指標進行判斷,包括學習性(learnability)、記憶性(memorability)、滿意度(satisfaction)、效率(efficiency)與錯誤(errors)。簡單來說,一個具有高度可用性的產品即是操作方式讓使用者容易上手且不易遺忘,對產品極為滿意而愛不釋手,並且在讓使用者發揮良好操作績效的同時,卻不容易發生錯誤或是就算發生錯誤也不影響其操作績效。

如第二章的圖2-1所示,使用TRiCmini的使用者包含處於遠端環境與近端環境的兩種使用者:遠端使用者利用個人電腦透過網際網路登入TRiCmini來與近端的使用者談話或操作TRiCmini動作,近端使用者則透過TRiCmini與遠端使用者互動與談話;由於兩種使用者涉及的操作面向不同,本研究之評估將分別針對遠端使用者(4.2與近端使用者(4.3進行,並依據評估結果探討設計目標的達成程度與TRiCmini需要改進的功能或設計。

2-1. 遠端臨場技術之實際應用情境示意(重覆自第二章)

4.1 TRiCmini基本性能測試

本節首先介紹TRiCmini的基本規格,並依序說明移動能力、電力使用情況、網路速度需求等基礎性能的測試結果,提供使用者實際使用的參考資訊。

4.1.1 TRiCmini的基本規格

TRiCmini的基本規格如表4-1所示,各部位尺寸定義如圖4-1所示。TRiCmini的目標之一是如同家電產品般輕巧、容易使用,因此其尺寸與重量接近一般常見的家電如熱水瓶、果汁機等,可以輕鬆地抱起、移動,放置於居家環境中。

4-1. TRiCmini的基本規格

高度

40.0 cm

離地高度

 1.0 cm

最大寬度

30.0 cm

身體寬度

18.0 cm

最大深度

23.0 cm

身體深度

13.5 cm

頭部直徑

15.0 cm

 

 

總重

 3.6 kg

電池重

 1.0 kg

4-1.  TRiCmini各部位尺寸定義

4.1.2 TRiCmini的移動能力測試

TRiCmini有前進後退、左右平移、順逆旋轉等三種主要移動方式,移動能力測試讓TRiCmini在一般家庭環境中常出現的兩種地面材質磁磚地板與木質地板移動3公尺,重複測量三種移動方式之速度10次後計算其平均值;另外一般無障礙坡道的傾斜角度大約為5度,所以移動能力測試讓TRiCmini5度的斜坡向上爬行3公尺,重複測量其速度10次後計算其平均值;最後讓TRiCmini於一可調整角度的斜坡向上爬行,慢慢提高斜坡傾斜角度直到TRiCmini無法繼續移動,以瞭解其最大爬坡角。所有量測結果如表4-2所示。

4-2. TRiCmini移動能力

在磁磚地板直線移動

19.1 cm/s

在木質地板直線移動

11.0 cm/s

在磁磚地板左右平移

16.9 cm/s

在木質地板左右平移

14.7 cm/s

在磁磚地板順逆旋轉

46.7°/s

在木質地板順逆旋轉

39.8°/s

最大爬坡角

7.7°

5度斜坡直線移動

9.2 cm/s

一般孩童行走的速度約為3 km/hTRiCmini設定的行走速度即是參照此數據,但是因TRiCmini的體型比一般孩童更為矮小,故行走速度會依照身型比例縮減。

4.1.3 TRiCmini的電力使用情況

TRiCmini使用磷酸鋰鐵充電電池為動力源,電力使用情況如表4-3所示,其中待機電流有兩種數值,分別為「TRiCmini開啟但遠端使用者未登入」與「遠端使用者已登入(眼睛保持亮燈狀態)」,而最大電流則是出現於TRiCmini在行走中變換方向的時候。

4-3. TRiCmini電力使用情況

工作電壓

電池提供電壓

待機電流

(未登入)

待機電流(登入)

移動時電流

最大電流

12.0V

13.0 V

1.3 A

1.5 A

2.0 A

2.5 A

TRiCmini的充電使用市售交流轉直流變壓器,將市電轉換為16V/4A,充電時間與工作時間關係如表所列,其中最小工作時間表示TRiCmini持續移動直到電力耗盡的時間,而最大工作時間則是TRiCmini開啟後保持待機狀態不做任何動作直到電力耗盡的時間;持續充電140分鐘即可將電力充滿,隨後最短可用110分鐘,最長則達180分鐘。

4-4. TRiCmini充電時間與工作時間關係

充電時間(分)

 140*

120

100

80

60

40

20

最小工作時間(分)

110

92

82

70

55

45

29

最大工作時間(分)

180

158

141

122

100

79

55

*為電力充滿狀態

4.1.4 TRiCmini的網路速度需求測試

TRiCmini的通訊與控制皆經由網路,故網路速度對TRiCmini的影響很大,網路需求測試利用網路流量限制軟體將TRiCmini的網路速度限制在不同速度,測量談話時影像與聲音的延遲時間,表4-54-6為測試之結果。

4-5. 遠端使用者網路下載速率與畫面聲音延遲時間對照表

下載速率

50KB/s

60KB/s

70KB/s

80KB/s

90KB/s

100KB/s

畫面延遲時間(秒)

8.0

6.7

6.0

5.0

4.3

3.2

聲音延遲時間(秒)

8.3

7.5

6.7

5.7

5.3

4.2

下載速率

110KB/s

120KB/s

130KB/s

140KB/s

150KB/s(建議速率)

畫面延遲時間(秒)

3.0

2.0

1.8

0.6

0.5

聲音延遲時間(秒)

3.2

2.0

1.6

1.5

1.2

4-6. 遠端使用者網路上傳速率與聲音延遲時間對照表

上傳速率

1KB/s

2KB/s

3KB/s

4KB/s

5KB/s(建議速率)

聲音延遲時間(秒)

9.0

8.3

7.5

2.0

0.9

根據國際上最大的CDN服務商Akamai [2010]統計,台灣地區網路的下載速率平均為4.08Mbit/s(510KB/s),上傳速率在台灣地區的所有網路提供業者提供的網路上傳速率皆高於64Kbit/s(8KB/s)TRiCmini的網路速度需求均低於這兩個數值(圖4-2),代表TRiCmini適用於一般家庭的網路環境之中。

4-2. TRiCmini網路需求

4.2 遠端使用者的評估

為瞭解實際應用狀況,本研究將設計貼近TRiCmini一般使用情境的任務,觀察遠端使用者執行任務的過程,一方面檢視可用性五大指標的達成程度,定義TRiCmini可用性,另一方面解讀遠端使用者行為背後的涵義,分析其使用TRiCmini的情況與常態,進而找出任何有可能的設計缺陷。根據評估的結果,即可驗證設計概念是否被明確地實現,並作為TRiCmini設計改善的依據。

4.2.1評估工具介紹

在評估內容的設計上,主要以暸解可用性五大指標的達成程度與設計概念的實踐程度為基礎,設計一個符合日常使用情境的任務給受測者執行,配合監視設備與問卷蒐集各種數據,經分析解讀後達成評估之目的。為了體現平時產品使用的狀況,任務的內容將盡可能包含所有功能的操作,讓測試結果更有參考價值,而為了有效觀察與分析使用者的操作與互動行為,評估將使用以下設備與工具:

(1)   攝影機與影片製作軟體

使用兩台攝影機,同時紀錄受測者的動作與TRiCmini的動作,並利用影片製作軟體將兩台攝影機的影像同步疊合,以利後續的分析工作。

(2)   眼球追蹤儀(Eyetracker)

眼球追蹤儀也叫眼動儀,經常運用於研究人類閱讀文章時的視線軌跡,藉以瞭解個人之閱讀習慣,亦有心理醫師將其用於判斷個人注意力或診斷過動症狀,在工商心理學利用上,將視線軌跡、凝視點加以分析統計可協助瞭解使用者瀏覽網頁的習慣,讓廣告排列方式與位置處於最能吸引瀏覽者的狀態,另外也應用於研究駕駛者駕駛車輛時的行為。

眼動儀分為三大類型,第一種是讓使用者配戴如隱形眼鏡一般的感測器在眼球上,直接偵測眼球的動作來分析受測者的視線;第二種是將感測器黏貼在眼睛周圍的皮膚上,藉由偵測眼睛周圍肌肉的電子訊號推估眼球動作,用以分析受測者的視線;第三種則使用攝影機拍攝眼球來分析受測者的視線,此種眼動儀為非侵入式,雖然精準度較前兩種稍差,但是使用方便,受測者配戴起來也較為舒適,故本研究採用此類型的眼球追蹤儀(圖4-3)。本研究所採用的眼球追蹤儀為美國Arrington Research Inc.所生產的Viewpoint Eyetracking System,具有兩台小型攝影機,一台置於眼前以追蹤眼球動作,另一台置於眉毛前方以同步紀錄所見景物。訊號經分析處理後,可在景物影像上同步標示使用者注視的目標與視線軌跡(圖4-4),點的部份稱為凝視(fixation)而線的部份則是從一點快速看到另外一點的掃視(saccade)動作,將凝視與掃視的移動方向與順序綜合起來可以得到搜尋軌跡(scan path),點可以知道受測者正注視的位置,而線可以知道受測者視線移動的軌跡,凝視的點代表較為注意的部份,視線的搜尋軌跡則往往代表了思考的過程[Alfred, 1967]。在遠端使用者操作遠端使用者介面或是近端使用者與TRiCmini互動的過程中,觀察其視線軌跡,將有助於解讀使用者的行為。

4-3. 本實驗使用的眼球追蹤儀(Viewpoint Eyetracking System)

4-4. 眼球追蹤儀結果匯出圖

(3)   行為分析軟體

攝影機側錄影像結果與眼動儀匯出的影像本身並無法提供直接的資訊,需要經過行為分析軟體歸納整理各項行為動作的頻率、重要性等特徵,始能輔助分析受測者的行為模式。

(4)   問卷

問卷為各種評估中最常使用的工具,本評估採用廣為使用的李克特五分制量表(Likert 5 scale),其問題的答案選項通常為「極度同意」、「同意」、「普通」、「不同意」、「極度不同意」,由高到低五個分數依序代表著正向、中性至負向的意見,藉此問卷可將主觀的感受轉換為分數的形式,以協助瞭解使用者的滿意度。另外在問卷中也會加入開放式問題,以具體得知使用者的主觀感受與意見,完整的問卷內容如附件23所示。

如圖4-5所示,經由以上各種評估工具的幫助可以瞭解受測者使用TRiCmini時的客觀表現與主觀感受,從而得到量化與質化的數據,可推論設計概念是否被落實,並作為TRiCmini設計改善的參考與依據。

4-5. 評估結果數據分類

4.2.2 評估方法與流程

遠端使用者透過遠端使用者介面與近端使用者進行影音談話或操作TRiCmini動作,故本階段的評估重點在於TRiCmini的操作情況、影音談話的品質與遠端使用者介面的設計;TRiCmini定位為家電產品,所以希望是容易上手與使用的,這分別代表了可用性五大指標中的學習性與效率。

為了要證明學習性,本部份的評估,要求受測者執行三遍同樣的任務並比較三次的完成時間,如果時間有顯著的遞減現象即可推論「經過適當的練習後,操作TRiCmini是容易被學習的」。

為了檢驗操作效率,必須要有一個比較的基準,所以本評估中以一位已經相當熟悉操作的人員先執行三次任務,並以其平均完成時間作為標準,受測者完成任務後,將其操作時間跟標準時間比較,如果差距愈小,代表該使用者操作TRiCmini的效率越高,若受測者完成第一次任務的時間即與標準相近,則可推論TRiCmini具有高度的學習性,亦即不需重複練習便可迅速上手;操作效率的另外一個指標為透過眼動儀所蒐集的數據資料,例如當受測者視線停留在遠端使用者介面操作區域的時間越短時,亦即可一邊看著鏡頭所拍攝的影像畫面、一邊進行操作,不需長時間於操作時間尋找欲執行的功能,通常也意味著操作效率越高,經由與操作時間等量化指標相比較,即可驗證此假設是否正確。

完成任務後,透過問卷以探討使用者的主觀滿意度,遠端使用者介面的設計與影音談話的品質等滿意度問題會在問卷中得知。而在執行任務中,受測者必須同時以口頭敘述目前正在進行什麼動作,作為事後進行動作定義與分析的依據,與TRiCmini動作側錄影片相互對照,即可檢視使用者是否確實達成任務,有助於暸解錯誤率。

遠端使用者評估分為兩階段進行,第一階段為前測作業,用以確定測試流程或內容與TRiCmini本身的軟硬體是否需要做修改,將問題改善後便可進行正式的遠端使用者評估。前測有5人參加,正式的評估則有10人參加,並且一半受測者的背景為理工科系、另一半受測者為非理工科系者,藉以檢視使用者的背景是否會影響操作績效與個人喜好。以下為詳細的遠端使用者評估流程:

(1)    讓受測者閱讀說明文件(附件1),並對其講解任務內容

(2)    幫助受測者配戴眼動儀,並進行眼動儀的校正

(3)    發給受測者一張寫有IP位置的紙條

(4)    啟動側錄攝影機,分別拍攝TRiCmini端與受測者端

(5)    受測者依照紙條上的IP位置登入TRiCmini,並執行要求的任務

(6)    將步驟(5)重覆執行三次

(7)    測試結束,測試者幫助受測者卸除眼動儀

(8)    受測者填寫問卷

任務的設計必須考慮產品平時使用的狀況,設計出貼近產品使用情境並展現所有TRiCmini功能的任務,表4-7為遠端使用者會使用到的TRiCmini功能與其目的,任務的規劃必須將這些都考慮在內。受測者要執行的任務(即上述的步驟(5)分為五個階段,分別為登入TRiCmini、尋找大字報、進入房間、與房間中的測試人交談、出房間回到起點。測試屋的配置如圖4-6所示,海報張貼的位置高約2 m,與起點距離約4 m,房間位置距離起點約6 m,房門寬約1.2 m,測試者會坐在離房門約2 m處。與表4-7對照,任務流程與任務每階段對應會使用的TRiCmini功能如圖4-7所示。

4-7. 遠端使用者會使用的TRiCmini功能與目的

編號

功能

目的

1

移動

觀看近端環境情況或尋找近端使用者

2

轉動攝影機

觀看近端環境情況或尋找近端使用者

3

表情變換

增加談話趣味與真實性

4

情緒動作

增加談話趣味與真實性

5

影音談話

溝通互動

4-6. 測試屋配置圖

4-7. 遠端使用者評估任務流程圖

完整的遠端使用者問卷於附件2,問卷中問題結構如圖4-8所示,由於受測者必須使用電腦操作TRiCmini4-9,基本資料部份會詢問受測者使用電腦的習慣以提供參考,另外也詢問受測者擁有的駕照類別,觀察操作移動的方式是否因駕駛經驗而有所不同;除了基本資料外,其餘問題依照可用性五大原則分為五個部份,有助於暸解TRiCmini在可用性五大原則的達成程度,並驗證設計概念是否實現。從執行任務至填寫問卷、完成實驗,平均每人約費時20分鐘。

4-8. 遠端使用者評估問卷問題結構

4-9. 遠端使用者評估實際情況

4.2.3 前測結果分析與評估流程改善

前測有5人參與,受測者平均年齡為21.6歲,性別分佈為32女,背景方面,理工4人、商管財金1人。前測的目的是確定測試流程與內容、TRiCmini本身軟硬體是否需要做修改,並會將找到的問題加以修正。在測試流程部份,受測者表示只靠說明的文件無法想像TRiCmini動作的形式,所以在正式的測試時除了給受測者閱讀說明的文件外,還會播放一段TRiCmini各項功能的展示影片,讓受測者更暸解TRiCmini動作的形式。在前測作業中發現有些受測者會經常使用平時較少見的移動方式如後退或平移,或許與受測者本身的駕駛經驗有關,所以在實驗設計部份問卷中增加詢問受測者持有的駕照類別。TRiCmini軟硬體需要修改的部份如表4-8所示。

4-8. TRiCmini硬體與操作介面須要修改的部份

編號

需要修改的問題

1

TRiCmini旋轉的速度太快,操作者很難停定在想要的角度

2

聯絡人列表的說明只可以看到一次

3

操作介面為英文讓操作者忽略甚至無法暸解按鍵或介面的文字

4

按鍵沒有集中,操作者容易忽略另一側的按鍵

5

測試者不知道情緒動作的按鍵是可以按的

6

攝影機旋轉幅度的按鍵常被測試者誤認為鏡頭的拉近拉遠

7

測試者認為攝影機旋轉幅度的按鍵是沒有必要存在的

8

測試者認為IP地址的顯示沒有必要存在

關於問題1,在正式測試時會將TRiCmini的旋轉速度調慢,問題28皆為介面設計的問題,所以在正式測試時修改設計出一個新的介面。舊介面聯絡人列表說明會在進入時彈出(圖4-10),關閉後聯絡人列表才會出現,使用者很有可能會忘記之前看到的說明,導致無法繼續順利操作;新介面將說明與列表結合在一起,方便使用者操作時可做對照(圖4-11);新的操作介面將介面與按鍵上出現的文字全部改為中文,並且將操作的按鍵盡量集中,去除前測中使用者認為沒有必要的按鍵與顯示;表情增加為六種,以對應人類的通用臉部表情,情緒動作按鍵附近也新添加了說明,讓使用者瞭解其功能。整體修改細節如圖4-12所示,完成各種修改後,即開始進行正式的遠端使用者測試。

4-10. 舊介面聯絡人列表與說明出現方式

4-11. 新介面聯絡人列表與說明出現方式

4-12. 操作介面修改細節

4.2.4 正式評估結果分析

遠端使用者評估的正式測試有10男性、女性各5參加,平均年齡為22.3歲,背景分佈包括理工5人、人文藝術3人、商管財金1人、資訊1人。受測者的電腦使用時數、電玩接觸頻率與持有駕照類別如圖4-13所示。評估過程中,受測者需將任務重複執行三次,藉由操作時間的分析暸解效率與學習性,任務分為登入TRiCmini、尋找字報、進入房間、與測試人談話、出房間回到起點五個步驟,任務中每步驟對應的TRiCmini功能如表4-9所示。本節將分別探討量化與質化的數據,並分析兩者的相關性,期望能檢視TRiCmini遠端操作介面的可用性並歸納遠端使用者的操作特性。

4-13. 受測者的電腦使用程度與持有駕照類別

4-9. 任務中各個階段對應的TRiCmini功能

任務階段

功能

登入TRiCmini

尋找字報

進入房間

與測試者談話

出房間回到起點

全向移動

 

 

轉動鏡頭

 

 

 

表情變換

 

 

 

 

情緒動作

 

 

 

 

(1)   量化指標分析

量化指標包括受測者使用TRiCmini執行任務的時間,與受試者視線停留於介面各區域的時間比例。遠端使用者評估所收集的影像如圖4-14所示,上方為眼動儀匯出畫面,以綠色的軌跡點顯示受試者視線停留的位置,利用行為分析軟體分析影片,即可獲得任務執行的時間、視線停留於操作介面各區域的時間百分比等量化數據;下方影像則分別為受試者操作端的側錄影像(左)與近端的機器人活動狀況側錄(右)。受測者執行各項任務的平均操作時間與所有任務的平均總操作時間如表4-10所示,其中只有第一次操作時必須執行登入TRiCmini這個步驟(登入後程式將會自動記憶登入資訊,故第二、第三次操作時不需再輸入IP位置等登入資訊),因此不將此步驟列入分析與討論之列;另為了方便衡量總操作時間,將受測者的平均總操作時間除以一熟悉操作TRiCmini的測試者執行任務之最佳時間而得到其效率係數,此係數越低代表越接近理想的操作時間,意即效率越高。

4-14. 遠端使用者眼動儀匯出畫面與評估側錄

4-10. 遠端使用者評估平均任務執行時間與標準差(秒)

任務階段

 

操作次數

尋找字報

進入房間

與測試者談話

出房間回到起點

總和

效率係數

第一次操作

124.5±30.1

71.5±23.7

41.6±18.6

83.8±30.6

321.4±47.3

2.12

第二次操作

 74.5± 8.9

52.4±14.7

26.7±12.7

73.2±15.8

226.4±21.1

1.50

第三次操作

 68.9±12.3

62.0±23.3

22.7±11.6

61.0± 9.3

214.0±27.5

1.40

平均

 89.3±14.4

62.0±14.5

30.3± 8.9

72.7±12.2

254.0±19.4

1.67

就操作時間與效率係數來看,隨著操作次數增加,所花費的時間越少、效率係數也越低越接近理想的績效;進一步地採取成對T檢定結果如表4-11檢驗差異性,第一次操作與第二次操作的時間在統計上有顯著的差異,第一次操作與第三次操作之間亦然,代表受測者隨著使用經驗的累積,執行任務的效率有明顯改善,但第二次操作與第三次操作的時間並沒有顯著的差異,代表受測者在第二次操作時即已熟悉TRiCmini的操作方式、接近理想的狀態,因此再進步的空間有限。整體而言,TRiCmini的遠端操作介面確實具有良好的學習性與記憶性,符合預期的設計目標。觀察表4-10詳細分析各項任務,將第一次操作與第二次操作相比,尋找海報的執行時間減少了40%,成對T檢定亦達到顯著水準(p=0.00),是所有任務中變化最多的,如表4-9所示,尋找海報時,受測者除了到達字報附近要轉動攝影機鏡頭外,其大部分的時間都是在操作TRiCmini進行移動,由此可推論操作TRiCmini移動是最需要練習、卻也是練習後效率提昇最顯著的功能;而同樣是以移動為主的進入房間與出房間回到起點兩個步驟,時間分別減少了27.7% (p=0.03)13.0% (p=0.18),可以發現越到後面執行的步驟,不僅時間減少的幅度越來越小,差異性也越來越不顯著,這說明了測試者在同次任務中就已經開始慢慢熟悉其操作方法,績效也會因此漸漸提昇至接近理想的水準;與測試者談話的操作時間變化亦有相同的趨勢,這是因為在第一次操作的談話中受試者往往會要求施測者重複說明任務內容或對任務更進一步地解釋,且受測者需要尋找表情變換的按鈕,而到了第二、三次操作時,因為任務要求相同,受試者已清楚其內容,便不會再要求覆誦或解釋,並且也已經知曉控制表情變換按鈕的位置,所以時間比起第一次操作時短,第二、三次的操作時間則差異不大。

4-11. 三次操作時間互相計算的p

操作次數比較

 

任務階段

第一次與第二次

第一次與第三次

第二次與第三次

尋找字報

0.00*

0.00*

0.18

進入房間

0.03*

0.38

0.17

與測試者談話

0.06

0.03*

0.42

出房間回到起點

0.18

0.05*

0.02*

總時間

0.00*

0.00*

0.20

* 具有顯著差異(p<0.05) 

接著將執行任務的時間對應到受測者的基本資料與背景,包括性別、電腦使用時數、電玩接觸經歷、持有駕照類別等。以性別來看,在三次任務中,男性的平均總操作時間均較女性短,如圖4-15所示,其中在第一次操作時,男性與女性的平均操作時間並沒有顯著差異(p=0.98),到了第二次操作時,男性的平均操作時間則明顯地比女性進步來得多,兩者的平均總操作時間極接近顯著差異(p=0.07),到了第三次操作時,無論男性或女性皆已熟悉介面的操作,所以儘管平均總操作時間都較前次再減少,兩者之間又沒有顯著的差異(p=0.67),由此可推論:經過初次使用後,男性對TRiCmini操作的學習性優於女性,但累積超過兩次的使用經驗後,男、女使用者皆已熟悉操作,便沒有明顯的差別了。至於受試者的背景,因分佈較為廣泛,故採用相關性分析來分析任務平均執行時間與背景特性的關係,結果發現:受測者的量化績效指標操作時間與電腦使用時數、電玩接觸經歷、持有駕照類別等任何一項背景特性均沒有明顯的相關性,也就是說不熟悉電腦、不常玩電玩或沒有駕照都不會影響操作TRiCmini的效率,因此使用者不需具備任何相關經驗即就簡單上手,具有良好的學習性,符合預期的設計目標。

4-15. 男性與女性三次操作平均時間的比較圖

量化指標的另一個數據為眼動儀所記錄受試者在任務中視線停留於操作介面各個區域的時間比例,表4-12為任務中受測者視線停留於顯示螢幕、移動操作區域、鏡頭操作區域、操作介面之外的區域、說明書、鍵盤等六種區域的時間百分比,可以發現受試者執行任務時,視線停留在顯示螢幕的時間遠多於停留在操作區域的時間,表示使用者並不需要花費太多時間在尋找欲執行的功能上,而可以專注於顯示螢幕中的畫面近端使用者或環境。而比較三次操作可以發現注視顯示螢幕的時間逐漸減少,而注視操作區域與介面外的時間卻逐漸增加,這是由於三次操作的任務與地點皆相同,所以在第二、三次操作時,受試者已經熟悉測試屋內的擺設與地形,便不再花費時間注視顯示螢幕,反而注視操作區域確以認操作動作,不專心地將視線飄向操作介面外的時間比例也升高。另外利用相關性分析檢視視線停留區域的時間比例與任務平均總操作時間,發現兩者為負相關,而注視操作區域的時間比例與平均總操作時間為正相關,表示當受試者花越多的時間注視顯示螢幕相對花越少的時間注視操作區域時,任務執行的時間越短、效率越高,因此若要改善介面的設計以更加提升操作效率,可以從「如何降低使用者對於注視操作區域的需求」來著手。如果將受測者視線停留區域的時間百分比分對應到受測者的基本資料包括性別、背景互相比較,發現皆沒有顯著的差異,也就是說不管男性或女性、理工或非理工背景在操作TRiCmini時注視的習慣都是一樣的。

4-12. 受測者視線停留於介面各個區域的時間百分比

停留區域

 

操作次數

顯示螢幕

移動操作區域

鏡頭操作區域

操作介面之外的區域

說明書

鍵盤

第一次操作

65%

23%

2%

3%

4%

3%

第二次操作

64%

26%

4%

6%

0%

0%

第三次操作

61%

28%

4%

7%

0%

0%

整體平均

63%

26%

3%

6%

1%

1%

(2)   質化指標分析

質化指標是透過問卷調查瞭解受試者使用TRiCmini後的主觀感受,根據可用性五大原則的分類,平均得分如表4-13所示,5分為滿分,代表極佳的可用性,高於3分即表示可用性良好,而低於3分表示可用性不良。TRiCmini整體的可用性優良平均為3.6,五大原則也都高於3分,女性受測者的給分均較男性高(表4-13),理工背景受測者的給分較非理工背景高(表4-14)。

4-13.可用性五大原則男性、女性與整體平均分數


性別

效率

錯誤

學習性

記憶性

滿意度

綜合

男性

3.6

4.0

3.5

3.6

3.0

3.5

女性

4.0

4.0

3.7

3.9

3.4

3.7

平均

3.8

3.9

3.6

3.8

3.2

3.6

4-14.可用性五大原則理工、非理工背景平均分數


背景

效率

錯誤

學習性

記憶性

滿意度

綜合

理工

4.0

4.1

3.5

3.9

3.3

3.8

非理工

3.6

3.7

3.7

3.6

3.1

3.5

4-15列出在實用性各大原則中得分最高與最低的問題,接下來將針對這些問題得結果詳細說明與分析。

4-15. 實用性各大原則中得分最高與最低的問題

可用性

高低分

問題

得分

效率

最高分

操作介面給的提示資訊是否充足?

(是否有足夠的提示讓您知道如何操作?)

4.4

最低分

操作介面的靈敏度如何?

(例如按了按鍵是否馬上有反應)

2.9

錯誤

最高分

有按鍵的功能是與您的直覺或認知不同的嗎?

4.0

最低分

操作的過程中,您會按錯按鍵嗎?

3.8

學習性

最高分

如果讓您先閱讀完整的操作手冊,您覺得您完成任務的時間會大幅地縮短嗎?

3.7

最低分

您覺得其他人容易學會操作TRiCmini?

3.5

記憶性

最高分

在第二次或第三次的操作中,您覺得有不同嗎?

4.1

最低分

您覺得過了一段時間後您會忘記操作的方法嗎?

3.4

滿意度

最高分

影像清楚嗎?

4.0

最低分

您覺得遠端操作TRiCmini在居家環境中移動,跟本人實際行走移動的感覺差很多嗎?

2.1

在效率的部分,受測者認為操作介面的提示相當充足,讓初次使用的人也可以循著提示正確地操作,但是受測者也反應了介面的靈敏度不佳,詳細觀察開放式的問題後發現,方向控制的左旋與右旋常常會按了沒有反應,受測者必須多按幾次,導致此題的得分偏低。在錯誤的部分,即使是得分最低的題目也得到了3.8分,顯見受試者對於操作介面的錯誤預防普遍滿意,應歸功於操作介面上的按鍵說明、圖案與排列大致都與一般使用者所預期的功能相符,降低了操作中按錯的機率。在學習性的部分,即使是得分最低的題目也得到了3.5分,代表TRiCmini的操作具有良好的學習性,其中大部分的受測者覺得就算看過操作說明,執行任務時間也不會大幅縮短,顯示TRiCmini的操作方式直覺而不複雜,使用者只需自行摸索就可上手,而大部分的受試者也認為其他人都可以容易地學會操作TRiCmini,僅有少部分的受試者認為其操作對高齡者來說可能略顯困難。在記憶性的部分,即使是得分最低的題目也得到了3.4分,表示TRiCmini的操作具有良好的記憶性,受試者認為在第二、第三次操作時有很大的不同,主要是因為熟悉了TRiCmini的移動方式如旋轉的角度、移動的速度等,當然這也明顯反應在執行任務的時間上,而大部分的受測者都認為,除了些小細節如要談話時必須將聲音上傳選項開啟外,他們並不會忘記整體的操作方式。滿意度的部分,多數受測者覺得影像清楚,但受試者普遍認為遠端操作TRiCmini與實際與人談話或行走是有明顯的差別,這主要是因為操作時需要透過攝影機來觀看近端的情況,而攝影機不管在視野範圍或解析度上都遠不及人類的眼睛,移動方式也不夠自然,這些都是TRiCmini未來的改善重點。

4-16為受測者對於TRiCmini使用與購買意願的分布圖,大部分的受試者都覺得TRiCmini使用起來還算方便,且如果擁有TRiCmini的話會願意經常使用,但是在購買意願方面卻不如使用意願來得高;至於售價,受試者認為10,000~20,000元較可接受,這個價格約略等同一台中高階手機的售價,但是此價格仍低於現階段TRiCmini的製作成本,因此為了提昇消費者的購買意願, TRiCmini的設計與製程仍須改進以降低其成本,或是在現有的架構下提供更多的附加價值。

4-16. 受測者對於TRiCmini使用與購買意願的分布圖

探討受試者性別與使用、購買意願的相關性,如表4-16所示,可以發現到女性不管在使用意願或購買意願上皆高於男性,與問卷分析中女性受測者比起男性對TRiCmini滿意度較高的現象相符合;表4-17為理工背景與非理工背景受測者之使用意願與購買意願得分,可以發現到理工背景的受測者使用意願會高於非理工背景的受測者,但是在購買意願上則低於非理工科系的受測者,這是因為理工背景的受測者平時就較非理工背景的受測者容易接觸或使用科技產品,所以對TRiCmini的使用意願較高,但是也因為經常使用或接觸科技產品所以對商品價值的要求自然也較為苛刻而導致購買意願較低,這些結果亦可提供未來商品化後的銷售策略參考。

 

4-16. 男性與女性受測者之使用意願與購買意願得分

問題

男性

女性

整體而言,您覺得TRiCmini使用起來方便嗎?

3.2

3.8

如果您擁有TRiCmini,會常常使用它嗎?

3.6

3.6

如果TRiCmini商品化後,您會想要購買嗎?

2.6

3.8

如果TRiCmini成為商品,您願意花多少錢購買?

2.4

3.2

4-17. 理工背景與非理工背景受測者之使用意願與購買意願得分

問題

理工

非理工

整體而言,您覺得TRiCmini使用起來方便嗎?

3.6

3.4

如果您擁有TRiCmini,會常常使用它嗎?

4.0

3.2

如果TRiCmini商品化後,您會想要購買嗎?

3.0

3.4

如果TRiCmini成為商品,您願意花多少錢購買?

2.8

2.8

(3) 量化與質化數據的比較與分析

將問卷調查的主觀質化指標與受測者的執行任務時間、眼動儀的數據等客觀量化指標對應分析,發現問卷中各題得分與執行任務時間作之間均沒有明顯的相關性,而將任務執行時間與各項可用性原則得分作相關性分析,如表4-18所示,大部分的趨勢都與一般的直覺相異,如平均操作時間與可用性得分為正相關,表示可用性得分越高,執行任務時間會越長,與一般「覺得越好使用、需要花費越少時間操作」的直覺相違背,顯見使用者主觀的感受與實際操作TRiCmini時的績效並不相符。

4-18. 可用性原則與執行任務時間的相關係數

效率

錯誤

學習性

記憶性

滿意度

可用性

0.57

0.50

-0.13

0.15

0.61

0.57

而將視線停留區域的時間百分比與問卷中各問題的得分作相關性分析(表4-19),發現受測者如果越是感覺操作流程容易或介面提示充足,其視線停留在顯示畫面的時間會越短,而受試者越是覺得操作介面順眼,視線停留在顯示畫面的比例也會越少;同樣地,這些結果與直覺的認知對於介面越滿意,對其依賴越少、越可以專注於顯示畫面上相違背,說明了使用者主觀的感受與實際操作TRiCmini時的行為表現並不相符。

4-19. 問卷中問題得分與看顯示螢幕百分比相關係數

問題

相關性係數

操作的流程是否容易?

-0.70

操作介面給的提示資訊是否充足?

-0.54

您覺得操作介面看起來順眼嗎?

      -0.70

4.3 近端使用者評估

為瞭解近端使用者的實際應用狀況,本研究設計貼近於TRiCmini一般使用情境亦即談話與情緒展現,觀察近端使用者與之互動的過程,一方面使用問卷蒐集主觀的感受,定義TRiCmini可用性的達成程度,另一方面解讀近端使用者行為背後的涵義,分析其使用TRiCmini的情況與常態,進而找出任何有可能的設計缺陷。根據評估的結果,即可驗證設計概念是否被明確地實現,並作為TRiCmini改善設計的依據。而近端使用者評估所使用的工具與遠端使用者評估相同,故本節中不再贅述。

4.3.1 評估方法與流程

與遠端使用者相比,近端使用者並不需要操作TRiCmini,而是單純與TRiCmini互動及談話,所以本階段的評估重點在於談話品質與TRiCmini給近端使用者的感覺。在設計概念上,希望近端使用者與TRiCmini談話時會感覺到遠端使用者好像「附身」在TRiCmini身上,在自己面前與自己互動一般,這是使用者主觀的感受,屬於可用性五大指標中滿意度的範疇,其任務內容為一段談話;另外為了驗證TRiCmini的情緒表達能力,測試者會操作TRiCmini做出內建的六種情緒動作,讓受測者判斷TRiCmini所表達的情緒為何,最後透過問卷調查其滿意度與主觀感受。此外為了驗證使用者是否感覺到與TRiCmini有眼神接觸,受測者進行談話時將會配戴眼動儀,如果眼動儀資料顯示在談話中受測者視線長期停留於TRiCmini的雙眼,即代表近端使用者確實有跟TRiCmini有眼神的接觸,同時也可以從眼動儀資料中觀察出受測者較常注視的部位,作為TRiCmini外型設計優劣判斷甚至進一步改良的依據。

任務的設計必須考慮產品平時使用的狀況,設計出貼近產品使用情境並展現所有功能的任務,表4-20所示為近端使用者會接觸到的TRiCmini功能與其目的,任務的規劃必須將這些都考慮在內。近端使用者評估的任務分為兩個步驟:首先測試者會與受測者透過TRiCmini進行一段約3~5分鐘的談話,測試者會操作TRiCmini依談話情境變換表情與動作;任務的第二步驟為TRiCmini的情緒展現測試,受測者會有一張擁有12個情緒選項包含6個正確答案以及6個與正確答案相近或容易混淆的情緒的字報如圖4-18所示,測試者依序做出TRiCmini內建的6種情緒動作讓受測者判斷TRiCmini所表達的情緒,在12個選項中選出最合適的告訴受測者。與表4-8對照,圖4-17為任務流程與其對應會接觸的TRiCmini功能。本評估募集50位受測者,評估流程如下:

(1)   受測者填寫問卷的基本資料部份

(2)   測試者幫助受測者配戴眼動儀,並校正眼動儀

(3)   給予受測者情緒選項字報

(4)   啟動側錄攝影機,分別拍攝操作端與受測者(TRiCmini)

(5)   執行任務3~5分鐘的談話

(6)   測試者操作TRiCmini做出6種情緒動作,受測者根據拿到的情緒選項字報,依序選出TRiCmini所表達的情緒

(7)   測試結束,測試者幫助受測者卸除眼動儀

(8)   受測者填寫問卷

4-20. 近端使用者會接觸到的TRiCmini功能與目的

編號

功能

目的

1

聲音談話

談話

2

移動

觀看近端環境情況或尋找近端使用者

3

表情變換

增加談話趣味與真實性

4

情緒動作

增加談話趣味與真實性

4-17. 情緒選項字報

4-18. 近端使用者評估任務流程圖

完整的近端使用者問卷於附件3,問卷中問題結構如圖4-19所示。在基本資料部份,因為受測者是跟機器人進行互動,所以會詢問受測者對一般機器人的認知與感受,另外由於TRiCmini具備通訊的功能,因此也會詢問受測者使用通訊產品的經驗。近端使用者評估的主要目的乃是要瞭解使用者與TRiCmini互動的感受,所以除了基本資料部份外,問卷的問題依據真實人際溝通元素分為兩大部份,分別為語言溝通部份與非語言溝通部份;另外以可用性來說,問卷中問題主要會是關於滿意度與效率兩種,有些問題則會是兩者兼具,圖4-19將滿意度與效率的對應情況列出,問卷中所有的問題皆可幫助測試者更瞭解TRiCmini與近端使用者的互動性以及使用者的感受,實際執行近端使用者評估的情形如圖4-20所示

4-19. 近端使用者評估問卷結構圖

4-20. 近端使用者評估實際情況

4.3.2 評估結果分析

如前所述,近端使用者評估分為談話與情緒判斷測試兩階段,以瞭解使用者與TRiCmini互動時的感受與TRiCmini的情緒展現能力,本節將分析這些資料。

(1)   談話

近端使用者評估的正式測試有50男性29人、女性21參加,平均年齡為21.6歲,背景分佈包括理工38人、人文藝術7人、商管財金4人、資訊1人。受測者的視訊軟體使用程度、對機器人的認知與感受等其他基本資料4-21。本節將會分別探討量化與質化的數據,並分析兩者的相關性,期待能檢視TRiCmini的可用性以及歸納近端使用者的使用特性。

4-21.受測者通訊軟體使用度與對機器人認知情況

您有在使用通話軟體的視訊通話功能嗎?(如MSN ,Skype等)

每天都使用28%

每週一兩14%

每月一兩16%

用過一兩36%

從來沒用過6%

您有在使用手機的視訊通話功能嗎?

每天都使用4%

每週一兩2%

每月一兩2%

用過一兩34%

從來沒用過58%

您是否曾經操作過機器人或與之互動(如談話、分工合作)?

20%

沒有80%

您對機器人的印象是什麼?(請選擇一項最適合的)

真人的替身16%

科技的結晶76%

沒感覺

0%

動漫的角色4%

冰冷的機器4%

您覺得機器人應該是怎麼樣運作的?(請選擇一項最適合的)

依照編輯的程式自己動作36%

根據人的動作隨機應變58%

有一個人在背後操作它6%

您對於「跟機器人互動(如談話、分工合作)」的感覺如何?

很感興趣

30%

有點興趣

66%

沒感覺

4%

勉強可接受0%

完全沒興趣0%

您覺得在您有生之年可能會看到像哆啦A夢、原子小金剛那種像真人一樣的機器人嗎?

一定會14%

很可能58%

不知道18%

不太可能10%

一定不會0%

u        量化指標分析

在近端使用者評估中的量化指標即受測者視線停留於機器人各區域的時間比例。近端使用者評估所收集的影像如圖4-21所示,上方影像以綠色的軌跡點顯示受試者視線停留的位置,下方影像則分別為測試者於遠端的側錄影像受測者與近端的機器人活動狀況側錄,利用行為分析軟體分析影片,即可獲得視線停留於各區域的時間百分比等量化數據,全體受試者的平均數據如圖4-22所示,而以性別分類則如表4-22所示。整體來看,在談話中受測者注視TRiCmini眼睛的比例是最高的,達到65%,表示受測者與TRiCmini談話時是有眼神接觸的,而普通人在實際面對面互動時眼神接觸的比例為60%~75% [Debra, 2002],顯示使用者與TRiCmini互動與真實人際間互動的情形是類似的。如果將資料分類為男性與女性來看,只有在看手的比例方面有顯著差異男性高於女性,但此類的注視佔總體比例僅達1%,幾乎可以忽略,而其餘項目在男女之間皆沒有顯著的差異,表示男女在與TRiCmini互動時的注視習慣幾乎是一樣的。

4-21. 近端使用者評估眼動儀匯出影片畫面與側錄影像

4-22. 受測者視線停留於TRiCmini各個區域的時間百分比

4-22. 男性與女性受測者視線停留於TRiCmini各個區域的時間百分比

注視區域

類別

眼睛

身體

雙手

選項字報

機器人以外區域

男性

62%

11%

4%

1%

4%

18%

女性

67%

 7%

4%

0%

5%

17%

p

0.40

0.13

0.76

0.03*

0.63

0.85

* 具有顯著差異(p<0.05)

u        質化指標分析

質化指標是透過問卷調查瞭解受試者使用TRiCmini後的主觀感受,近端使用者評估主要是想瞭解受測者與TRiCmini的互動是否貼近人類實際面對面的互動,同時也想瞭解TRiCmini的可用性(主要為效率與滿意度),所以問卷依據語言、非語言溝通與其他三部份來命題(如圖4-17所示)。

首先根據問卷的基本資料部份來比較問卷整體的得分,發現到受測者使用視訊通訊軟體或設備的程度與問卷各題得分的相關性皆不顯著,也就是說使用視訊通訊軟體或設備的程度不會影響使用者使用TRiCmini的滿意度與效率。探討受測者對機器人認知對使用TRiCmini的影響,對於機器人的認知本問卷將受測者分成三大類,分別為認為機器人是依照編輯的程式自己動作、認為機器人是根據人的動作隨機應變、認為機器人是有人在背後操作它,發現有問卷中有2題的得分在這三類受測者中有顯著的差異(如表4-23),T檢定的結果則如表4-24所示,可以發現相對於認為機器人「會依照編輯的程式自己動作」與認為機器人「是根據人的動作隨機應變」的受測者,認為機器人是「有人在背後操作」的受測者則對於TRiCmini的安全性較不信任,但是對於購買TRiCmini的意願則明顯高出許多,這可能是因為TRiCmini的工作模式與其對機器人的認知互相符合。探討受測者對機器人的認同如機器人與人類的相似度、機器人未來的發展、對與機器人合作的興趣等對於使用TRiCmini的主觀感受之影響,皆沒有發現顯著的相關,也就是說使用者印象中對於機器人的認同並不會影響實際使用TRiCmini的感受。

4-23. 於對機器人認知中有顯著差異的題目與得分

對機器人的認知類別

顯著差異的題目

第一類平均得分

第二類平均得分

第三類平均得分

TRiCmini在移動時,您是否擔心TRiCmini會撞到您?(得分越高表示越不擔心)

4.1

4.1

3.0

如果TRiCmini成為商品上市,您會願意購買嗎?(得分越高表示越願意購買)

2.8

2.9

4.0

4-24. 三類機器人認知於顯著差異2題中互相計算的p

類別的比較

顯著差異的題目

第一類與第二類

第一類與第三類

第二類與第三類

TRiCmini在移動時,您是否擔心TRiCmini會撞到您?(得分越高表示越不擔心)

0.96

0.05*

0.05*

如果TRiCmini成為商品上市,您會願意購買嗎?(得分越高表示越願意購買)

0.69

0.05*

0.04*

* 具有顯著差異(p<0.05)

接下來將針對TRiCmini本身規格、功能性與設計概念挑出重要的題目來討論,首先就硬體規格來看,如圖4-23所示,受測者對於TRiCmini的速度最為滿意,另有小部份的人認為TRiCmini有點重;超過一半的受測者認為TRiCmini大小適中,但是也有40%的人認為TRiCmini有點小,這最主要是因為在使用時TRiCmini是在地板上活動,這些人覺得低著頭與其談話時間久了會感到不適。就性別的影響來看,如表4-25所示,男性跟女性在TRiCmini速度與大小的感受上是差不多的,但在重量方面,因為女性本身的力量較男性來得小,所以有較高比例的人覺得TRiCmini稍微重些,因此未來改良時可以考量再減輕TRiCmini的重量,讓女性也可以輕鬆拿起。

4-23. 受測者對TRiCmini規格的感受

4-25. 男性與女性對TRiCmini規格的感受

題目

您覺得TRiCmini在移動時,速度是否適當?

答案

太慢

有點慢

適中

有點快

太快

男性

0%

7%

86%

7%

0%

女性

0%

4%

86%

10%

0%

答案

您覺得TRiCmini的重量如何?

等級

太輕

有點輕

適中

有點重

太重

男性

0%

10%

66%

24%

0%

女性

0%

 0%

62%

38%

0%

題目

您覺得TRiCmini的大小尺寸如何?

答案

太小

有點小

適中

有點大

太大

男性

0%

41%

55%

4%

0%

女性

0%

38%

62%

0%

0%

接著來看受測者對於TRiCmini的感受(圖4-24),大部分的受測者都不擔心會被TRiCmini撞到,表示TRiCmini的安全性是被信任的。此外,受測者並沒有覺得TRiCmini安靜,這是因為TRiCmini身上設置的兩個散熱風扇會發出些許噪音,未來改良時應試圖改變TRiCmini的散熱方式或換置更安靜的風扇。對於TRiCmini的外表,大部分的受測者覺得可愛並且也喜歡整體的外型,基本上越覺得TRiCmini可愛的受測者也會越喜歡TRiCmini的整體造型(兩者的相關係數為0.75),而在整體趨勢上也發現,越喜歡TRiCmini外表的受測者對於TRiCmini的整體滿意度也會越高(兩者相關係數為0.53)。就性別來看,如表4-26所示,男女之間對於TRiCmini的安全性感受差異是接近顯著的(p=0.09),女性會比男性更擔心TRiCmini會撞到自己;另外對於TRiCmini是否可愛的感受上,男女之間有顯著的差異(p=0.01),女性明顯比男性覺得TRiCmini可愛,至於TRiCmini是否安靜的感受,男女之間並沒有顯著差異(p=0.39)

4-24. 受測者對TRiCmini的感受

4-26. 男性與女性對TRiCmini的感受(滿分為5分)

題目

TRiCmini在移動時,您是否擔心TRiCmini會撞到您?

(得分越高表示越不擔心)

性別

男性

女性

平均得分

4.2

3.8

題目

整體而言,TRiCmini本身發出的聲音(不包括對方說話的聲音)是否吵雜?(得分越高表示越感覺安靜)

性別

男性

女性

平均得分

3.1

3.0

題目

您感覺TRiCmini看起來可愛嗎?(得分越高表示越感覺可愛)

性別

男性

女性

平均得分

3.9

4.4

題目

您喜歡TRiCmini的整體造型嗎?(得分越高表示越喜歡)

性別

男性

女性

平均得分

3.8

4.0

TRiCmini主要的功能是用於溝通互動,而如前所述,人類的溝通互動包含了語言溝通與非語言溝通兩種形式,以下將分別討論。先就TRiCmini語言溝通的功能來看,如圖4-25所示,對於音量大小大的部分受測者都可以接受,但是還是有22%的受測者覺得太小聲;另外也有許多受測者反應喇叭有過多的雜音或音質不清楚,未來改良時可能需要更好的播音裝置讓談話可以更為流暢。觀察性別的差異,如表4-27所示,男女在音量感受的差異極接近顯著水準(p=0.07),女性感覺聲音適中的比例高於男性,這是因為女性的聽力本身就優於男性【行政院勞工委員會,2000

4-25. 受測者對TRiCmini語言溝通功能的感受

4-27. 男性與女性對TRiCmini語言溝通功能的感受(滿分為5分)

題目

您覺得談話的音量大小如何?

答案

太小聲

有點小聲

適中

有點大聲

太大聲

男性

0%

31%

62%

7%

0%

女性

0%

10%

86%

4%

0%

題目

整體而言,透過TRiCmini進行談話的時,您聽得清楚對方的聲音嗎?(得分越高表示聽得越清楚)

性別

男性

女性

平均得分

3.5

3.7

非語言溝通的部份如圖4-26所示,超過一半的受測者覺得TRiCmini的情緒展現是清楚的,並且也認為這些元素對雙方的互動有明顯的幫助,整體趨勢上,受測者如果覺得TRiCmini表情或身體姿態的情緒表現越清楚,就會覺得TRiCmini的情緒表達對雙方互動越有幫助;眼神接觸為另外一個非語言溝通的重要元素,大部分的受測者皆有感受到與TRiCmini有眼神上的接觸,與客觀的數據也就是眼動儀匯出的結果相符合,而受測者對TRiCmini眼神接觸的感覺越高也會覺得TRiCmini的情緒表達對雙方互動越有幫助。探究性別的影響,如表4-28所示,男女對於TRiCmini的表情、身體姿態與眼神接觸的感受皆沒有顯著的差異,所以對TRiCmini情緒表達對於雙方互動是否有幫助的感受也沒有顯著差異。

4-26. 受測者對TRiCmini非語言溝通功能的感受

4-28. 男性與女性對TRiCmini非語言溝通功能的感受(滿分為5分)

題目

您覺得TRiCmini的臉部表情所表達的情緒清楚嗎?

(得分越高表示越清楚)

性別

男性

女性

平均得分

3.5

3.5

題目

您覺得TRiCmini的手部動作與身體移動所表達的情緒清楚嗎?

(得分越高表示越清楚)

性別

男性

女性

平均得分

3.4

3.5

題目

談話時您有沒有感覺到跟TRiCmini的眼神接觸?

(得分越高表示越有感覺)

性別

男性

女性

平均得分

3.5

3.5

題目

您覺得TRiCmini的情緒表達對於雙方的互動有幫助嗎?

(得分越高表示越有幫助)

性別

男性

女性

平均得分

3.9

4.0

TRiCmini的設計概念之一乃是要讓使用者在與操作者互動時可以感受到「操作者有如在自己面前」的感覺,因此TRiCmini設計了表情、情緒動作與具有親和力的外表,期望能夠實現這個概念。在問卷中特別詢問了受測者的此項感受,如圖4-27所示,超過一半的人在與TRiCmini互動時會有「遠端操作者好像在面前」的感覺,代表此設計概念是有正確被實現的,而越有此種感受的受測者,對於TRiCmini的整體滿意度亦會越高(兩者相關係數為0.5)。探討性別的影響,如表4-29所示,男女間對於互動時是否感覺到「遠端操作者好像就在面前」的感受並沒有顯著的差異(p=0.93)

4-27. TRiCmini互動時是否會覺得操作者如在面前與自己互動的感受

4-29. 男性與女性對TRiCmini非語言溝通功能的感受(滿分為5分)

題目

TRiCmini互動時,您會感覺遠端的操作者好像就在您面前跟您互動嗎?(得分越高表示越有感覺)

性別

男性

女性

平均得分

3.4

3.4

最後為受測者的使用意願與購買意願如圖4-28所示,受測者並沒有明顯感覺TRiCmini比傳統的通訊產品更實用,導致其使用意願與購買意願皆不高,而且受測者平均只願意花5,000~10,000元來購買TRiCmini,遠低於目前TRiCmini的製作成本約為30,000,與遠端使用者評估的結果有所差別,近端使用者的分數皆較遠端使用者來得低,表示TRiCmini對於近端使用者的吸引力不如遠端使用者,未來必須要更加提高TRiCmini的商品價值,並且致力於減低其成本,此外如表4-30所示,男性與女性的近端使用者在使用意願與購買意願方面並沒有顯著的差異。

4-28. 受測者的使用意願與購買意願

4-30. 男性與女性的使用意願與購買意願(滿分為5分)

題目

與傳統影像通訊產品相比,您覺得TRiCmini的互動通訊如何?

(得分越高表示TRiCmini越實用)

性別

男性

女性

平均得分

3.0

3.1

題目

如果您擁有TRiCmini後,您會常常使用它嗎?

(得分越高表示越常使用)

性別

男性

女性

平均得分

3.0

3.1

題目

如果TRiCmini成為商品上市,您會願意購買嗎?

(得分越高表示越願意購買)

性別

男性

女性

平均得分

3.0

3.0

題目

您會願意花多少錢購買TRiCmini

(得分越高表示願意花得價錢越高)

性別

男性

女性

平均得分

2.0

2.1

u        量化與質化指標比較

將問卷調查的主觀質化指標與眼動儀數據的客觀量化指標對應分析,發現問卷中各問題得分與受測者視線停留於TRiCmini各個區域的時間百分比之間均沒有明顯的相關性,但趨勢仍符合預期,例如「對TRiCmini的整體滿意度」、「對TRiCmini的效率感受」與「受測者觀看機器人以外區域的時間百分比」的相關係數分別為-0.09-0.32,表示不專心的程度越高,滿意度與效率則越低,雖然趨勢正確負相關,但相關性不高,整體而言,受測者客觀的行為並不會受到其主觀感受太大的影響。

(2)   受測者對TRiCmini情緒的判斷測試

在近端使用者評估中除了讓受測者與TRiCmini談話外,還讓受測者進行對TRiCmini情緒動作的判斷測驗,測試者會操作TRiCmini依序做出六種不同的情緒動作,受測者須由一張選項字報(圖4-17)中選出所感受到的情緒並告訴測試者,藉此來測試TRiCmini情緒展現的能力。首先,從受測者接受表情判斷測試時視線停留於TRiCmini各區域時間的百分比來看4-31,除了觀看選項字報以挑選選項外,受測者的視線多集中於TRiCmini的眼睛,表示使用者判斷TRiCmini情緒時的基準仍以TRiCmini的臉部表情為主。各種情緒辨識的結果則如圖4-29所示,受測者對於高興、生氣、難過三種情緒動作的辨識率相當高,皆超過了80%,高興甚至達到100%,而驚訝也有50%以上的辨識率,但是受測者對於厭惡與害怕兩個情緒動作的辨識率相當低;對照相關文獻的研究結果(表4-32), TRiCmini於高興、生氣、難過三種表情的辨識率比其他機器人來得優秀,但是驚訝、厭惡、害怕三種情緒的辨識率較低,受測者會把TRiCmini的厭惡與害怕、無辜搞混,將害怕與厭惡、想睡混淆,說明整體的情緒展現尤其是驚訝、厭惡、害怕三種表情是需要被檢討的,這結果也反應在受測者對於TRiCmini情緒動作的感受4-30,受測者認為害怕、厭惡、驚訝三種情緒動作需要改進的比例遠高於其他三個情緒動作。另外值得注意的是,大部份的受測者都覺得厭惡是在談話中不需用到的情緒4-30,所以在未來改良時可將此類受測者認為不需要的情緒去除,避免製造混淆。

4-31. 情緒判斷測試時受測者視線於TRiCmini各區域停留時間的百分比

注視區域

眼睛

身體

雙手

選項字報

機器人以外區域

時間百分比

49%

3%

2%

0%

42%

4%

4-29. TRiCmini情緒判斷測試結果

4-30. 受測者對TRiCmini情緒動作的感受

4-32. TRiCmini與文獻中各機器人的表情辨識率

機器人

 

 

 

 

 

 

 

 

 

情緒

TRiCmini

 

 

Probo

[Jelle et al., 2010]

Kismet [Breazeal, 2002]

Eddie [Sosnowski et al., 2006]

Feelix [Canamero et al., 2000]

高興

100%

100%

82%

58%

60%

生氣

92%

96%

76%

54%

40%

難過

84%

87%

82%

58%

70%

驚訝

54%

70%

82%

75%

37%

害怕

22%

65%

47%

42%

16%

厭惡

14%

87%

71%

58%

N/A

(3)   針對高齡者的近端使用者評估

為了實際暸解高齡者的使用狀況,另募集了7位高齡者參加近端使用者的評估,平均年齡為65.3歲,受測者的視訊軟體使用程度、對機器人的認知與感受等其他基本資料如表4-33所示。

4-33. 高齡受測者通訊軟體使用度與對機器人認知情況

您有在使用通話軟體的視訊通話功能嗎?(如MSN ,Skype等)

每天都使用29%

每週一兩0%

每月一兩0%

用過一兩14%

從來沒用過57%

您有在使用手機的視訊通話功能嗎?

每天都使

0%

每週一兩0%

每月一兩0%

用過一兩0%

從來沒用過100%

您是否曾經操作過機器人或與之互動如談話、分工合作

0%

沒有100%

您對機器人的印象是什麼?(請選擇一項最適合的)

真人的替身14%

科技的結晶72%

沒感覺

0%

動漫的角色0%

冰冷的機器14%

您覺得機器人應該是怎麼樣運作的?(請選擇一項最適合的)

依照編輯的程式自己動作29%

根據人的動作隨機應變57%

有一個人在背後操作它14%

您對於「跟機器人互動(如談話、分工合作)」的感覺如何?

很感興趣

14%

有點興趣

43%

沒感覺

29%

勉強可接受0%

完全沒興趣14%

您覺得在您有生之年可能會看到像哆啦A夢、原子小金剛那種像真人一樣的機器人嗎?

一定會14%

很可能72%

不知道0%

不太可能0%

一定不會0%

4-34為高齡受測者與年輕受測者視線停留於TRiCmini各區域的時間百分比,可以發現高齡受測者視線停留於TRiCmini眼睛的百分比較年輕受測者高,所以問卷中詢問是否有眼神接觸的題目得分高齡受測者(3.6)也高於年輕受測者(3.5)

4-34. 高齡受測者與年輕受測者視線停留於TRiCmini各個區域的時間百分

注視區域

類別

眼睛

身體

雙手

選項字報

機器人以外區域

高齡受測者

77%

2%

0%

0%

4%

17%

年輕受測者

65%

9%

4%

1%

4%

17%

接下來檢視使用者的主觀感受,問卷中詢問「您覺得TRiCmini的臉部表情所表達的情緒清楚嗎?」,高齡受測者的得分為2.3分,年輕受測者的得分為3.5分兩者具有顯著差異(p=0.00),可以發現高齡受測者對於TRiCmini的表情判讀能力遠低於年輕的受測者;接下來再詢問「您覺得TRiCmini的情緒表達對於雙方的互動有幫助嗎?」時高齡者的分數(3.3)也低於年輕受測者(3.9),而整體的效率與滿意度得分也都是呈現高齡者較低的現象,這主要是因為TRiCmini的溝通功能對於高齡的受測者稍嫌不足,在語音溝通方面因為高齡者的聽力較弱導致聽不清TRiCmini的聲音。在非語言溝通方面,高齡受測者認為TRiCmini的情緒展現不夠清楚,可能是因為TRiCmini的表情設計主要是參考卡通漫畫的表現方法,用LED以線條或點的組合以類似表情符號的方式來顯現,而高齡者對於卡通漫畫的接觸程度較年輕受測者來得低,導致對TRiCmini情緒的辨識率低下,未來改良設計時應該讓非語言溝通的表情或姿態可以更接近真實人類才可以使高齡者更容易判讀出TRiCmini的情緒。

4-35為高齡受測者與年輕受測者的使用意願與購買意願得分,可以發現高齡的受測者不管在使用意願或購買意願上皆較年輕的受測者低,這是因為高齡受測者對於TRiCmini的整體滿意度比年輕的受測者低,但是願意出的價錢卻比年輕的受測者高,可能是因為高齡者較少接觸科技產品,對於科技產品的商品價值的認知並不如年輕受測者苛刻。

4-35. 高齡受測者與年輕受測者的使用意願與購買意願得分

題目

與傳統影像通訊產品相比,您覺得TRiCmini的互動通訊如何?

(得分越高表示TRiCmini越實用)

高齡受測者得分:3.5

年輕受測者得分:3.0

題目

如果您擁有TRiCmini後,您會常常使用它嗎?

(得分越高表示越常使用)

高齡受測者得分:3.0

年輕受測者得分:3.1

題目

如果TRiCmini成為商品上市,您會願意購買嗎?

(得分越高表示越願意購買)

高齡受測者得分:2.6

年輕受測者得分:3.0

題目

您會願意花多少錢購買TRiCmini

(得分越高表示願意花得價錢越高)

高齡受測者得分:2.9

年輕受測者得分:2.1

由這些數據看來,高齡使用這與年輕的使用者是有很大的不同的,TRiCmini的客群主要也為高齡者,其設計需要針對高齡者坐進一步改進。在聲音的部份考慮高齡者聽力較弱,喇叭必須更大聲且更清楚,而在情緒展示方面要更貼近真人,如加上眉毛擺動,眼睛大小變化等,讓高齡者也可以簡單瞭解TRiCmini的情緒狀態。

參考資料

行政院勞工委員會勞工安全衛生研究所, 2000, “勞工聽力常模值手冊.

Alfred, L. Y., 1967, “Eye Movements and Vision,” Plenum Press, New York.

Akamai, 2010, http://www.akamai.com/

Breazeal, C., 2002, “Designing sociable robots,” MIT Press, Cambridge.

Canamero, L., and Fredslund, J., 2000, How does it feel? Emotional interaction with a humanoid lego robot.Socially intelligent agents:the human in the loop, AAAI 2000 fall symposium.

Debra, S., 2002, “Under Attack: Dealing with Hostile Questions,” Public Management Magazine, San Francisco.

International Organization for Standardization, 1998, ISO: 9241-11: Ergonomic requirements for office work with visual display terminals (VDTs) -- Part 11: Guidance on usability.

Jelle, S., Kristof, G., Bram, V., Johan, V., and Dirk, L., 2010, “Expressing Emotions with the Social Robot Probo,” Springer Science & Business Media BV 2010.

Nielsen, J., 1994, “Usability Engineering,” Morgan Kaufmann, San Francisco.

Sosnowski, S., Bittermann, A., Kuhnlenz, K., and Buss, M., 2006, “Design and evaluation of emotion-display EDDIE,”  IEEE/RSJ international conference on intelligent robots and systems.