//Logo Image
作者:陳友凡 (2000-12-29);推薦:徐業良 (2000-12-29)
附註:本文為台灣有線視訊寬頻網路發展協進會委託研究計畫「知識服務供給者建立模式之研究」部份成果。

知識文件的建立

知識服務供給者(Knowledge Service Provider, KSP)網站的建構,最重要的工作便是底層「知識文件」的鋪陳,在此「知識文件」定義為包含某種形態的知識、可以獨立存在且被了解的完整文件。本文便以大學實驗室為例,描述知識文件的建立流程。

1. 知識文件建立流程

大學實驗室內部的成員依其對KSP建構知識文件工作的不同,可區分為三類:主管知識文件管理員、及知識產生人員。知識產生人員為所有知識文件的實際撰寫者,基本上包含了實驗室內所有的成員,主管和知識文件管理員亦是知識產生人員之一;知識文件管理員的工作在於將完成的知識文件依固定之格式儲存、命名、並轉換成加以修改以利網路上展現的形式;主管則是組織中要求進行知識文件撰寫,及負責對文件加以審核、推薦的人員。

知識文件建立流程如圖1所示,在組織中不同成員執行工作或研究過程中,許多經驗、知識、和相關的零散文件或記錄,這些文件或記錄平時便以知識文件範本的格式呈現。當此經驗、知識、或相關文件被組織的主管認為對組織有益,便會要求成員進行正式知識文件的撰寫,以保留相關的記錄及供他人參考。文件完成後便會交由組織的主管來進行審核的工作。

1. 知識文件產生的流程

知識文件在經過主管的審核、推薦後,便交由知識文件管理員進行進一步的處理,正式放入KSP的知識文件文案夾(archive)中。此時知識文件管理員的工作包含了(1)為了在網路上展現所必需做的修改和建立連結,(2)PDF檔的製作,(3)文件的分類存放。

2. 知識文件的格式

原始知識文件的製作所使用的是Microsoft Word,知識文件管理員將知識文件轉換成HTMLPDF二種格式的檔案,PDF主要提供使用者下載和提供良好的列印效果,HTML除了是網路上文件的標準格式外,由於其檔案內容均為單純的文字可以降低全文搜尋實作的困難度。

知識文件除了文字本身外須包含有數個組成要素:(1)標題、作者、著作日期,(2)核准者、核准日期,(3)發表附註,(4)此份文件被取閱的次數。Word所轉換的HTML檔案均是利用XML技術來達到在網頁上獲得和Word內相同的顯示效果,雖然利用這個方式製作的HTML檔案均較大,但日後若利用Word來編輯此HTML檔案時其呈現出來的則是原始的Word檔案,也就是這個轉換過程為可逆的。利用Word與其產生的HTML檔案間能夠完全互相轉換的特點可以簡化貯存在磁碟中的檔案類型,並且藉由檔案型式的單純化達到減少存放文件檔案所需的空間。

在前列的4個組成要素中(1)標題、作者、著作日期,(2)核准者、核准日期,(3)發表附註屬於文件內容的一部份,在文件編輯的過程中便已加入,而(4)此份文件被取閱的次數,則必須將計數器手動插入製作∕轉換完成的HTML檔案中,某篇知識文件被取閱的次數可以作為此篇文件價值或重要性的基本指標。

HTML格式的檔案較不能忠實顯現原始文件的格式,為了便利檔案的傳播和保全,KSP的知識文件均會製作成“PDF(Portable Document Format)”的格式提供下載,這個格式的檔案必須利用Adobe公司的Acrobat來製作和檢視,同時此檔案格式亦為目前網路上文件傳播最主要的工具之一。Acrobat本身已和Word整合使得整個知識文件在轉換為PDF的過程中完全是自動完成而不需要使用者的介入。

3. PDF格式的製作

PDF檔案的製作比較單純,在安裝完AcrobatWord工列中“檔案”下拉選單中便會出現“Create Adobe PDF”這個選項,選取後便會出現如圖2的畫面。在此視窗中“Creation options”是唯一需要調整的部分,PDF的製作可藉由二個方式來完成,一個是“PDFWriter”另一個是“Distiller”,其差別如後述。

2. PDFMaker for Microsoft Word 主視窗

PDFWriter製作PDF檔的方式為直接將Word的內容列印成PDF檔案,其優點在於不需作多餘的調整便可有相當好的成果,但相對的PDFWriter不能為PDF文件加上安全功能,同時也無法建立可直接連結的目錄和索引資料,此外其產生的檔案也較大。相較於PDFWriterDistiller控制的項目較繁雜。首先Distiller可以定義製作PDF時所使用的圖片品質字型品質等來控制檔案的大小。另外對於KSP知識文件的製作上Distiller主要提供內容保全的能力。在Distiller的保全選項中可選擇的保全項目有:使用者可否列印可否藉由其他的Acrobat軟體來修改文件使用者可否選取文件中的圖片和文字使用者可否加上或改變文件中的註記或表格區域(圖3)。基於PDF檔案的目的在產生良好且一致的列印效果,製作品質的選擇是使用Acrobat中預設的“PrintOptimized”。這個設定值是針對文字及黑白圖片加強解析度,對於彩色或灰階的圖片則以較低的解析度來縮小檔案大小,另外所有使用到的中文字型都會被含在檔案中以利沒有安裝這些字型的使用者也能看到並列印出正確的結果。

3. Distiller中的保全選項對話框

4. HTML格式的製作

HTML檔案為了整體的表現,必須將原始文件中第一頁的標誌換成如圖4的形式。圖中A部分為縮小的標誌圖片以表示此文件的出處和所有者,B部分為利用網頁計數器來了解此文件被取閱的次數;C部分為PDF檔案的連結。如何在插入新的內容後不致影響到原本HTML所具有可直接轉換回Word文件特性,是此步驟的重點。

4. HTML檔案所需加入的內容

如前所述,Word為了能將其製作的HTML檔轉換回原本的Word文件在HTML檔中加入了許多並無實際功能的XML語法。如後列的程式中其目的為在畫面中顯示實驗室的logo,也就是要被取代以插入計數器等內容的部分。然而每個轉換出來的HTML檔案這部分的程式都不盡相同,因此這個工作仍必須由人工來完成。

<p class=a1><span lang=EN-US><!--[if gte vml 1]><v:shapetype id="_x0000_t75"

 coordsize="21600,21600" o:spt="75" o:preferrelative="t" path="m@4@5l@4@11@9@11@9@5xe"

 filled="f" stroked="f">

 <v:stroke joinstyle="miter"/>

 <v:formulas>

  <v:f eqn="if lineDrawn pixelLineWidth 0"/>

  <v:f eqn="sum @0 1 0"/>

  <v:f eqn="sum 0 0 @1"/>

  <v:f eqn="prod @2 1 2"/>

  <v:f eqn="prod @3 21600 pixelWidth"/>

  <v:f eqn="prod @3 21600 pixelHeight"/>

  <v:f eqn="sum @0 0 1"/>

  <v:f eqn="prod @6 1 2"/>

  <v:f eqn="prod @7 21600 pixelWidth"/>

  <v:f eqn="sum @8 21600 0"/>

  <v:f eqn="prod @7 21600 pixelHeight"/>

  <v:f eqn="sum @10 21600 0"/>

 </v:formulas>

 <v:path o:extrusionok="f" gradientshapeok="t" o:connecttype="rect"/>

 <o:lock v:ext="edit" aspectratio="t"/>

</v:shapetype><v:shape id="_x0000_i1025" type="#_x0000_t75" style='width:255.75pt;

 height:97.5pt'>

 <v:imagedata src="./知識文件格式建立.files/image001.png" o:title="bodmark1"/>

</v:shape><![endif]--><![if !vml]><img width=341 height=130

src="./知識文件格式建立.files/image002.gif" v:shapes="_x0000_i1025"><![endif]></span></p>

手動要加入的內容是由一個二列的表格所組成,左列即圖4中的A部分,右列則分割為上下二行即圖4中的BC。其程式如後:

<table width="400" border="0" cellspacing="0" cellpadding="0" align="center" height="100">

    <tr>

      <td height="100" width="250" rowspan="2"><b><span lang=EN-US style='text-shadow:none'>

<img width=250 height=100 src="<輸入小logo的位置>" ></span></b>

</td>

      <td height="50" width="150" align="center" valign="middle">

<img src="/cgi-bin/InetPub/Scripts/Count.exe?dd=cd|md=5|ft=0|df=<計數器記錄檔>">

</td>

    </tr>

    <tr>

      <td height="50" width="150" align="center" valign="middle">

<a href="<輸入PDF檔的位置>"><font face="Arial, Helvetica, sans-serif">

PDF <輸入檔案大小></font></a>

</td>

    </tr>

</table>

程式中被“<…>”框起來以紅色表示的位置,代表需針對不同檔案作修改的部分,其中除了以橙色表示的部分外均是基本的HTML語法,僅需將其中的文字代換即可。橙色的部分功能為呼叫計數器程式,在此所使用的是Muhammad A. Muquit所撰寫的程式“Count”,版本為2.3。程式中“/cgi-bin/inetPub/Script/Count.exe”為執行檔的位置,其輸出為代表次數的圖片。接在“?”之後則是使用的參數,“dd”代表所要使用的數字圖片形式;“md”用於指定計數計的位數上限,5是其最小值;“ft”為計數器輸出結果的外框大小,其預設值為1,由於在文章中出現外框並不適合因此設為0即沒有外框。“df”用於指定貯存被閱次數的記錄檔,這個檔案為文字型式,當程式執行時被指定的記錄檔會被打開並將其中的數字加1,當這個記錄檔不存在時程式會自動產生一個並由1開始計數。HTML檔案修改要注意記錄檔的檔名是否和其他檔案重覆,造成計數錯誤。

HTML檔編輯完畢後便是將其和相關的網頁面連結。當一份文件剛完成時僅有文件的總表會和其產生連結,這份總表依知識文件基於內容的性質,目前分為“Journal Paper”“Conference Paper”“Academic Thesis”“Project Documents”“Course Materials”“Technical Reports”“Product Manuals”“Others”等共八類,其主要是提供傳統圖書館式的文件管理和取用。其他相關網頁則有負責維護該特定網頁的人員編輯鏈結置所需知識文件,注意在知識文件產生時,通常並不是為了提供特定網頁之內容,而同一份知識文件可能被幾個網頁同時鏈結。

5. 知識文件的儲存和命名規則

知識文件的命名分為前後二個部分,第一個部分是這份文件首次被推薦發表於KSP上的日期,第二個部分為此知識文件的正式名稱。如“(2000-11-04) 聽力防護具配戴舒適性能評估”這個檔案名稱,說明了這份文件是在2000114被推薦發表,文件的題名為“聽力防護具配戴舒適性能評估”讓使用者了解此文件所探討的主題為何。將日期放置在前的主要原因為方便文件管理員整理文件,檔案在顯示時可以依據檔案的名稱來排序,如此愈新的文件便會被排在檔案列表的前端,使得尋找時較為簡易。而在文件總表上檔案的排序也是愈新的檔案會被排在愈前面,以方便使用者快速得到最新的文件。

文件的存放則是依照在文件總表的法則,在存放文件的資料夾下細分有8個資料夾,將不同用途的文件(HTMLPDF檔案)放置於所屬的資料夾中。文件的用途判斷的基本原則,若是在研討會或期刊文件屬於“Conference”“Journal”的類別,主要用於課程中的文件則歸於“Course Material”。碩博士生的畢業論文為“Academic Thesis”,尚未成熟到正式期刊或學術論文之技術報告,則屬於“Technical Report”。在研究計畫或產品開發過程中產生之相關特定技術如程式的撰寫方式儀器的操作方法等,則屬於“Project Document”“Product Manual”,其中文件中僅提到此產品的使用方式時才將其列入“Product Manual”的範圍,其餘和計畫相關的文件均判定為“Project Document”。最後不能被上述7種類型包含的則一律列為“Others”

6. 文件的修改

任何文件都無可避免的需要加以修改,有時是加入新的資料,有時是未被注意到的錯誤,修改時僅需將原本的HTML檔以Word開啓,此時HTML檔案便會回復到標準的Word形態。在利用Word完成所需要做的修改後,重覆之前建立知識文件的流程,並且須在文件的開頭記錄文件被修改的時間及負責修改和核可的人員,但該檔案的名稱並不會由於修改而需做改變,以免影響先前鏈結到此文件的網頁。

7. 問題討論

在整個知識文件的製作流程中幾乎所有的工作都只需利用滑鼠點選按鈕即可完成,唯一需要利用人手動操作的便是HTML檔案的修改。這個工作無法自動化有二個主要的因素,第一個如前所述,對於計數器和PDF檔案連結的插入位置無法正確掌握,由於不明原因Word在產生HTML檔案時不同的檔案間就算是內容相同的部分在HTML檔案內容中也會有些許的不同。第二個問題則是在插入計數器時如何決定該檔案所要使用的資料檔名稱。第二個問題較好解決,只需仿照計數器的原理建立一個資料檔來存放計數器的總數,當新的文件要加入時僅需將這個值加1便可達成。第一個問題的解決則必須要找出Word產生HTML檔案時所利用的基本法則才能解決,這也是整個知識文件建構自動化的關鍵。由圖1我們可以看出在知識文件建立的流程中文件管理員的工作佔了絕大部分,雖然這些步驟所花的時間並不是很多,一名熟練的人員在軟體的輔助下僅需十分鍾便可完成整個流程。但若能將這些工作簡化為幾個按鈕,知識文件轉換的工作會更標準化、更有效率。