跳轉到

建立機器人

登入後,您會來到首頁,這是您的 AI 機器人總覽。所有您具有權限操作的機器人都會以卡片形式在這裡呈現。您可以使用右上角的排序功能,依據建立時間或最近使用日期來快速找到需要的機器人。

您可以點擊特定的聊天機器人進入該機器人進行調整,或是畫面右上角的「新增聊天機器人」開始建立您的單位專屬的機器人。

初始化機器人時,可以根據您創建機器人的目的選擇相對應的機器人指令,可以選擇套用其中一個角色指令後,繼續進行訓練。

加入知識

您可以上傳各類型的資料作為知識來源,系統將根據這些知識來源進行近一步的資料解析。操作步驟如下:

  1. 點擊「知識版本」選單→前往建立知識版本。

  1. 系統將顯示該機器人可讀取的所有知識檔案。

  1. 點擊確定後就可以開始選擇您欲上傳的資料類型(如 PDF、圖片等)。

系統支援資料類型及相關限制

資料類型 支援型態 備註
PDF 檔案 .pdf 支援圖片與表格內容擷取。
Microsoft Word .doc, .docx
Excel 檔案 .xlsx, .xls,.ods 保留表格欄位結構,適合數據查詢與比對。
Office 文件 .ppt,.pptx,.odp,
.doc,.docx, .odt, .rtf, xls, .xlsx, .ods 會自動轉檔成 PDF ,轉檔過程會顯示進度與結果。
保留原始版面,適合簡報與文件歸檔。
圖片檔案 .jpg, .jpeg, .png 支援 VLM 理解圖片內容。
純文字檔案 .txt
標註語言檔案 .md, .html
特殊檔案 依外部 Parse API 而定 支援外部 Parse API 串接,上傳後可把檔案交由外部解析系統處理。
網頁爬蟲 - 網頁需為 http 或 https 開頭,加入此類資料後系統將自動取得網頁的內容。但仍需確保該網頁公開可存取,且無爬蟲相關限制。爬蟲過程會顯示進度與結果。
問答集 - 需上傳資料後才可進行自動生成。

備註:系統並無法解析加密後的檔案,請確保檔案在上傳之前並無相關的加密設定。

CaiGunn Dock 資料解析

資料解析的目的是將您提供的原始資料,拆解並整理成系統能理解的資訊格式,好讓後續的 AI 模型可以進行理解、搜尋、或回答問題。

舉例來說,您上傳了一份產品說明文件(PDF),系統會自動進行以下處理:

  • 將整份文件拆成一段一段的內容(例如一段描述一個功能)

  • 判斷哪些是標題、哪些是內容、表格或圖片

  • 將每一段內容轉換成可讓 AI 理解的格式

而後續當您建立知識版本時,系統會根據您上傳的檔案格式與選擇的模式(高解析或快速模式),產出不同層級的解析結果:高解析資料、低解析資料、標準解析資料。而不同的解析結果會影響機器人回答的準確度與建立速度。以下是各種資料解析結果說明:

選擇「高解析模式」時,系統會對 PDF 與 圖片檔 進行更深入的內容辨識與結構分析,能更完整理解 PDF檔中的表格及圖片檔中的內容。

由於系統需進行更深入的資料解析,處理時間也會相對較長,建立完成後會得到準確度較高的「高解析」知識資料。高解析知識資料在知識版本中會以綠色的圖示來顯示。

若選擇「快速模式」,系統會以較簡化的方式解析PDF與圖片檔,以提升建立速度,因此能在較短時間內完成知識版本建立。

此模式會直接讀取 PDF檔的文字內容以及圖片檔中可辨識的文字,不會針對表格或圖片進行深度分析。因此建立完成後會得到準確度較低的「低解析」知識資料,這可能導致機器人無法正確回覆某些提問。

而若使用高解析模式,但知識資料的品質較差,則可能會影響解析結果,因此也會得到「低解析」知識資料。低解析知識資料在知識版本中會以黃色的圖示來顯示。

若您上傳的檔案不是 PDF 或圖片(例如 TXT、md或html 等文字格式),這類檔案不論使用哪種解析模式,都會以相同的解析方式進行處理,因此建立完成後會得到「標準解析」知識資料。標準解析知識資料在知識版本中會以藍色的圖示來顯示。