問答集生成¶

此 API 用於根據指定的 Fileset，自動生成問答集（QA Pairs），並輸出為標準格式的 QA 檔案，供後續人工校對、prompt 測試或模型訓練使用。

系統會根據檔案中的語意段落：

自動擷取可能的問題點（如定義、規則、流程）
為每個段落生成一筆問題與參考答案
統整成 JSON / CSV 等格式，作為一組完整的 QA 集合

curl -X 'POST' \
  'http://127.0.0.1:8000/v1/qa/generate?fileset_id={fileset_id}' \
  -H 'accept: application/json' \
  -H 'Authorization: Bearer <your-api-key>' \
  -H 'Content-Type: application/json' \
  -d '{
    "model_name": "ace-1-24b-reasoning-v1",
    "extract_model_name": "ace-1-24b-reasoning-v1",
    "temperature": 0.7,
    "target_amount": 1,
    "on_oversize": "fail"
  }'

Request Headers¶

Key	Value
Request Method	POST
accept	application/json
Authorization	Bearer

Query Parameters¶

Field	Type	Note	Required
fileset_id	string	uuid	true

Request Payload¶

{
  "model_name": "ace-1",
  "extract_model_name": "ace-1",
  "temperature": 0.7,
  "target_amount": 1,
  "on_oversize": "fail"
}

Field Explanation

Field	Type	Detail	Required
model_name	string	選擇 LLM Model 來產生問答集	false
extract_model_name	string		false
temperature	string	0.0-1.0，控制生成文字「隨機性」	false
traget_amount	float	1~3，用於決定從整個檔案中生成多少 QA Pair。系統會依據每約 500 個字生成一個 QA，並乘上此數值。例如，設定為 1 時，每約 500 字會生成一個 QA Pair。每個檔案最多自動生成 50 個 QA Pair。	false
on_oversize	string	處理段落過長的方式，包含 fail、split，若使用 split 則會將段落分開。	true

¶

Response Body¶

{
  "filename": "QA_b9f375f8-048f-4d5a-a3ec-63b7f062f074.xlsx",
  "bytes": 4925,
  "purpose": "user_data",
  "id": "792b40a2-8128-4a08-b5fc-517f040108fc",
  "metadata": {
    "fail_reason": null,
    "fail_detail": {}
  },
  "created_at": "2025-01-01T01:20:00.000Z",
  "expires_at": null,
  "object": "file",
  "state": "draft",
  "filetype": "string",
  "page_count": 0,
  "failed_page_numbers": [
    0
  ],
  "has_hq_result": true,
  "has_lq_result": true,
  "has_std_result": true,
  "used_quality": "HQ",
  "failed_file_ids": [],
  "error_message": ""
}

Field Explanation

包含「提示詞物件」章節的內容。

Field	Detail
failed_file_ids[]	失敗之檔案唯一鍵列表
error_message	錯誤訊息