LogoLogo
註冊/登入
  • 使用者手冊
  • 技術人員手冊
  • API 文件
  • AI 助理市集
  • 歡迎來到 MaiAgent
  • 生成式 AI 快速入門
    • 大型語言模型(LLM)
    • RAG 知識庫檢索系統
    • Embedding 模型
    • Reranker 模型
    • Parser 解析工具
    • 圖像辨識支援
    • 使用環境規劃(SaaS/私有雲/地端)
    • GPU 算力硬體規劃
  • 進階生成式 AI 技術
    • Text to SQL
    • Function Calling
    • Canvas
    • AI 安全防護機制
  • AI 助理模組
    • 角色指令
    • 知識庫
    • FAQ 常見問題管理
    • 回覆評估與監測結果
    • AWS Guardrails
  • API 串接
    • 快速上手
    • AI 助理列表
    • 對話與訊息回覆(串流/同步)
    • 建立對話與訊息
    • Webhook
    • 檔案上傳
    • 檔案上傳知識庫
    • 附件上傳
  • Line LIFF 串接
    • 什麼是 LINE LIFF
    • 如何串接
  • Remote MCP 串接
    • Remote MCP 服務概述
    • Composio 串接
  • 其他
    • Google Sheet 串接
    • n8n 串接
    • MaiAgent vs. Dify 比較
Powered by GitBook
On this page
  • 查看回覆評估結果
  • 評分指標
  • 分數偏低的原因釐清與解決分法

Was this helpful?

  1. AI 助理模組

回覆評估與監測結果

PreviousFAQ 常見問題管理NextAWS Guardrails

Last updated 5 months ago

Was this helpful?

查看回覆評估結果

AI 助理 → 配置 → 回覆評估

評分指標

MaiAgent 平台提供回覆評估功能,針對每次問答留下紀錄與自動算分,分數包含

指標
描述
影響原因
問題
回覆
檢索上下文
正確答案

誠實性評分(Faithfulness)

LLM 是否有如實的回答,而非自行捏造答案回答

LLM、RAG、知識庫

✅

✅

回答相關性評分(Answer Relevance)

LLM 是否切中要點的回答,是否不完整或包含冗餘文字

LLM、RAG、知識庫

✅

✅

上下文精準度評分(Context Precision)

RAG 檢索的內容是否跟問題相關

RAG、知識庫

✅

✅

回答正確性評分(Answer Correctness)

回覆與正確答案的正確性

LLM、RAG、知識庫

✅

✅

回答相似度評分(Answer Similarity)

回覆與正確答案的語意相似度

LLM、RAG、知識庫

✅

✅

上下文召回率評分(Context Recall)

RAG 檢索的內容與正確答案相比,是否都有檢索出資料

RAG、知識庫

✅

✅

分數偏低的原因釐清與解決分法

  • LLM 能力問題,無法根據參考資料回答問題

    • 解決方法:更換能力更強的 LLM

  • RAG 檢索能力,是否有找到與問題相關的資料

    • 解決方法:聯繫 MaiAgent 官方

  • 知識庫的資料提供是否充足

    • 解決方法:補充正確的知識庫資料與 FAQ 常見問題

MaiAgent 回覆評估頁面
回覆評估指標關係圖