AWS Guardrails

AWS Guardrails 防護機制提供可設定的安全措施,協助安全地大規模建置生成式 AI 應用程式。使用自動推理來協助防止幻覺造成的事實錯誤。可封鎖高達 85% 以上不需要和有害的內容。篩選來自擷取增強生成 (RAG) 和摘要使用案例模型的超過 75% 幻覺回應。

AWS Guardrails 功能有

  • 內容篩選(防腥羶色、暴力等)

  • 防止離題

  • 文字獄

  • 機敏資料去除

  • 幻覺防止

操作步驟說明

Step 1: 設定 Config(名稱、描述、若被封鎖了回傳什麼訊息)

他案的設定

Step 2: 設定內容篩選(User Input, Assistant Response)

可以指定危害層級,甚至包含 Image 的傳入

他案的設定

Step 3: 拒絕主題,防止離題

你可以透過新增描述、定義、以及提供範例來防止離題的產生

他案的設定

Step 4: 大興文字獄(禁止罵髒話或是提到 XXX)

例如:不想要模型提到佛地魔,就新增單詞,可支持多個單詞一次傳入(csv, txt, ctrl + c)。

他案的設定

Step 5: 機敏資料(PII)阻擋、正規表達替換

已經預設幾個模式,如:信用卡、車號、身分證字號等等

他案的設定

正規表達替換,可以在 AI 助理的回覆利用想要的正規表達式替換不想要的結構。

Step 6: 防止幻覺,以及以相關性阻擋回覆的 threshold

他案的設定

Last updated

Was this helpful?