AWS Guardrails
AWS Guardrails 防護機制提供可設定的安全措施,協助安全地大規模建置生成式 AI 應用程式。使用自動推理來協助防止幻覺造成的事實錯誤。可封鎖高達 85% 以上不需要和有害的內容。篩選來自擷取增強生成 (RAG) 和摘要使用案例模型的超過 75% 幻覺回應。
AWS Guardrails 功能有
內容篩選(防腥羶色、暴力等)
防止離題
文字獄
機敏資料去除
幻覺防止
操作步驟說明
Step 1: 設定 Config(名稱、描述、若被封鎖了回傳什麼訊息)

他案的設定

Step 2: 設定內容篩選(User Input, Assistant Response)

可以指定危害層級,甚至包含 Image 的傳入


他案的設定

Step 3: 拒絕主題,防止離題


你可以透過新增描述、定義、以及提供範例來防止離題的產生
他案的設定

Step 4: 大興文字獄(禁止罵髒話或是提到 XXX)
例如:不想要模型提到佛地魔,就新增單詞,可支持多個單詞一次傳入(csv, txt, ctrl + c)。

他案的設定
Step 5: 機敏資料(PII)阻擋、正規表達替換
已經預設幾個模式,如:信用卡、車號、身分證字號等等

他案的設定

正規表達替換,可以在 AI 助理的回覆利用想要的正規表達式替換不想要的結構。
Step 6: 防止幻覺,以及以相關性阻擋回覆的 threshold

他案的設定

Last updated
Was this helpful?