id-card證件辨識

使用多模態 AI 辨識身分證等證件圖片,自動輸出結構化 JSON 資料

企業在處理身分驗證、開戶、報到等流程時,經常需要人工逐一輸入證件上的姓名、身分證字號、地址等資訊,不僅耗時且容易出錯。透過 MaiAgent 的多模態 AI 助理,使用者只需上傳證件照片,系統即可自動辨識並輸出結構化 JSON 資料,可直接串接至後續業務系統。

與傳統 OCR 方案相比,MaiAgent 結合大型語言模型的多模態能力,具備以下優勢:

傳統 OCR 引擎
MaiAgent 多模態 AI

版面適應性

需針對每種證件設計模板

自動理解不同證件版面

正反面處理

需分開處理並手動對應

單張圖片即可同時辨識正反面

欄位擴充

需修改程式碼

修改 JSON Schema 即可

部署成本

自建 OCR 服務或購買授權

平台設定,無需撰寫程式碼

錯誤處理

回傳原始文字,需後處理

AI 理解語意,自動修正格式

應用場景

  • 金融業開戶:客戶上傳身分證,自動擷取姓名、證號等資訊填入開戶表單

  • 人資報到流程:新進員工上傳證件,系統自動建檔

  • 醫療掛號:患者上傳健保卡或身分證,自動填入基本資料

  • 政府機關臨櫃:民眾出示證件,即時辨識並帶入申辦表單

解決方案架構

建置步驟

Step 1:建立 AI 助理

  1. 左側選單 → AI 功能AI 助理

  2. 點擊右上角 建立 AI 助理

  3. 填寫基本設定:

欄位
填寫內容

助理名稱

證件 OCR 辨識助理

大語言模型

Gemini 3.1 Flash-Lite(需支援多模態)

建立 AI 助理基本設定
circle-info

選擇大語言模型時,請確認該模型支援多模態(圖片輸入),例如 Gemini 系列。若選用純文字模型,將無法辨識圖片內容。

Step 2:設定回覆模式與 JSON Schema

切換至 回答模式設定 頁籤:

欄位
填寫內容

回答模式

RAG 問答

輸出格式

輸出 JSON 格式

選擇 輸出 JSON 格式 後,在下方的 JSON Schema 欄位中填入以下內容:

JSON Schema 輸出格式設定

Step 3:撰寫角色指令

在同一頁籤的 角色指令 區塊中,填入以下內容:

角色指令設定

點擊 儲存 完成助理建立。

Step 4:測試辨識效果

  1. 進入助理的 測試對話

  2. 上傳一張證件圖片(可同時包含正反面)

  3. 輸入「請辨識這張證件圖片」

  4. 確認回傳的 JSON 結構與欄位內容正確

證件辨識測試結果

使用範例

上傳一張包含身分證正反面的圖片,AI 助理會自動辨識並輸出結構化 JSON:

circle-exclamation

JSON 輸出欄位說明

欄位
型別
來源
說明

document_type

string

正面

證件類型

name

string

正面

持證人姓名

gender

string

正面

性別(男/女)

date_of_birth

string

正面

出生年月日(民國年)

military_service

string/null

背面

役別

place_of_birth

string/null

背面

出生地

id_number

string

正面

身分證統一編號

expiry_or_issue_date

string/null

正面

發證日期

address

string/null

背面

完整住址

API 串接

此助理可透過 MaiAgent API 串接至業務系統,實現自動化證件辨識流程。

呼叫流程

Step 1:上傳圖片取得附件 ID

回傳結果中記下 idtypefilefilename 欄位,下一步會用到。

Step 2:呼叫助理進行辨識

Step 3:解析回傳結果

回傳的 content 欄位即為 JSON 格式的辨識結果:

Python

JavaScript

circle-info

完整範例程式碼請參考 Playma-Co-Ltd/maiagent-api-examplesarrow-up-right

Last updated

Was this helpful?