如何使用爬蟲(爬取資料)功能
只要輸入網址,MaiAgent 即可為您將頁面上的文字和連結資料結構化地爬取下來,方便您迅速選取資料匯入知識庫,更快速建立 AI 助理。
功能用途與價值
身為企業人員,可能經常會接到長官指示,需要參考或彙整某些公開網站上的法規資料。
若具備技術背景,或有工程人員協助,或許可以透過撰寫爬蟲程式自動擷取資料;但對於非技術人員而言,通常只能手動一頁頁整理,不僅耗時費力,還容易遺漏關鍵資訊。
此時,您可以善用 MaiAgent 的爬蟲功能,透過 No-Code(免寫程式)方式,快速擷取網站內容,自動建立結構化資料,大幅提升資訊整理效率,將您的時間投入在更高價值的核心業務上。
如何進行爬蟲?
想要建立爬蟲請求,您可以:
建立頁面爬取請求
進入左側功能欄 「AI 功能 > AI 助理 > 爬蟲」 ,點選右上方的 「+建立頁面爬取請求」 按鈕。

輸入網址
輸入您要爬取頁面的網址,並按下 [確認] 按鈕。
請注意,網址不可超過 200 字
若狀態一直未改變,可以按右上角重新整理頁面更新狀態


檢視爬蟲資料
當狀態顯示完成後,點入右方的「匯入」,檢視爬完的資料條目。
選取資料
勾選左方的方塊,選擇您想要匯入知識庫的資料。勾選完畢後再按下 「匯入」 按鈕,資料將會自動匯入到該 AI 助理的知識庫。


在知識庫中就可以看到以 .md 檔呈現的資料,和一般資料一樣可以進行標籤、元資料的設定。

爬蟲使用注意事項
請確保您有權限爬取目標網站內容
建議先測試小範圍資料再進行大量爬取
爬取完成後可透過搜尋測試功能驗證資料品質
定期更新爬蟲資料以保持資訊時效性
最后更新于
这有帮助吗?