如何使用爬蟲(爬取資料)功能

只要輸入網址,MaiAgent 即可為您將頁面上的文字和連結資料結構化地爬取下來,方便您迅速選取資料匯入知識庫,更快速建立 AI 助理。

功能用途與價值

身為企業人員,可能經常會接到長官指示,需要參考或彙整某些公開網站上的法規資料。

若具備技術背景,或有工程人員協助,或許可以透過撰寫爬蟲程式自動擷取資料;但對於非技術人員而言,通常只能手動一頁頁整理,不僅耗時費力,還容易遺漏關鍵資訊。

此時,您可以善用 MaiAgent 的爬蟲功能,透過 No-Code(免寫程式)方式,快速擷取網站內容,自動建立結構化資料,大幅提升資訊整理效率,將您的時間投入在更高價值的核心業務上。

如何進行爬蟲?

想要建立爬蟲請求,您可以:

  1. 建立頁面爬取請求

進入左側功能欄 「AI 功能 > AI 助理 > 爬蟲」 ,點選右上方的 「+建立頁面爬取請求」 按鈕。

  1. 輸入網址

輸入您要爬取頁面的網址,並按下 [確認] 按鈕。

  1. 檢視爬蟲資料

當狀態顯示完成後,點入右方的「匯入」,檢視爬完的資料條目。

  1. 選取資料

勾選左方的方塊,選擇您想要匯入知識庫的資料。勾選完畢後再按下 「匯入 按鈕,資料將會自動匯入到該 AI 助理的知識庫。

如想在同一個頁面瀏覽更多資料條目,可點選右下方的 「10條/頁來擴大瀏覽範圍。

在知識庫中就可以看到以 .md 檔呈現的資料,和一般資料一樣可以進行標籤、元資料的設定。

爬蟲使用注意事項

  • 請確保您有權限爬取目標網站內容

  • 建議先測試小範圍資料再進行大量爬取

  • 爬取完成後可透過搜尋測試功能驗證資料品質

  • 定期更新爬蟲資料以保持資訊時效性

最后更新于

这有帮助吗?