Embedding 模型
什麼是 Embedding?
Embedding 就是將複雜的資料(像是文字、圖片等)轉換成一組數字(向量),讓電腦可以更容易理解和處理這些資料。
想像一下,當我們把一個單詞轉換成數字時,這些數字能夠捕捉到這個單詞的意思和它和其他單詞的關聯。例如,單詞 「狗」 和 「貓」 可能會有相似的數字表示,因為它們都是動物。
簡單來說,Embedding 就是把資料 「變成數字」,這樣電腦就能夠進行運算和分析,像是比較單詞的相似度、找出相關的資訊,或者甚至是自動生成內容。Embedding 並不限於單詞,也可以應用於句子、段落、文章,甚至是圖像或視頻等複雜資料。
MaiAgent 上支援的 Embedding 模型
Cohere Embed Multilingual v3.0 (Bedrock)
MaiAgent Embedding(開源)
OpenAI text-embedding-3-Large
特性
性能最高、雲端部署
開源、輕量、客製化程度高
強大語義理解
支援語言
多語言(包括英語、法語、德語、西班牙語、中文等)
主要針對英文,但也支持一些其他語言
多語言,尤其在英語語境下表現強大
部署方式
需要 AWS 基礎設施
可針對需求進行雲端、地端部署
僅支援雲端,資料需要送至 OpenAI
適用場景
資訊檢索、推薦系統、文本分類、翻譯
適合小型任務和基礎應用
資訊檢索、推薦系統
Last updated
Was this helpful?