> For the complete documentation index, see [llms.txt](https://docs.maiagent.ai/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.maiagent.ai/tech/maiagent-tech-ja/quickstart/parser.md).

# Parser 解析ツール

### RAG Parser とは？

RAG Parser は、Retrieval-Augmented Generation (RAG) システムにおける重要なステップであり、元データの解析と分割を担当します。Embedding によるベクトル化処理の前段階として、その後のベクトル化と意味検索の基盤を提供するものであり、データ全体の品質と検索効果に決定的な影響を与えます。

<figure><img src="/files/ZMVu3I8vS44MG30jJPta" alt=""><figcaption><p>RAG フロー</p></figcaption></figure>

***

### 一、ドキュメント解析系 Parser

MaiAgent では、PDF、Word、Excel、画像などさまざまなドキュメント形式に対応した4種類のドキュメント解析器を提供しています。

| 機能特性             | MaiAgent Parser（デフォルト） | MaiAgent Parser（Online） | MaiAgent Parser（Offline）              | Vision Parser                      |
| ---------------- | ---------------------- | ----------------------- | ------------------------------------- | ---------------------------------- |
| 価格コスト            | 低                      | 高                       | 中                                     | 高                                  |
| 画像内容の解析効果        | 画像内の文字を解析できません         | OCR のみで画像内の文字を解析できます    | OCR + AI による画像の意味理解                   | AI ビジュアル理解、効果が最も高い                 |
| LLM の使用          | いいえ                    | はい                      | はい                                    | はい                                 |
| 文字解析の効果          | 標準                     | 良好                      | 良好（構造保持が優秀）                           | 良好                                 |
| 表の解析             | ネイティブ抽出                | AI による画像内文字のスマート抽出      | ネイティブな構造保持（最適）、ビジュアル理解に加え画像の静的リソースも含む | AI ビジュアル認識により画像をビジュアル理解した後の文字内容を生成 |
| 解析時間             | 速い                     | 中                       | 遅い                                    | 遅い                                 |
| オンプレミス（ネットワークなし） | 可能                     | 不可                      | 可能、ただし VLM のデプロイが必要                   | 不可                                 |
| 対応フォーマット数        | 22 種類                  | 20 種類                   | 20 種類（OCR は PDF のみ対応）                 | 7 種類                               |

***

### 二、音声テキスト変換系 Parser

MaiAgent では、音声ファイルをテキストに書き起こしてナレッジベースに取り込める4種類の音声テキスト変換解析器を提供しています。

| 機能特性             | Azure Speech | Whisper（Groq） | Whisper（OpenAI） | Whisper（Offline） |
| ---------------- | ------------ | ------------- | --------------- | ---------------- |
| 価格コスト            | 高            | 低             | 中               | 無料               |
| 書き起こし精度          | 高            | 高（large-v3）   | 高（whisper-1）    | 高（ローカルモデルによる）    |
| LLM の使用          | いいえ          | いいえ           | いいえ             | いいえ              |
| 解析速度             | リアルタイム       | 最速            | 中               | ハードウェアに依存        |
| オンプレミス（ネットワークなし） | 不可           | 不可            | 不可              | 可能               |
| 多言語対応            | はい           | はい（自動検出）      | はい（自動検出）        | はい（自動検出）         |
| カスタムプロンプト        | いいえ          | はい            | はい              | はい               |
| VAD 音声検出         | —            | はい            | はい              | はい               |
| データプライバシー        | クラウド（Azure）  | クラウド（Groq）    | クラウド（OpenAI）    | 完全ローカル           |

音声ファイルをナレッジベースにアップロードすると、システムが自動的に音声テキスト変換を行い、書き起こしテキストの閲覧およびダウンロード機能を提供します。

<figure><img src="/files/Y87K8x05dgLeorsZ5t3g" alt=""><figcaption><p>書き起こしテキストの閲覧：タイムスタンプと対応する文字内容を表示</p></figcaption></figure>

<figure><img src="/files/ZystPzbhewUcRQkW9uoz" alt=""><figcaption><p>書き起こしテキストのダウンロード：TXT（プレーンテキスト）と SRT（字幕形式）の2つの形式に対応</p></figcaption></figure>


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://docs.maiagent.ai/tech/maiagent-tech-ja/quickstart/parser.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
