> For the complete documentation index, see [llms.txt](https://docs.maiagent.ai/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.maiagent.ai/tech/maiagent-tech-ja/platform-development/gai-lan.md).

# 概要

MaiAgent プラットフォームは SaaS サービスの提供に加え、プラットフォームの自社構築方式（プライベートクラウド、オンプレミス）にも対応しています。MaiAgent プラットフォーム本体は一般的な演算リソースのみを必要とし、GPU サービスは不要です。MaiAgent が利用するモデルサービス（LLM, Embedding Model, Reranker Model）には演算能力が必要となり、クラウド API 推論サービスを利用することも、オンプレミスで GPU を自社構築することも可能です。\\

ハイブリッドクラウドのアーキテクチャを採用することもできます。MaiAgent をオンプレミス（プライベートクラウド、オンプレミス）に、モデルサービス（LLM, Embedding Model, Reranker Model）をクラウドに配置する構成です。MaiAgent はすべてのクラウドサービスプロバイダー（CSP）が提供する LLM, Embedding model, Reranker model に対応しています。将来、データセキュリティの観点やオンプレミスコストの低下により、オンプレミスの演算能力を利用したくなった場合も、即座に切り替えることができます。

## MaiAgent プラットフォーム総覧

**MaiAgent** は、システムのバックエンドからユーザーのフロントエンドまで、あらゆる面をカバーするサービスを提供する完全な生成 AI プラットフォームです。本プラットフォームは拡張可能なマイクロサービスアーキテクチャを採用し、主要なクラウド環境（AWS, GCP, Azure, Oracle）およびオンプレミスの自社構築環境（Docker、K8s）に対応しているため、企業のニーズに応じて柔軟にデプロイできます。

プラットフォームの中核は **Docker** を基盤とし、多様なサービスモジュールを組み合わせて、API、タスクスケジューリング、データ保存、キャッシュ管理、そして管理画面・フロントエンドのアプリケーションまでをカバーしています。その全体設計により、**高可用性、柔軟な拡張性、クラウド横断の統合能力** を確保するとともに、セキュリティと運用保守性も両立しています。

| サービス項目                                          | 用途                                                  | AWS             | GCP                  | Azure                          | VMs                            |
| ----------------------------------------------- | --------------------------------------------------- | --------------- | -------------------- | ------------------------------ | ------------------------------ |
| MaiAgent Server                                 | MaiAgent のコア、API、システム管理画面                           | EKS(Fargate)    | GKE                  | AKS                            | Django on Docker               |
| MaiAgent Worker Server                          | MaiAgent のキュー処理・非同期サービスを担う Worker。特にメッセージのストリーミング出力 | EKS(Fargate)    | GKE                  | AKS                            | Django on Docker               |
| <p>MaiAgent Worker Server<br>(Low-Priority)</p> | MaiAgent のキュー処理・非同期サービスを担う Worker。特に文書のベクトル化        | EKS(Fargate)    | GKE                  | AKS                            | Django on Docker               |
| MaiAgent Admin フロントエンド                          | MaiAgent 管理プラットフォーム                                 | S3 + CloudFront | GCS+Google Cloud CDN | Azure Blob Storage + Azure CDN | Nginx + Static Files on Docker |
| MaiAgent Web Chat フロントエンド                       | MaiAgent ウェブ対話フロントエンド                               | S3 + CloudFront | GCS+Google Cloud CDN | Azure Blob Storage + Azure CDN | Nginx + Static Files on Docker |
| リレーショナルデータベース(RDB) - PostgreSQL                 | MaiAgent の各種データを保存                                  | RDS             | Cloud SQL            | Azure Database                 | PostgreSQL on Docker           |
| ベクトルデータベース(Vector DB) - Elasticsearch           | RAG・記憶機能に必要なベクトルを保存                                 | Elasticsearch   | Elasticsearch        | Elasticsearch                  | Elasticsearch on Docker        |
| 静的ストレージ(Storage)                                | 静的ファイル、静的ウェブページを保存                                  | S3              | GCS                  | Azure Blob Storage             | MinIO on Docker                |
| メモリキャッシュ(Memory Cache) - Redis                  | API キャッシュ、キューイング・スケジューリングサービスのキュー                   | ElastiCache     | Memorystore          | Azure Cache                    | Redis on Docker                |

## モデルサービス

**MaiAgent** プラットフォームは設計上、「**クラウド API 推論サービス**」と「**自社構築 GPU 環境**」の両方に対応しています。

* **クラウド API 推論サービス** では、MaiAgent は各種 LLM、Embedding、Reranker API に直接接続でき、迅速なスケールアウトと動的なトラフィック需要への対応が可能で、実験や迅速なリリースに便利です。
* **自社構築 GPU モード** では、MaiAgent はローカルまたはプライベートデータセンターにデプロイされたモデルサービスに接続でき、GPU リソースを最大限に活用して推論を最適化しつつ、データのプライバシーとコンプライアンスを確保します。

ユーザーはニーズに応じて、柔軟性とコストの間を自由に切り替えることができ、さらに両方の方式を併用することも可能です。これにより **MaiAgent** は、推論とサービス管理を統一する基盤となります。

| <p><br></p>         | クラウド API 推論サービス                                                                      | 自社構築 GPU                                                                                                                        |
| ------------------- | ------------------------------------------------------------------------------------ | ------------------------------------------------------------------------------------------------------------------------------- |
| MaiAgent プラットフォーム対応 | <p>AWS Bedrock<br>Google Vertex AI<br>Azure AI<br>Oracle OCI</p>                     | <p>HPE（Hewlett Packard Enterprise）<br>Advantech（アドバンテック）<br>Cisco（シスコ）<br>Dell（デル）</p>                                          |
| モデル性能               | <p>クローズドソースモデル：高<br>オープンソースモデル：自社構築 GPU と同等</p>                                      | オープンソースモデルのリリース状況に依存                                                                                                            |
| 速度                  | <p>比較的速い<br></p><p>Claude 4 Sonnet: 80 token/s</p><p>Gemini 2.5 Pro: 156 token/s</p> | <p>中程度<br></p><p>Llama3.3 70B<br>- A100: 22.92 token/s<br>- RTX PRO 6000 Blackwell: 73.54 token/s<br>- H200: 145.40 token/s</p> |
| 投入コスト               | <p>Token API 費用<br>(pay-as-you-go)</p>                                               | <p>マシン費用</p><p>サーバールーム費用</p><p>マシンとモデルの運用保守人件費</p><p>マシンの減価償却</p>                                                               |
| Concurrent リクエスト数   | クラウドサービスプロバイダーのサポートに依存                                                               | <p>GPU のスペックと GPU の枚数に依存<br><br>- A100: 1.15 個/枚<br>- RTX PRO 6000 Blackwell: 3.67 個/枚<br>H200: 7.27 個/枚</p>                    |
| データセキュリティ           | データを学習に使用しないことを約束したクラウドサービスプロバイダー（AWS, GCP, Azure, Oracle）を利用                        | 高い機密性、最も安全                                                                                                                      |
| 個人情報の問題             | DLP Server またはサービスを利用して個人情報を除去                                                       | なし                                                                                                                              |

## プラットフォームのデプロイ環境

開発、テスト、本番リリースの各段階における、お客様ごとに異なるニーズを満たすため、当社のソフトウェアプラットフォームは複数の階層化された環境を提供しています。これらの環境を整備することで、開発段階から本番リリースまでのすべてのプロセスを適切に検証・管理できるようにしています。

### 環境アーキテクチャ

当社のプラットフォーム構築は業界のベストプラクティスに従い、お客様のニーズに応じて以下の環境を柔軟に提供します。

| 環境名  | 備考                           | 主な用途      | 特徴                                                |
| ---- | ---------------------------- | --------- | ------------------------------------------------- |
| PROD | 行内                           | 本番環境      | 正式に対外サービスを提供し、実データを使用。高度な安定性とセキュリティが求められる。        |
| UAT  | 行内                           | ユーザー受入テスト | お客様や事業部門による受入を行い、システム機能が要件を満たしているか確認。本番環境に近い構成。   |
| SIT  | 行内（内部システムとの連携が必要となる可能性があるため） | システム統合テスト | 異なるモジュールやサービス間の統合性・互換性を検証。実環境に近いテストデータを使用。        |
| DEV  | 付加機能を行外で開発しスピードを上げる          | 開発テスト環境   | 開発者がプログラム開発と単体テストを行う。モックデータを使用し、更新頻度が高く、エラーを許容する。 |

### 環境の組み合わせ

お客様はプロジェクトの要件に応じて、適切な環境の組み合わせを選択できます。例えば次のとおりです。

* **PROD のみ**：小規模なプロジェクトや、単純にリリースするだけのニーズに適しており、本番環境に直接デプロイします。
* **PROD + UAT**：受入テストが必要なプロジェクトに適しており、機能が要件を満たしていることを確認してからリリースします。
* **フル環境の組み合わせ（DEV + SIT + UAT + PROD）**：大規模または複雑なプロジェクトに適しており、開発、統合テスト、受入の一連のプロセスを経る必要があります。

当社はお客様のニーズに応じて柔軟に構成し、コストと品質の間で最適なバランスを確保します。


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://docs.maiagent.ai/tech/maiagent-tech-ja/platform-development/gai-lan.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.