Skip to main content

AIモデルについて

AIモデルは、それぞれ特定の知識や学習データに特化して訓練されているため、用途に応じて様々な種類があります。
LLM(大規模言語モデル)の主な用途別モデル分類と特徴を解説します。

1. 汎用モデル(General-Purpose Models)🤖

最も一般的で、幅広いタスクに対応できる万能型のモデルです。初めてローカルLLMを試す人に最適です。

モデル例特徴と用途
Mistral非常にバランスが良いモデル。軽量(7B, 8Bなど)でありながら高い推論能力を持ち、チャット、要約、ブレインストーミングなど、日常的な多くのタスクで高性能を発揮します。
Llama (Llama 2, Llama 3)Meta社が開発したモデルで、オープンソースLLMの定番。長文の理解力や知識量が豊富で、汎用的な対話や文章生成に優れています。
GemmaGoogleが開発したモデル。特に倫理的な応答や安全性の担保に重点を置いており、汎用的な質問応答や情報検索に適しています。

2. 専門分野特化モデル(Specialized Models)🧑‍💻

特定の分野の知識やスキルを集中的に学習しており、その分野では汎用モデルより高い精度を発揮します。

a. コーディング特化モデル

プログラミングのコード生成、デバッグ、コードの解説などに特化したモデルです。

モデル例特徴と用途
Code LlamaLlamaをベースに、プログラミング言語の大量のコードで再学習されたモデル。コードの補完、バグの特定、新しい機能のコード生成など、開発支援に特化しています。
DeepSeek-Coder推論能力とコード生成のバランスが取れたモデル。様々なプログラミング言語に対応し、複雑なロジックを必要とするタスクに強いです。

b. 日本語特化モデル

英語圏のモデルをベースに、日本語のテキストで追加学習を行い、日本語での自然さ、正確さ、文化的な理解度を高めたモデルです。

モデル例特徴と用途
ELYZA-Llama日本の企業がLlamaをベースに日本語チューニングしたもの。日本語でのビジネス文書作成、会話、要約などで、海外のモデルよりも違和感のない応答が期待できます。
Qwen中国アリババ社が開発した多言語モデルですが、高い推論能力と強力な日本語性能を持ち、汎用的なタスクで活用されます。

3. マルチモーダルモデル(Multimodal Models)🖼️

これはテキストだけでなく、**画像や音声などの異なるデータ形式(モーダル)**を扱えるように設計されたモデルです。

モデル例特徴と用途
LLaVA画像と言葉を同時に扱うモデル。画像を入力として与えると、その画像の内容を認識し、「この画像は何ですか?」「この画像について詳しく説明して」といった質問に答えてくれます。
Moondream軽量で高速な画像認識モデル。特に画像からキャプション(短い説明文)を生成するタスクに優れています。

モデル選びのポイント

Ollamaでは、これらのモデルを簡単に切り替えて試すことができます。

  1. まずは「Mistral」や「Llama 3」などの汎用モデルで、ローカルLLMの基本的な応答速度や性能を体感するのがおすすめです。
  2. その次に、特定の用途(例:プログラミングの効率化)が見えてきたら、Code Llamaなどの特化モデルに挑戦してみると良いでしょう。