2025年12月27日

ハードウェア

285 文字

Ollama向けファインチューニング比較: ChatML形式, Gemma形式, Llama形式の差分を解説

Ollamaのファインチューニングにおいて、チャットテンプレートの選択は成否を分ける重要な要素だ。テンプレートが学習時と推論時で一致しないと、モデルは期待通りの出力を返さない。本記事では、主要な3形式（ChatML・Gemma・Llama）の構文を比較し、実装上の注意点を解説。

チャットテンプレートの役割

LLMは本質的に「次のトークンを予測する」モデルであり、会話の役割（user/assistant）を明示的に区別できない。チャットテンプレートは特殊トークンを使い、この区別を可能にする。

テンプレートなしの場合、以下のような曖昧な入力になる：

ユーザー：こんにちは
アシスタント：こんにちは！

「ユーザー：」が入力の一部なのか、ラベルなのか判別できない。特殊トークンによる明確な区切りが必要。

ChatML形式

OpenAIが提唱したフォーマット。現在最も広く採用されている。

構文

<|im_start|>system
あなたは親切なアシスタントです。<|im_end|>
<|im_start|>user
こんにちは<|im_end|>
<|im_start|>assistant
こんにちは！何かお手伝いできますか？<|im_end|>

特徴

: とで各発話を囲む

項目	ChatML	Gemma	Llama 3
開始タグ	`<\|im_start\|>role`	`<start_of_turn>role`	`<\|start_header_id\|>role<\|end_header_id\|>`
終了タグ	`<\|im_end\|>`	`<end_of_turn>`	`<\|eot_id\|>`
アシスタント名	assistant	model	assistant
Systemロール	あり	Gemma 3から	あり
採用モデル数	多い	Gemmaのみ	Llamaのみ
構文の複雑さ	低	低	高

Ollama向けファインチューニング比較: ChatML形式, Gemma形式, Llama形式の差分を解説

チャットテンプレートの役割

ChatML形式

構文

特徴

ご紹介

採用モデル

Python実装例

Gemma形式

構文（Gemma 3）

特徴

Gemma 2以前との違い

Python実装例

Llama形式

Llama 2構文

Llama 3構文

特徴

注意点

3形式の比較

Ollamaでの設定

ChatML（Qwen等）

Gemma

Llama 3

実装上の注意点

学習時と推論時の一致

特殊トークンの確認

改行位置の重要性

まとめ

Ollama向けファインチューニング比較: ChatML形式, Gemma形式, Llama形式の差分を解説

チャットテンプレートの役割

ChatML形式

構文

特徴

ご紹介

LM LIGHTエンタープライズLLM環境の構築

ChatLM共有RAGナレッジアプリ

採用モデル

Python実装例

Gemma形式

構文（Gemma 3）

特徴

Gemma 2以前との違い

Python実装例

Llama形式

Llama 2構文

Llama 3構文

特徴

注意点

3形式の比較

Ollamaでの設定

ChatML（Qwen等）

Gemma

Llama 3

実装上の注意点

学習時と推論時の一致

特殊トークンの確認

改行位置の重要性

まとめ