2025年10月9日
ハードウェア
ローカルLLM向けCPU選定|Intel/AMDのAVX-512対応状況と推論速度の比較
ローカルLLMのCPU推論で見落とされがちなAVX-512の対応状況を、IntelとAMDで比較。IntelがAVX-512を実質封印した経緯とAMDの全世代対応を整理し、llama.cppによる実測値をもとに業務向けCPUの選定指針を示します。

概要
ローカルLLMの構築では GPU 性能に注目が集まりがちですが、CPU の命令セット、とりわけ AVX-512 の対応状況が、CPU 推論や前処理のスループットに無視できない影響を与えます。DigitalBaseでは社内AI基盤の構築にあたり多数のCPUを評価してきましたが、ここ数世代の Intel と AMD で AVX-512 への対応方針が大きく分かれている点は、選定時に必ず確認すべきポイントです。
本稿では、Intel が第12世代以降で AVX-512 を実質的に無効化した経緯と、AMD が Zen 4 以降で全コア対応を進めている現状を整理し、llama.cpp による推論速度の実測値をもとに、ローカルLLM用途での CPU 選定指針を示します。
AVX-512とは何か、なぜLLMで重要なのか
AVX-512の基本
AVX-512(Advanced Vector Extensions 512)は、512ビット幅の SIMD 命令セットです。
- 従来の AVX2:256ビット幅
- AVX-512:512ビット幅(2倍)
一度に処理できるデータ量が理論上2倍になるため、行列演算が中心となる LLM 推論で高速化が期待できます。
LLM推論におけるAVX-512の効果
各種の公開ベンチマークでは、AVX-512 対応 CPU は非対応構成と比べて推論速度がおおむね20〜40%向上すると報告されています。特に次のようなケースで効果が顕著です。
- CPU推論:GPUを用いない実行
- 量子化モデル:INT8 / INT4 での計算
- 大規模バッチ処理:複数プロンプトの同時処理
- llama.cpp系ツール:Ollama、LM Studio など
これらはいずれも、機密データをオフラインで扱う社内環境や、GPU を潤沢に確保できない検証フェーズで重要になる要素です。
Intelの現状:AVX-512を実質封印した経緯
第10〜11世代:AVX-512が全コアで利用できた世代
代表的な対応 CPU は以下のとおりです。
- Core i9-10900K(Comet Lake)
- Core i9-11900K(Rocket Lake)
- Xeon W-1300シリーズ
この世代では AVX-512 を全コアで活用でき、CPU 推論のパフォーマンスは良好でした。
第12世代:ハイブリッドアーキテクチャ導入と無効化
Alder Lake(第12世代) から、Intel はハイブリッドアーキテクチャを採用しました。
- P-core(Performance core):高性能コア
- E-core(Efficient core):省電力コア
ここで問題となったのが、E-core が AVX-512 に非対応である点です。P-core は物理的に AVX-512 を備えているものの、E-core との命令セット互換性を保つため、BIOS 側で無効化されました。一部マザーボードでは E-core を完全に無効化することで AVX-512 を有効化できるケースもありましたが、いずれもメーカー非公式の扱いです。
第13〜14世代:物理的に削除
Raptor Lake(第13〜14世代) では、P-core から AVX-512 ユニット自体が物理的に削除され、BIOS 設定による有効化も不可能になりました。対象は Core i9-13900K / 14900K、Core i7-13700K / 14700K など、第13〜14世代の全 CPU です。
Arrow Lake(Core Ultra 200シリーズ)以降
2024年末に登場した Core Ultra 200 シリーズ(Arrow Lake、デスクトップ) およびモバイル向けの Lunar Lake でも AVX-512 は非対応です。Intel は一般向け CPU でハイブリッドアーキテクチャを継続しており、2026年6月時点でもコンシューマ向け CPU での AVX-512 復活は見込み薄です。Xeon などサーバー向け系列では対応が継続している点が、選択肢を分ける一因となっています。
AMDの現状:全世代でAVX-512に対応
Zen 4以降で正式対応
AMD は Zen 4 アーキテクチャ(2022年発売)から AVX-512 を正式にサポートしています。
- Ryzen 7000シリーズ(Zen 4、デスクトップ)
- Ryzen 9 7950X / 7900X
- Ryzen 7 7700X
- Ryzen 5 7600X
- Ryzen 9000シリーズ(Zen 5、2024年〜)
- Ryzen 9 9950X / 9900X
- Ryzen 7 9700X
- Ryzen 5 9600X
- EPYC 9004 / 9005シリーズ(サーバー向け)
- EPYC 9654、EPYC 9755 など
AMDのAVX-512実装の特徴
- 全コアで対応:P-core / E-core の区別がない
- ダブルポンプ方式(Zen 4):物理的には256ビット幅の演算器を用い、2サイクルで512ビット幅を処理。Zen 5 ではネイティブ512ビットのデータパスを備えるモデルもあり、実効性能が向上しています。
- 電力効率:Intel の初期実装に比べ、AVX-512 利用時の発熱・クロック低下が抑えられています。
ピーク性能では旧 Intel のネイティブ AVX-512 に及ばない局面もありますが、実用上は十分な性能を発揮し、世代間で一貫して対応が続いている点が業務利用での安心材料となります。
ベンチマーク:LLM推論速度の実測比較
テスト環境
- モデル:Llama 2 7B(Q4_K_M量子化)
- ツール:llama.cpp
- 条件:CPU推論(GPU不使用)
結果
| CPU | アーキテクチャ | AVX-512 | トークン/秒 | 相対性能 |
|---|---|---|---|---|
| Core i9-11900K | Rocket Lake | ✅ 対応 | 28.5 | 100% |
| Core i9-13900K | Raptor Lake | ❌ 非対応 | 21.2 | 74% |
| Ryzen 9 7950X | Zen 4 | ✅ 対応 | 26.8 | 94% |
| Ryzen 9 9950X | Zen 5 | ✅ 対応 | 29.1 | 102% |
この実測から、次の傾向が読み取れます。
- AVX-512 非対応の Core i9-13900K は、世代の古い i9-11900K より約26%遅い
- Ryzen 9 7950X は AVX-512 対応により、第13世代 Intel より約26%高速
- 最新の Ryzen 9 9950X が今回の比較対象中で最速
CPU 推論を前提とする環境では、世代の新しさよりも AVX-512 の有無がスループットを左右することがわかります。
LLM用途でのCPU選定指針
新規導入:AMD Ryzen 7000 / 9000シリーズ
CPU 推論を含む用途で新規に調達する場合、現時点では AMD Ryzen が有力です。
| モデル | コア / スレッド | 想定用途 |
|---|---|---|
| Ryzen 9 9950X | 16 / 32 | 最高性能。重い CPU 推論・大規模バッチ |
| Ryzen 9 7950X | 16 / 32 | 価格と性能のバランス重視 |
| Ryzen 7 9700X | 8 / 16 | 予算重視、小〜中規模モデル |
価格は市場や時期で変動するため、調達時に最新の実勢価格を確認することを推奨します。いずれも AVX-512 完全対応に加え、PCIe 5.0・DDR5 に対応しており、将来の GPU 拡張やメモリ増設にも対応しやすい構成です。
既存資産を活用する場合:Intel第10〜11世代
すでに保有している、あるいは中古市場で調達する場合、AVX-512 対応の第10〜11世代 Intel は依然として有効な選択肢です。
- Core i9-11900K(中古市場で流通)
- Core i9-10900K
- Xeon W-1390(サーバーグレード)
なお、第12世代の BIOS 改造による AVX-512 有効化は、メーカー非公式かつ保証対象外であり、業務環境では推奨しません。
第13世代以降のIntelをどう扱うか
LLM の CPU 推論性能のみを重視するなら、新規導入では AMD を推奨します。ただし、以下のケースでは第13世代以降の Intel も十分に選択肢となります。
- GPU メインで推論する構成(CPU の影響は限定的)
- ゲーミング性能や Intel 固有機能(QuickSync など)も併せて重視する場合
GPU がボトルネックとなる構成では、CPU の AVX-512 有無による差は小さくなります。
サーバー・ワークステーション向けの選択肢
Xeon Wシリーズ
ECC メモリと大容量メモリ、長時間の安定動作を重視する場合、AVX-512 対応の Xeon W が候補になります。
- Xeon W-1300シリーズ(第11世代ベース)
- Xeon W-2400 / W-3400シリーズ(Sapphire Rapids)
ECC メモリ対応によるデータ信頼性、最大数百GB〜TB級のメモリ搭載、長時間運用での安定性が利点です。一方で価格が高く、クロック周波数が低めで、対応マザーボードも高価という点には留意が必要です。
EPYC(サーバー向けAMD)
最大コア数とメモリ帯域を重視する大規模用途では、EPYC 9004 / 9005 シリーズが選択肢になります。多コア・AVX-512 対応・広大なメモリ帯域を備え、CPU 推論や大量の前処理を並列にさばく構成に向きます。中古市場で旧世代 EPYC が安価に流通することもあります。
実践:AVX-512の有効化確認と最適化
llama.cppでの確認
# AVX-512が使用されているか確認 ./llama-cli --version # 出力例(AVX-512対応時) AVX = 1 | AVX2 = 1 | AVX512 = 1 | AVX512_VBMI = 1 | AVX512_VNNI = 1
AVX512_VNNI が有効であれば、INT8 演算がハードウェア支援を受けられます。
Ollamaでの確認
Ollama は AVX-512 を自動検出して利用しますが、起動ログで対応状況を確認できます。
# サーバーを起動し、ログに "AVX512" が表示されればOK ollama serve
量子化形式の選択
AVX-512 環境、特に VNNI 対応の構成では INT8 量子化(Q8_0) が高い実効性能を発揮します。
# Q8_0(INT8量子化)モデルの利用例 ollama run llama3.1:8b-instruct-q8_0
Q4 / Q5 と比べて精度低下が小さく、AVX-512 / VNNI の恩恵を受けやすい組み合わせです。精度を重視する社内ナレッジ検索や RAG の回答生成では、Q8_0 を基準に評価することを推奨します。
CPUアーキテクチャ別の推奨度
| CPU世代 | AVX-512 | LLM推奨度 | コメント |
|---|---|---|---|
| Intel 10〜11世代 | ✅ | ⭐⭐⭐⭐ | 中古ならコスパ良好 |
| Intel 12世代 | △ | ⭐⭐ | BIOS改造は非推奨 |
| Intel 13世代以降 | ❌ | ⭐⭐ | GPU併用なら実用上問題なし |
| AMD Ryzen 7000 | ✅ | ⭐⭐⭐⭐⭐ | バランスに優れる |
| AMD Ryzen 9000 | ✅ | ⭐⭐⭐⭐⭐ | 現行で最速クラス |
用途別の推奨
- 完全CPU推論(GPU不使用):AMD Ryzen 9 7950X / 9950X
- GPU併用が前提:Intel / AMD いずれも可(GPUがボトルネック)
- 予算最重視:中古の Core i9-11900K / Ryzen 9 7900X
- サーバー用途(ECC必須):Xeon W / EPYC
今後の展望
IntelのAVX-512復活の可能性
2026年6月時点では、コンシューマ向けでの復活は見込み薄です。ハイブリッドアーキテクチャの継続とモバイルでの省電力重視が背景にありますが、サーバー向け Xeon では対応が継続しています。加えて、AI PC 向けの専用 NPU 搭載が進んでおり、軽量推論では AVX-512 への依存度が相対的に下がる流れもあります。
AMDの優位性
CPU 推論を重視する用途では、当面 AMD 優位が続くと見られます。Zen 5 までで全世代対応が一貫しており、3D V-Cache 搭載モデルの拡充やデータセンターでのシェア拡大も追い風です。次世代 Zen でも AVX-512 対応が維持される見込みです。
確認コマンド
# Linux:AVX-512対応確認 lscpu | grep avx512 cat /proc/cpuinfo | grep avx512
# Windows(PowerShell):プロセッサ情報の確認 Get-CimInstance Win32_Processor | Select-Object Name, Description
より詳細な確認には CPU-Z や HWiNFO などのツールが有用です。
まとめ
ローカルLLMを CPU 推論や前処理を含めて運用する場合、AVX-512 の対応状況は CPU 選定における重要な判断軸です。Intel が第13世代以降で AVX-512 を物理的に削除した一方、AMD は Zen 4 以降で全世代・全コア対応を継続しており、llama.cpp の実測でもこの差がスループットに表れています。
新規導入であれば AMD Ryzen 7000 / 9000 シリーズが第一候補、GPU 併用構成なら Intel も実用上問題なし、ECC が必須なら Xeon W / EPYC、というのが本稿の選定指針です。ハードウェアの世代やコア数だけでなく、命令セットの対応状況まで踏み込んで評価することが、安定したローカルAI基盤の前提となります。
