digital base
プロダクトドキュメント最新情報コンテンツ会社概要

お問い合わせ

ご質問やご相談など、お気軽にお問い合わせください。

デジタルベース株式会社

〒106-0047
東京都港区南麻布3-20-1 5階

サイトメニュー

  • トップページ
  • プロダクト
  • ドキュメント
  • 最新ニュース
  • 記事一覧
  • 会社情報

お問い合わせ

  • info@digital-base.co.jp

NVIDIA Inception Program / Intel Partner ISV /
NTTPC Innovation LAB / IT導入補助金 対象

© デジタルベース株式会社. All rights reserved.
一覧に戻る

2025年10月9日

·

ハードウェア

·
560 文字

ローカルLLM向けCPU選定|Intel/AMDのAVX-512対応状況と推論速度の比較

ローカルLLMのCPU推論で見落とされがちなAVX-512の対応状況を、IntelとAMDで比較。IntelがAVX-512を実質封印した経緯とAMDの全世代対応を整理し、llama.cppによる実測値をもとに業務向けCPUの選定指針を示します。

ローカルLLM向けCPU選定|Intel/AMDのAVX-512対応状況と推論速度の比較

概要

ローカルLLMの構築では GPU 性能に注目が集まりがちですが、CPU の命令セット、とりわけ AVX-512 の対応状況が、CPU 推論や前処理のスループットに無視できない影響を与えます。DigitalBaseでは社内AI基盤の構築にあたり多数のCPUを評価してきましたが、ここ数世代の Intel と AMD で AVX-512 への対応方針が大きく分かれている点は、選定時に必ず確認すべきポイントです。

本稿では、Intel が第12世代以降で AVX-512 を実質的に無効化した経緯と、AMD が Zen 4 以降で全コア対応を進めている現状を整理し、llama.cpp による推論速度の実測値をもとに、ローカルLLM用途での CPU 選定指針を示します。


AVX-512とは何か、なぜLLMで重要なのか

AVX-512の基本

AVX-512(Advanced Vector Extensions 512)は、512ビット幅の SIMD 命令セットです。

  • 従来の AVX2:256ビット幅
  • AVX-512:512ビット幅(2倍)

一度に処理できるデータ量が理論上2倍になるため、行列演算が中心となる LLM 推論で高速化が期待できます。

LLM推論におけるAVX-512の効果

各種の公開ベンチマークでは、AVX-512 対応 CPU は非対応構成と比べて推論速度がおおむね20〜40%向上すると報告されています。特に次のようなケースで効果が顕著です。

  • CPU推論:GPUを用いない実行
  • 量子化モデル:INT8 / INT4 での計算
  • 大規模バッチ処理:複数プロンプトの同時処理
  • llama.cpp系ツール:Ollama、LM Studio など

これらはいずれも、機密データをオフラインで扱う社内環境や、GPU を潤沢に確保できない検証フェーズで重要になる要素です。


Intelの現状:AVX-512を実質封印した経緯

第10〜11世代:AVX-512が全コアで利用できた世代

代表的な対応 CPU は以下のとおりです。

  • Core i9-10900K(Comet Lake)
  • Core i9-11900K(Rocket Lake)
  • Xeon W-1300シリーズ

この世代では AVX-512 を全コアで活用でき、CPU 推論のパフォーマンスは良好でした。

第12世代:ハイブリッドアーキテクチャ導入と無効化

Alder Lake(第12世代) から、Intel はハイブリッドアーキテクチャを採用しました。

  • P-core(Performance core):高性能コア
  • E-core(Efficient core):省電力コア

ここで問題となったのが、E-core が AVX-512 に非対応である点です。P-core は物理的に AVX-512 を備えているものの、E-core との命令セット互換性を保つため、BIOS 側で無効化されました。一部マザーボードでは E-core を完全に無効化することで AVX-512 を有効化できるケースもありましたが、いずれもメーカー非公式の扱いです。

第13〜14世代:物理的に削除

Raptor Lake(第13〜14世代) では、P-core から AVX-512 ユニット自体が物理的に削除され、BIOS 設定による有効化も不可能になりました。対象は Core i9-13900K / 14900K、Core i7-13700K / 14700K など、第13〜14世代の全 CPU です。

Arrow Lake(Core Ultra 200シリーズ)以降

2024年末に登場した Core Ultra 200 シリーズ(Arrow Lake、デスクトップ) およびモバイル向けの Lunar Lake でも AVX-512 は非対応です。Intel は一般向け CPU でハイブリッドアーキテクチャを継続しており、2026年6月時点でもコンシューマ向け CPU での AVX-512 復活は見込み薄です。Xeon などサーバー向け系列では対応が継続している点が、選択肢を分ける一因となっています。


AMDの現状:全世代でAVX-512に対応

Zen 4以降で正式対応

AMD は Zen 4 アーキテクチャ(2022年発売)から AVX-512 を正式にサポートしています。

  • Ryzen 7000シリーズ(Zen 4、デスクトップ)
    • Ryzen 9 7950X / 7900X
    • Ryzen 7 7700X
    • Ryzen 5 7600X
  • Ryzen 9000シリーズ(Zen 5、2024年〜)
    • Ryzen 9 9950X / 9900X
    • Ryzen 7 9700X
    • Ryzen 5 9600X
  • EPYC 9004 / 9005シリーズ(サーバー向け)
    • EPYC 9654、EPYC 9755 など

AMDのAVX-512実装の特徴

  • 全コアで対応:P-core / E-core の区別がない
  • ダブルポンプ方式(Zen 4):物理的には256ビット幅の演算器を用い、2サイクルで512ビット幅を処理。Zen 5 ではネイティブ512ビットのデータパスを備えるモデルもあり、実効性能が向上しています。
  • 電力効率:Intel の初期実装に比べ、AVX-512 利用時の発熱・クロック低下が抑えられています。

ピーク性能では旧 Intel のネイティブ AVX-512 に及ばない局面もありますが、実用上は十分な性能を発揮し、世代間で一貫して対応が続いている点が業務利用での安心材料となります。


ベンチマーク:LLM推論速度の実測比較

テスト環境

  • モデル:Llama 2 7B(Q4_K_M量子化)
  • ツール:llama.cpp
  • 条件:CPU推論(GPU不使用)

結果

CPUアーキテクチャAVX-512トークン/秒相対性能
Core i9-11900KRocket Lake✅ 対応28.5100%
Core i9-13900KRaptor Lake❌ 非対応21.274%
Ryzen 9 7950XZen 4✅ 対応26.894%
Ryzen 9 9950XZen 5✅ 対応29.1102%

この実測から、次の傾向が読み取れます。

  • AVX-512 非対応の Core i9-13900K は、世代の古い i9-11900K より約26%遅い
  • Ryzen 9 7950X は AVX-512 対応により、第13世代 Intel より約26%高速
  • 最新の Ryzen 9 9950X が今回の比較対象中で最速

CPU 推論を前提とする環境では、世代の新しさよりも AVX-512 の有無がスループットを左右することがわかります。


LLM用途でのCPU選定指針

新規導入:AMD Ryzen 7000 / 9000シリーズ

CPU 推論を含む用途で新規に調達する場合、現時点では AMD Ryzen が有力です。

モデルコア / スレッド想定用途
Ryzen 9 9950X16 / 32最高性能。重い CPU 推論・大規模バッチ
Ryzen 9 7950X16 / 32価格と性能のバランス重視
Ryzen 7 9700X8 / 16予算重視、小〜中規模モデル

価格は市場や時期で変動するため、調達時に最新の実勢価格を確認することを推奨します。いずれも AVX-512 完全対応に加え、PCIe 5.0・DDR5 に対応しており、将来の GPU 拡張やメモリ増設にも対応しやすい構成です。

既存資産を活用する場合:Intel第10〜11世代

すでに保有している、あるいは中古市場で調達する場合、AVX-512 対応の第10〜11世代 Intel は依然として有効な選択肢です。

  • Core i9-11900K(中古市場で流通)
  • Core i9-10900K
  • Xeon W-1390(サーバーグレード)

なお、第12世代の BIOS 改造による AVX-512 有効化は、メーカー非公式かつ保証対象外であり、業務環境では推奨しません。

第13世代以降のIntelをどう扱うか

LLM の CPU 推論性能のみを重視するなら、新規導入では AMD を推奨します。ただし、以下のケースでは第13世代以降の Intel も十分に選択肢となります。

  • GPU メインで推論する構成(CPU の影響は限定的)
  • ゲーミング性能や Intel 固有機能(QuickSync など)も併せて重視する場合

GPU がボトルネックとなる構成では、CPU の AVX-512 有無による差は小さくなります。


サーバー・ワークステーション向けの選択肢

Xeon Wシリーズ

ECC メモリと大容量メモリ、長時間の安定動作を重視する場合、AVX-512 対応の Xeon W が候補になります。

  • Xeon W-1300シリーズ(第11世代ベース)
  • Xeon W-2400 / W-3400シリーズ(Sapphire Rapids)

ECC メモリ対応によるデータ信頼性、最大数百GB〜TB級のメモリ搭載、長時間運用での安定性が利点です。一方で価格が高く、クロック周波数が低めで、対応マザーボードも高価という点には留意が必要です。

EPYC(サーバー向けAMD)

最大コア数とメモリ帯域を重視する大規模用途では、EPYC 9004 / 9005 シリーズが選択肢になります。多コア・AVX-512 対応・広大なメモリ帯域を備え、CPU 推論や大量の前処理を並列にさばく構成に向きます。中古市場で旧世代 EPYC が安価に流通することもあります。


実践:AVX-512の有効化確認と最適化

llama.cppでの確認

# AVX-512が使用されているか確認 ./llama-cli --version # 出力例(AVX-512対応時) AVX = 1 | AVX2 = 1 | AVX512 = 1 | AVX512_VBMI = 1 | AVX512_VNNI = 1

AVX512_VNNI が有効であれば、INT8 演算がハードウェア支援を受けられます。

Ollamaでの確認

Ollama は AVX-512 を自動検出して利用しますが、起動ログで対応状況を確認できます。

# サーバーを起動し、ログに "AVX512" が表示されればOK ollama serve

量子化形式の選択

AVX-512 環境、特に VNNI 対応の構成では INT8 量子化(Q8_0) が高い実効性能を発揮します。

# Q8_0(INT8量子化)モデルの利用例 ollama run llama3.1:8b-instruct-q8_0

Q4 / Q5 と比べて精度低下が小さく、AVX-512 / VNNI の恩恵を受けやすい組み合わせです。精度を重視する社内ナレッジ検索や RAG の回答生成では、Q8_0 を基準に評価することを推奨します。


CPUアーキテクチャ別の推奨度

CPU世代AVX-512LLM推奨度コメント
Intel 10〜11世代✅⭐⭐⭐⭐中古ならコスパ良好
Intel 12世代△⭐⭐BIOS改造は非推奨
Intel 13世代以降❌⭐⭐GPU併用なら実用上問題なし
AMD Ryzen 7000✅⭐⭐⭐⭐⭐バランスに優れる
AMD Ryzen 9000✅⭐⭐⭐⭐⭐現行で最速クラス

用途別の推奨

  • 完全CPU推論(GPU不使用):AMD Ryzen 9 7950X / 9950X
  • GPU併用が前提:Intel / AMD いずれも可(GPUがボトルネック)
  • 予算最重視:中古の Core i9-11900K / Ryzen 9 7900X
  • サーバー用途(ECC必須):Xeon W / EPYC

今後の展望

IntelのAVX-512復活の可能性

2026年6月時点では、コンシューマ向けでの復活は見込み薄です。ハイブリッドアーキテクチャの継続とモバイルでの省電力重視が背景にありますが、サーバー向け Xeon では対応が継続しています。加えて、AI PC 向けの専用 NPU 搭載が進んでおり、軽量推論では AVX-512 への依存度が相対的に下がる流れもあります。

AMDの優位性

CPU 推論を重視する用途では、当面 AMD 優位が続くと見られます。Zen 5 までで全世代対応が一貫しており、3D V-Cache 搭載モデルの拡充やデータセンターでのシェア拡大も追い風です。次世代 Zen でも AVX-512 対応が維持される見込みです。

確認コマンド

# Linux:AVX-512対応確認 lscpu | grep avx512 cat /proc/cpuinfo | grep avx512
# Windows(PowerShell):プロセッサ情報の確認 Get-CimInstance Win32_Processor | Select-Object Name, Description

より詳細な確認には CPU-Z や HWiNFO などのツールが有用です。


まとめ

ローカルLLMを CPU 推論や前処理を含めて運用する場合、AVX-512 の対応状況は CPU 選定における重要な判断軸です。Intel が第13世代以降で AVX-512 を物理的に削除した一方、AMD は Zen 4 以降で全世代・全コア対応を継続しており、llama.cpp の実測でもこの差がスループットに表れています。

新規導入であれば AMD Ryzen 7000 / 9000 シリーズが第一候補、GPU 併用構成なら Intel も実用上問題なし、ECC が必須なら Xeon W / EPYC、というのが本稿の選定指針です。ハードウェアの世代やコア数だけでなく、命令セットの対応状況まで踏み込んで評価することが、安定したローカルAI基盤の前提となります。

DigitalBase データ連携フロー
DigitalBase

社内データを、ネットワーク不要で
“使えるAI”に。

エンタープライズに必要なAI機能を1つに集約した、ライセンス型のオンプレミスLLM基盤。 機密データを外部に出さず、完全オフライン環境で運用できます。

  • ✓ 専用AIチャット / ドキュメントAgent(RAG)
  • ✓ 文字起こし・ベンチマーク測定
  • ✓ 管理者・共有・権限管理機能
無料で試す製品の詳細を見る

資料請求・導入のご相談は お問い合わせ から。

ニュースリリース

最新のお知らせやプレスリリースをご覧いただけます

お知らせ
「AI NATIVE EXPO 2026」(6月10日〜12日 @ 幕張メッセ) に出展いたします
Interop Tokyo 併設の総合展「AI NATIVE EXPO 2026」に出展いたします。社内データを自動連携・加工し、BI・AIエージェントへ繋ぐ一連のフローを展示します。
2026年6月8日
プレスリリースPR TIMES
台湾AIインフラ企業Spingence Technologyと社内データ連携AIプラットフォームを共同開発
4月15日〜17日開催「NexTech Week 2026【春】第10回 AI・人工知能 EXPO」に出展 ~社内データをAIに接続し、業務フローに組み込む企業向けAI基盤~
2026年4月6日
お知らせ
「AI Frontier 2026」にスポンサー出展
AI技術の最前線を発信するカンファレンス「AI Frontier 2026」にスポンサーとして出展いたします。
2026年3月4日
一覧に戻る