
Claude をローカルで動かせる?|モデル非公開と代替手段
「Claude を自分のパソコンの中だけで動かしたい」「オフラインやプライバシー重視でローカル実行したい」——そう考えて run claude locally と検索する人は少なくありません。結論を先に言うと、Claude というモデルそのものをローカルで動かすことはできません。ただし、ローカルで動くツールである Claude Code を、ローカルの別モデルに接続して使う「現実的な落としどころ」は存在します。本記事では、なぜローカル実行が不可能なのか、何ならローカルで動くのか、そしてニーズ別の代替手段を整理します。
Claude は モデルの重み(ウェイト)が一般公開されていない ため、ChatGPT 同様に完全ローカル/オフラインで推論を走らせることはできません。クラウドの API 経由でのみモデルにアクセスできます。
一方で、ターミナル向けツールの Claude Code はあなたのマシン上で動作 します。動いているのはローカルですが、思考しているモデルはクラウド側にあります。この区別を押さえると混乱しません。
「どうしてもローカルで」という場合は、(1)Claude Code の接続先をローカル LLM(LM Studio / Ollama)に切り替える、(2)オープンウェイトのモデルで代替する、の 2 択が現実解です。前者は LiteLLM などのブリッジで Anthropic 形式の通信をローカルサーバへ橋渡しします。
目次 (8)
結論:Claude のモデルはローカルで動かせない
最初にはっきりさせます。Anthropic は Claude(Opus / Sonnet / Haiku)の モデルウェイトを配布していません。そのため、Llama や Qwen のように重みファイルをダウンロードして自分の GPU で推論する、という使い方はできません。Claude を使う唯一の経路は、Anthropic のクラウド API、もしくは AWS Bedrock・Google Cloud Vertex AI といった提携クラウド経由です。
つまり「Claude をローカルで動かす=オフラインで自己完結させる」という意味であれば、2026 年時点でも答えは No です。この点は複数の解説でも一致しています(Can You Run Claude Locally in 2026?)。「ローカルで動いているように見える」ケースでも、実際の推論はクラウドで行われ、手元のマシンは入出力を中継しているだけ、というのが実態です。
なぜ Anthropic は Claude をオープンにしないのか
「便利なのになぜ公開しないのか」と感じるかもしれません。理由は大きく 2 つあります。
- ビジネスモデルが API 提供である:Anthropic の収益の柱はクラウド API へのアクセス課金です。ウェイトを公開すれば、その瞬間に中核プロダクトがコモディティ化してしまいます。
- 安全性の作り込みを守るため:Claude は学習過程で価値基準(いわゆる Constitutional AI)を組み込んでいます。ウェイトを公開すると、第三者が再学習でその挙動を取り除くことが容易になり、安全設計が崩れます。
この 2 点があるため、近い将来にオープンウェイト版の Claude が出る見込みは薄い、というのが現実的な見立てです。
ただし「Claude Code」はローカルで動く
ここで多くの人が混同するポイントを切り分けます。モデルはローカルで動きませんが、Anthropic 公式のターミナル向けツール Claude Code は、あなたのマシン上でローカルに動作します。
Claude Code はインストールするとシェルから claude コマンドで起動でき、ローカルのファイルを読み書きしながら作業を進めます。ただし「考える」部分はクラウドの Claude モデルに問い合わせています(公式 setup ドキュメント)。
整理すると次のようになります。
- ローカルで動くもの:Claude Code 本体、ファイル操作、コマンド実行
- クラウドにあるもの:Claude モデルの推論(思考・生成)
「Claude をローカルにインストールした」という体験の正体は、この ツールのローカル動作 であって、モデルのローカル実行ではありません。
ワークアラウンド①:Claude Code をローカル LLM に向ける
「どうしてもネットワークの外に出したくない」「API の費用を抑えたい」という場合、最も実用的なのが Claude Code の接続先をローカルのモデルに切り替える 方法です。Claude Code は接続先 URL と認証トークンを環境変数で差し替えられるため、ローカルで立てた OpenAI 互換サーバへ向けられます(Claude Code: Self host model configuration、How to run Claude Code against a free local model)。
基本の流れは次のとおりです。
- ローカルでモデルを起動する:LM Studio または Ollama に、Qwen などのオープンウェイトモデルを読み込んで起動します。
- ブリッジを立てる:LiteLLM をプロキシとして起動します。LiteLLM が Claude Code の送る Anthropic 形式のリクエストを、ローカルサーバの OpenAI 互換形式へ変換します。
- 接続先を差し替える:環境変数
ANTHROPIC_BASE_URLを LiteLLM プロキシの URL に設定し、ANTHROPIC_AUTH_TOKENにはダミー値を入れます。 - 起動して確認する:
claudeを起動し、応答がローカルモデルから返ってくることを確認します。
この構成なら、推論はすべて手元のマシンで完結し、外部にコードを送りません。注意点として、Claude モデルそのものを動かしているわけではないため、複雑な推論や指示の精密な解釈では純正 Claude に劣ります。簡単な編集や定型作業の自動化には十分実用的、という温度感で捉えるのが正しい期待値です。
なお、ローカル LLM の正式サポートは Anthropic への要望としても挙がっており、現状はあくまで非公式の橋渡し構成である点は把握しておきましょう(Feature Request: Support for Self-Hosted LLMs · Issue #7178)。
ワークアラウンド②:オープンウェイトモデルで代替する
「Claude にこだわらず、とにかくローカルで AI を動かしたい」のであれば、最初からオープンウェイトのモデルを使うのが素直です。
- Ollama + Open WebUI:ローカルでモデルを動かし、ブラウザから ChatGPT 風の画面で使えます。システムプロンプトを丁寧に整えると、体感で Claude の 8 割程度の使い勝手になる、という評価もあります。
- LM Studio:GUI でモデルのダウンロードから起動までを完結でき、初学者でも扱いやすい選択肢です。
残る差は、込み入った推論の精度や、不適切な依頼を断る精度といった「学習で作り込まれた部分」に出ます。ここはオープンウェイト側が苦手とする領域で、proprietary な学習の優位が残ります。用途が定型的であるほど、ローカル代替の満足度は高くなります。
セルフホストの公式オプションは「実行環境」だけ
「Anthropic 公式にセルフホストの仕組みがある」と聞くことがありますが、これは モデルのセルフホストではありません。公式が提供するのは、コードを安全に実行するための サンドボックス(実行環境)を自前インフラに置く 仕組みで、推論そのものは引き続きクラウドの Claude が担います(Self-hosted sandboxes — Claude API Docs)。
「実行はローカル、思考はクラウド」という前述の構図がここでも保たれている、と理解すると整理しやすいでしょう。
ニーズ別:あなたが本当に欲しいものは何か
「ローカルで動かしたい」という言葉の裏には、実は別の目的が隠れていることが多いです。目的が分かれば最適解も変わります。
- プライバシー(社外にコードを出したくない):ワークアラウンド①でローカル LLM に向ける、またはオープンウェイトで代替。
- オフラインで使いたい:純正 Claude は不可。オープンウェイトモデルを使う。
- 費用を抑えたい:無料のローカルモデルへの切り替え、もしくは Claude 純正なら Pro / Max の定額プランで使い倒す。
- 手元のマシンで完結する作業環境が欲しい:それは Claude Code のローカル動作で既に実現しています。
「純正 Claude の品質」と「完全ローカル」は両立しません。どちらを優先するかを決める ことが、最初の意思決定になります。
まとめ:ローカル実行の現実的な落としどころ
最後に要点を整理します。
- Claude の モデルはローカルで動かせない(ウェイト非公開、クラウド API のみ)。
- Claude Code はローカルで動く が、思考しているモデルはクラウド側にある。
- どうしてもローカルが必要なら、(1)Claude Code をローカル LLM に向ける、(2)オープンウェイトで代替、の 2 択。
- 公式のセルフホストは「実行環境」のみで、モデルのセルフホストではない。
「Claude そのものをローカルで」という願いは現時点では叶いませんが、「ローカルで完結する作業環境」や「外部に出さない推論」という本来の目的であれば、十分に手が届きます。まずは自分の目的が品質側かローカル側かを見極めてから、上記の選択肢を選ぶのがおすすめです。
WROTE — run-claude-locally