「コードを書いてもらうだけのツールだよね?」
そう思っていた時期が自分にもあった。でも2026年4月16日にOpenAIが公開した「Codex for (almost) everything」というアップデートを見て、その認識は完全にくつがえった。
今のCodexは、コードを書くだけじゃない。MacのアプリをAIが自分でクリックして操作し、画像を生成して、前回の作業内容を記憶して、次の仕事を自分から提案してくる——そういうツールになっている。
この記事では、今回のアップデートで何が追加されたのかを整理しつつ、Claude CodeやGitHub Copilotとの違い、実際のユースケース、そして使う前に知っておきたい注意点まで丁寧に解説する。
- そもそも「今のCodex」って何者?旧Codexとの混同に注意
- 今回のアップデートで追加された4つの主要機能
- 「記憶」と「継続作業」——日をまたいだ仕事のやり方が変わる
- GitHub Copilot・Claude Codeとの比較——どう使い分けるか
- エンジニア・ビジネスパーソン別の活用シナリオ
- 使う前に知っておきたい注意点
- まず試すならここから——Codex入門ステップ
- まとめ
そもそも「今のCodex」って何者?旧Codexとの混同に注意
まずここで一度整理しておきたい。
「Codex」という名前はもともと、2021年にOpenAIが公開したGPT-3ベースのコード生成モデルのことを指していた。GitHub Copilotの初期バージョンの裏側で動いていたのがこのモデルだ。
今話題になっている「Codex」はまったくの別物。2025年5月に研究プレビューとして登場した、自律型のAIコーディングエージェントのことを指す。名前を使い回しているせいで検索すると情報が混在しがちなので、「旧Codex=コード生成モデル、新Codex=AIエージェント」と頭に入れておくといい。
新Codexの基本設計——「お願いしたら待つ」スタイル
新しいCodexは、GitHub Copilotのようにコードを書きながらリアルタイムで補完してくれるツールではない。
動き方はこうだ。
- 「このバグを直して」「テストを追加して」など、タスクをCodexに渡す
- CodexがクラウドのサンドボックスでリポジトリをCloneして、自律的に作業する
- しばらくして、差分(diff)やPRが届く
- 人間がレビューして承認する
これを「非同期エージェント型」と呼ぶ。タイピングを支援してくれるCopilotとは思想が根本的に違う。「コードを書く人をアシストする」のではなく、「コードを書く作業そのものを委託できる」というイメージだ。
このスタイルが2026年版Codexの出発点なので、ここを押さえた上で今回のアップデートを読むと、何が変わったのかがスッと入ってくる。
今回のアップデートで追加された4つの主要機能
コンピュータ操作(Computer Use)——Codex自身がMacを操れるようになった
今回最も目を引くのが、「コンピュータ操作」機能だ。
MacOSのアプリを、Codexが自分のカーソルで操作できるようになった。画面を見て、クリックして、テキストを入力する——要は、人間がPCを操るのと同じことをAIが代行できる。
しかも複数のエージェントが並列で動ける。Codex-Aが別のタスクを処理している間、Codex-Bが自分の作業の邪魔をしないまま別のアプリを動かせる、という仕組みだ。
エンジニアにとって具体的に便利なのは次のようなシーン。
- APIを持たないGUIのみのアプリに対してテストを走らせたいとき
- フロントエンドの修正後にブラウザで実際の見た目を確認して「このボタン位置がずれてる」を自動で検出させたいとき
- シミュレーター上での動作確認をCodexに任せたいとき
なお、現時点ではmacOS限定。EEA(欧州経済領域)・UK・スイスではまだ利用できない。
アプリ内ブラウザ——ページに直接コメントして指示できる
Codexアプリにブラウザが内蔵された。
これが意外と便利な理由は、ページを見ながら直接コメントで指示を書き込める点だ。たとえばローカルで立ち上げた自分のWebアプリを開いて、「このボタンのデザインをもっと目立たせて」と書き込むと、Codexがその文脈でコードを修正してくれる。
今のところlocalhostや公開ページ(ログイン不要なもの)に限定されているが、OpenAIはこの機能を徐々に拡張していく方針を示している。フロントエンドやゲーム開発でのフィードバックループを短縮できる使い方だ。
画像生成との統合——デザインのモックもコード内で作れる
CodexがOpenAIの画像生成モデル「gpt-image-1.5」を使えるようになった。
スクリーンショットやコードと組み合わせて、プロダクトコンセプトのビジュアル、フロントエンドのモックアップ、ゲームのアセットなどを同一ワークフロー内で生成できる。
コードを書いて、デザインを確認して、また修正する——この往復をCodexのアプリ内で完結できるようになった、というのが今回の変化だ。
90以上の新プラグイン——開発ツールとの連携が一気に広がる
今回のアップデートで90以上のプラグインが追加された。スキル、アプリ連携、MCPサーバー(AIエージェントが外部ツールと通信するための標準規格)が組み合わさった形だ。
新しく加わった主な連携先:
- Atlassian Rovo(JIRAの管理)
- CircleCI(CI/CDパイプライン)
- CodeRabbit(コードレビュー支援)
- GitLab Issues
- Microsoft Suite
- Slack、Gmail、Notion(自動化タスクの起点として活用)
たとえばSlackでチームから「このバグを直してほしい」というメッセージが来たとき、Codexがそのメッセージを拾って自動でコード修正のPRを出す、という連携が現実的になってきた。
「記憶」と「継続作業」——日をまたいだ仕事のやり方が変わる
メモリ機能——前回の文脈をCodexが持ち越せる
「毎回同じことを説明しなきゃいけない」という不満は、AIツールに対してよく聞く声だ。今回のアップデートでCodexにメモリ機能のプレビューが追加された。
好みのコーディングスタイル、プロジェクトのルール、前回に調べたことや修正の方針——こういった情報をCodexが記憶して、次のタスクに引き継げるようになる。最初に細かく教えなくても、過去のやりとりから自分のスタイルを覚えてくれる。
自動化の強化——「今日どこから始めるか」をAIが提案する
Codexが既存の会話スレッドを再利用できるようになり、文脈を保持したまま長期タスクを継続できる。さらに、未来の作業をスケジュールして自律的に再開する機能も追加された。チームが使っている事例としては、「未マージのPRを順番に処理する」「Slackのタスクを拾って進捗を報告する」といった使い方が挙がっている。
加えて、Codexが「次に何をすべきか」を自分から提案するようになった。Google Docsの未解決コメント、Notionのタスク、Slackのメッセージ——これらを横断してコンテキストを集め、「今日はこれから始めるといいですよ」という優先リストを出してくれる。
GitHub Copilot・Claude Codeとの比較——どう使い分けるか
3ツールを並べると、それぞれの立ち位置がはっきりする。
| 項目 | OpenAI Codex | Claude Code | GitHub Copilot |
|---|---|---|---|
| 操作スタイル | 非同期エージェント(委託型) | 対話型エージェント(CLI) | リアルタイム補完(IDE内) |
| 得意なタスク | 大量・機械的な修正、PR作成 | コードベース全体の理解、複雑なリファクタ | 日常のコーディング支援 |
| インライン補完 | なし | なし | あり(最大の強み) |
| コンテキスト長 | 128K〜256K | 最大1Mトークン | ファイル・プロジェクト内 |
| 実行環境 | クラウドサンドボックス | ローカル(CLIから実行) | IDEプラグイン |
| セキュリティ | リポジトリをクラウドにクローン | ローカル実行、APIにプロンプト送信 | コードをクラウドに送信 |
| 料金 | ChatGPT Plus($20/月)から | APIトークン従量課金 | $10/月から |
| コンピュータ操作 | ○(macOS) | × | × |
| 向いている人 | 並列タスクを委託したい人 | コードベース全体を扱いたい人 | エディタから離れたくない人 |
使い分けの現実的な答えは「1つに絞らなくていい」だ。
実際に多くのエンジニアがやっているのは、Copilotでインライン補完 + Claude Codeで大規模タスク、あるいはCodexで機械的な修正を非同期に流しながら、Claude Codeで複雑な設計判断、という組み合わせ。ツールは排他的でなく、役割分担で使うのが現実的だ。
エンジニア・ビジネスパーソン別の活用シナリオ
エンジニア向けの使い方
① テストカバレッジを上げたい
「このモジュールのユニットテストを追加して、カバレッジを80%以上にして」と指示を投げて、Codexに任せる。自分は別のタスクを進めながら待つだけ。できあがったPRをレビューして承認する。
② フロントエンドのデザイン調整
アプリ内ブラウザでローカルの画面を開き、「このカードコンポーネントのレイアウトを修正してほしい」とコメントを書き込む。画像生成機能でモックを出してもらいながら、コードと見た目を同時に確認できる。
③ セキュリティチェックの自動化
CodexのSecurity Agent機能(2026年3月追加)で、PRが作成されるたびにバックグラウンドでセキュリティチェックが走るように設定する。常駐のセキュリティエンジニア的な使い方に近い。
④ JIRAやSlackと連携した自動PR
Atlassian RovoプラグインでJIRAのIssueとCodexを繋ぎ、Issueが起票されたら自動でコード修正を試みるフローを組む。人間のレビューは必要だが、初動のコーディングを自動化できる。
ビジネスパーソン(非エンジニア寄り)の使い方
① 定期レポートの自動化
Codexの自動化機能を使って、毎週月曜日に「先週のログを集計して売上サマリーのスプレッドシートを更新して」というタスクをスケジュール実行させる。
② ドキュメントの整備
「このコードのドキュメントを更新して」という指示を複数ファイルに一括で適用させる。Codexが非同期で動いてPRを出してくれるので、エンジニアが細かい作業に時間を取られない。
③ Slack・Notionの情報整理
MemoryとSlack/Notionプラグインを組み合わせると、「今週対応が必要なタスクをまとめて」という指示に対して、複数のツールを横断してリストアップしてくれる。
使う前に知っておきたい注意点
① 作業のやり直しが発生しやすい
非同期型の最大の弱点は「完成するまで中身が見えない」点だ。指示が曖昧だと、思っていた方向と全然違うPRが届くことがある。指示はできるだけ具体的に書く必要がある。「〜をいい感じにして」ではなく「〇〇ファイルの△△関数を□□の方針でリファクタリングして、テストも追加すること」というレベルの粒度が求められる。
② セキュリティポリシーの確認が必須
Codexはリポジトリをクラウドのサンドボックスにクローンする設計だ。社内の機密情報や顧客データが含まれるコードをそのまま投げると、情報が外部に出ることになる。金融・医療・法務など機密性の高い領域では、自社のセキュリティポリシーとOpenAIのデータ取り扱い規約を照らし合わせてから使うこと。
③ コンピュータ操作はまだ試験段階
Computer Use機能は現時点でmacOS限定、かつEEA・UK・スイスでは未提供。できることも「低リスクなアプリ設定」「シミュレーター操作」「GUIのバグ確認」などに限られており、本番環境への影響を与えるような操作には向いていない。
④ メモリ・パーソナライズ機能は一部未提供
今回のアップデートのうち、メモリや文脈認識の提案機能はEnterprise・Edu・EU・UKユーザーへのロールアウトがまだ完了していない。使えるタイミングはプランと地域によって異なる。
⑤ 料金体系が複雑になってきた
2026年4月時点では$20/月のPlus、$100/月のPro(新設)、$200/月のProという3階層になっている。100ドルPro(2026年4月9日新設)はProの5倍のCodex枠が使えるが、256KコンテキストやGPT-5.3-Codex-Sparkへのアクセスは$200 Proのみ。チームで使う場合はBusinessプランの従量課金がコスト効率的という見方もある。何を目的に使うかをまず決めて、プランを選ぶのが正解だ。
まず試すならここから——Codex入門ステップ
- まずはCodexデスクトップアプリをダウンロードする(ChatGPTのアカウントでサインイン)
- 小さいタスクで慣れる:「このPythonスクリプトのエラーハンドリングを追加して」程度のシンプルな指示から始める
- 指示の書き方を練習する:返ってくるPRを見ながら、どう指示を書けば意図通りの結果になるかを学ぶ
- プラグインを1つ繋いでみる:GitHubやSlackなど日頃使っているツールとの連携を試す
- 自動化を設定してみる:繰り返しやっているルーティン作業(テスト実行、ドキュメント更新など)を週次スケジュールで流してみる
「まず1週間、毎日1つずつ試してみる」くらいのペースがちょうどいい。いきなり大きなプロジェクトに全面投入するのは、特に非同期型に慣れていない段階では失敗しやすい。
まとめ
正直、今回のアップデートを一通り見て思ったのは「コーディングツールという言葉では説明しきれなくなってきた」ということだ。
コードを書く、アプリを操作する、画像を作る、スケジュールを組んで勝手に仕事を続ける、次のタスクを提案してくる——ここまで来ると、Codexは開発者向けのAIアシスタントというよりも、ひとつの自律的なチームメンバーに近い。
ただ、すべてを任せられるほど成熟しているかというと、まだそこには届いていない。指示の精度が問われるし、セキュリティの判断は人間がしっかり持たないといけない。「任せる」ための設計力が、今後エンジニアに求められる新しいスキルになると思っている。
まずは小さく試して、チームの中でどう役割分担するかを考えていくのが一番の近道だ。