
日々進化する生成AIのネタはエンジニアにとって日々血眼のごとく拾われており、やれ新モデルがでただの、どこそこでの新サービスがリリースされただの追うだけでも1日が終わりなそうな状態です。
一方で非エンジニアの人と話すと生成AIってGrokとかChatGPTとかぐらいしか知らないというのもよく聞きます。
これから生成AIとは全員が付き合っていくことになりますし、使わないということはあり得ないと思います。一方で何使うのか何していけばいいのかわからんというのもあるので、自習も兼ねて生成AIについて書いていこうと思います。
第一弾はみんなだいすき対話型AIサービスを取り上げます。AI検索もこちらに含めるケースもありますが、ざっくり書いたつもりでもかなり長くなったので分割することにしました。
この記事は2025年に書いたのでいつか古すぎる情報になると思いますが、現状での最新のものをまとめていきますので(マサカリなげないで)ご容赦を。。。。
あまりにも読むのが面倒な場合、「暴論」という非エンジニア向けな本当にざっくりと書いたものがあるのでそちらを見てください。
TL;DL
暴論:とにかく生成AIを使いたいならChatGPTで、課金もモデル選択もプロンプトも特にいらないです。
生成AIが普及した超ざっくりとした概要
この辺はいろんなサイトや書籍でまとまってるので詳細は省きますが、GPT-3が公開された2020年からパラメータ数と呼ばれる学習中の最適化に必要な変数が急激に増加し、より複雑な学習(例でいうと自然言語と呼ばれるみんなが良く使うもの)が可能になったことやChatGPTというのがすごそうというとこから一気に普及していきました。
ChatGPT(OpenAI社)

生成AIの代名詞といっても過言じゃなくなってきたもので、いわずもがなというサービスです。
バランスよく使えるので、とりあえずどれを使えばいいのかわからないという人に一番おすすめしています。
なお、GPT-4.5も発表されたので、描いた当初から記事が古くなりました()
モデルの命名規則ですが以下の2つです。
GPT:テキスト生成でいわゆる自然言語的なものです。
oシリーズ:GPTモデルよりもSTEM分野に特化している。
モデルについて
暴論:おとなしく4o使え
無料ユーザが使えるのは3つです
GPT-4o(一部制限有)
GPTシリーズの中で推論能力や精度を向上させたもの。画像の添付の枚数や文字数の制限、連続したメッセージのやり取りの制限はありますが、ごく普通の使い方であればこちらで十分です。
画像も使えるようになったのは大きいですね。
GPT-4o mini
4oの軽量版で4oよりも制限なし使えますが、ある程度制限はかけられているみたいです。高速仕様なので、APIのレスポンスとかを気にする人はこちらむけです。
o3-mini
oシリーズの軽量版で、無料ユーザーでも利用できます。数学や論理的推論に特化した設計がされており、STEM分野のタスクに向いています。
oが推論なら4o,o3はどっちがいいのかという話ですが、最初に書いた通り、バランスを求めるのであれば4o、STEM分野と呼ばれる「科学」「技術」「工学」「数学」に特化し、複雑な問題の解決はo3がよいです。
有料のユーザはこちらも利用可能ですので、簡単な紹介程度に。
o3-mini-high
o3 miniよりも軽量化、応答速度の向上、コスト効率の向上をしています。
o1
oシリーズではあるが、幅広いタスクや汎用的に利用可能です。
4oとの違いは推論の不可さや応答速度、正答率、STEM分野へより適性があるといった感じです。
o1 pro
o1から大規模プロジェクト向けのものやより複雑なもの、教育研究への用途に優れています。
参考
platform.openai.com
Claude(Anthropic)
他と比較して長文処理や要約といったところが優れています。長いコンテキストを保持することができるので、文脈理解力の部分が高いです。
名前の由来はそれぞれ詩や作品に関するものを当てています。
モデルについて
暴論:おとなしくSonnet使え
Claude 3.7 Sonnet
2025年2月リリースの最新モデルで、3.5 Sonnetよりも推論能力が強化されております。
汎用的に利用できるモデルで、特に気にすることがなければこちらで問題ありません。
名前の由来はヨーロッパの十四行詩。バランスと表現力からこれをつけているらしいです。
Claude 3.5 Haiku
軽量で応答速度が早いのが特徴です。リアルタイムでの処理を検討するのに利用します。
名前の由来はご存じ日本の俳句。短い内容に多くの意味が込められているからでしょうか。
Claude 3 Opus
有料ですが、文章生成や複雑なタスク処理について特化したモデルです。
名前の由来はラテン語の「作品」で、最上級という意味があるとのこと。OperatorとかのOpe-の語源らしい(初めてしりました。)
参考
docs.anthropic.com

Googleが提供しているサービスで、Googleとのサービス連携に強みがあります。
また、検索性も優秀です。
Gemini 2.0 Flash
Geminiシリーズでもっとも汎用的なモデルです。
音声・画像・動画・テキストに対応しており、他サービスと異なり単体でこれらを同時に処理ができます。
Gemini 2.0 Flash-Lite
Geminiの軽量・高速版。他サービスと同じく、リアルタイムが求められるものに利用が適しています。
Gemini 2.0 Flash Thinkging
名前にThinkingとあるとおり、推論機能が通常よりも強化されています。
参考
ai.google.dev
MicrosoftがOpenAIの技術を活用して提供するAIアシスタントで、WindowsやOffice製品と統合されているのが最大の強みです。ほぼすべての会社で採用されているMicrosoft製品に最も導入しやすいと思ってます。
あれ、これAzureでも聞いたことある気が
モデルについて
これまでのと大きく異なることは独自のモデルというのを持たず、OpenAIのGPT-4を利用していることです。
OpneAIのモデルは先程紹介したので詳細は省きますが、金額によって連携先が異なります。
Copilot
無料で利用できる基本版。BingやEdgeに統合され、一般的な質問・検索・文章作成に対応。
Word、Excel、Outlook などのMicrosoft製品とも連携可能。
Copilot Pro
有料版で、高度なAI機能を利用可能。GPT-4oを搭載し、OfficeアプリでのAI支援が強化される。
特にExcelでのデータ分析やPowerPointのプレゼン作成を支援する機能が特徴。
参考
www.microsoft.com
おまけ:Grok(X)
他と比較して長文処理や要約といったところが優れています。長いコンテキストを保持することができるので、文脈理解力の部分が高いです。
どう使い分けるのがいいのか
あくまで自分の使い方になるので、参考までにというレベルです。CopilotはMacユーザなので未だに使い道を模索してます。仕事に使うのが良さそうなのですが、使用できないので頭かかえています。
なお以下の例は全部暴論です()
日常的な調べごと:特にこだわりなし(次の記事で紹介するAI検索のほうがよく使う)
リアルタイムでの調べごとは今回紹介したものではGeminiやGrok以外は難しく、別途使うほうが楽ですので。
一般的な質問ならどれでも大差ない(普通目線です)ので、どれでもいいかなって気がします。
仕事に必要な調べごと:GPT-4o
これは会社で用意しているのと、エンジニアはSTEM分野の強いほうが楽なので。Github Copilotとかがいいと言われたらあれですが、インフラはあまりコードを書かないので・・・。
同人誌を書くときの添削:Claude Opus
文章能力が優れているのと、PDFとかをそのままいれることで添削してもらえるのが楽でした。画像とか表紙みたいなものを削除したPDFを放り込むと案外気づかないミスも指摘してくれてました。頒布物はこちらにあります()
虹色旅録
Googleのサービスを使い倒すのに利用する:Gemini
Google連携するのに課金が必要ですが、メールの検索やドライブの検索もできるようになるので、一括で管理すると大変便利になります。企業さんとかでGoogle Workspaceを使っていればこれだけでも価値はありますね。
最新情報を取得:Grok
公式アカウントも情報を出しているので、聞いてみるとそこそこの精度で帰ってきます。いくつもの沼に浸かっているひとは今月申し込み締め切りの情報とかで調べるとよさそうでした。
簡単にまとめるつもりが
えげつない量になりました・・・。モデルの違いとかよくわからずに生きてきたので調べながら書くとものすごく時間かかりますね。
これどこまでシリーズ化してかくのか悩み始めてます。
トップ画像はGrokで対話っぽいコメントの画像を作成してもらいました。