なんとなく「AIってプログラムもバリバリ作ってくれるんでしょ?」ってイメージ持ってる人、多いと思うんだけど、実はそう単純じゃないみたいなんだよね😳💭
この記事の元になってるZed Blogの記事を読んでみて、「あー、なるほど…」ってなったことを、自分なりにシェアしてみるよ✨
AI(LLM)がソフト作りでつまずくポイントって?
まず、LLM(大規模言語モデル)は文章をめちゃくちゃ上手に作るのは得意だけど、「複雑なソフト開発の全体像」をちゃんと理解して動かすのは苦手って話なんだよね💡
どういうことかっていうと…
- コードは「文章」じゃなくて「動く設計図」みたいなもの
AIは過去のデータから「こう書けば動くはず」ってコードを生成してるだけで、 実際に動くかどうかは別問題 らしい🥺 - テストや修正を自分で判断できない
人間はコードを書くだけじゃなくて、動かしてバグ探して「ここ直そう」って考えるけど、AIはそこまでできないみたい💭 - 長い期間かけて積み上げる設計や意図が読めない
ソフト開発って一回でパパっとできるもんじゃなくて、 何度も直したり、他の部分と調整しながら作るもの なんだけど、AIはそれが苦手みたい🧠
なんでそうなるの?AIの限界って?
AIは「過去に大量にあったコードや文章を学習して、それっぽく作る」って仕組みだから、 まったく新しい問題に対応するのは苦手 なんだよね💭
それに、ソフト作りは「問題解決の連続」なんだけど、AIはまだ「問題を深く理解して考える」ってことができない感じ✨
まとめると…
- LLMはコードを「写す」「似せて作る」は得意だけど、ソフト全体の設計や動作確認を自分でできない
- 人間みたいに「試して修正してまた試す」みたいな繰り返しが苦手
- だから、今のところはAIはあくまで「補助役」って感じ が現実的ってわけ🥺
うーん、AIが万能に見えるけど、意外と「できないこと」もちゃんとあるんだなぁって思ったよ✨
それでも、コードを書くときのアイデア出しや、ちょっとした手伝いにはすごく便利だから、使い方を知っておくのはアリだよね👍💗
こんな感じで「AIとソフト作りの関係」について、ちょっとだけ頭の片隅に置いといてもらえたらうれしいな🎀
コメント
レオ
振り子がまた逆に振れるのが待ちきれないよ、生き残ったエンジニアには大金が待ってるはず。
ハンナ
Claude Codeでサイドプロジェクトやってるけど、めっちゃズルいことしてる感じ。
ハンナ
TypeScriptで「any使うな」って言っても平気で使うし、コンパイラに合わせて`never`にしたり、同じ型をファイルごとにコピーしたりしてイラッとする。
クリス
テストでスペース入り文字列がうまく処理されず、全部のテストからスペースを消す暴挙に出たけど、一方でテスト用小ファイルを勝手に作ったり、途中で書き直したり、仕様書を渡すとめっちゃ賢くなるのは面白い。
クリス
メンタルモデルの話、めちゃ共感するよ。 自分の頭の中のモデルをプログラムすると、モデル自体の問題に気づいて要件を見直すことになるんだよね。
ジョージ
今のハイプサイクルでは、AIやLLM搭載を誇らしげに宣伝しつつ、ブログではそれらが使えないと言ってる企業が多くて面白い。
ハンナ
Zed CEOのスピーチ見て思ったけど、「LLMはコードが動くと思い込むし、テスト失敗したら何を直すか迷って全部消してやり直す」っての、まさに自分が求めてるのとは真逆。
グレース
今の課題は、階層的なコンテキストウィンドウでモデルを事前学習する方法だね。
サラ
LLMにコーディング任せると、たまにすごく良くて助かる時もあれば、ひどくて時間が無駄になる時もある。
サム
Zed Shaw本人かと思ってたけど、コテコテの悪口満載の完璧なLLM批判を期待してたよ。
グレース
細かくタスクを分けてLLMにコード書かせるのが成功パターンで、ざっくり頼むより断然効率いいけど、複数タスク一気にやらせると大抵動かないコードになる。
クリス
LLMはパターン認識だから、新概念を作るソフト開発とは相性悪いけど、定型コードやよくある課題には強いし、「YのスタイルでXを作る」みたいな仕事が得意。
グレース
今の評価では、LLMは断片的なコードの作成や修正が得意で、完全なコードベースや大きなプロンプトだとゴチャゴチャしたコードになる。
グレース
メソッドや関数のデバッグには便利だけど、ライブラリやアプリ全体を理解するのは無理、クラス単位もギリギリ。
ベン
面白い例でChatGPTに短編小説を書かせたら、文法は良いけど話がぐちゃぐちゃで、異なる気候や時間が混ざりまくってた。
ベン
でも天気や景色の描写は良かったし、コーディングでも簡単なループは速いけど、長い話になると迷走する感じ。
グレース
GPT-5は多少まとまったコードが書けるけど、複雑になるほど連続したまともなコードを作るのが苦手になるね。
ハンナ
Claudeへの不満:状態機械使わないでって言ってるのに何度も合計型やブールチェックを持ち出してくるからマジでイライラする。
ロバート
アプリでプロジェクト招待機能をClaudeに実装させたけど、テストを書くのは苦戦してバグもあったから、今はテストだけ頼んであとは相談役にしてる。
ロバート
ドキュメント読み込ませて質問する方が何時間も調べるよりずっと楽だよ。