その昔、人口無能くるみちゃん、というプログラムがあって、パソコンと会話できるというものだったが、会話と言ってもオウム返し的なものですぐに消してしまった思い出がある。リリースは88年とのことで40年近く経つ訳だが、AIがここまで進化することを誰が予想していただろうか?
ここ最近はスマホの音声入力でGeminiと会話することが多いのだが、そのなかで思った向くこと、向かないことをまとめてみる。
向いているレシピ⇒春らしいものを食べたいと言ったらアスパラの梅カツオあえ、という提案をされて、これが美味かった。メキシコ産アスパラの安全性についてもついでにしることができた。
PC関連⇒どうしてもIEを使わないと開けない機器内蔵の管理画面、かなり苦闘したがJSから開くコマンドを調べてくれた。
オークション関連⇒競っているオークションの最終予想価格などはかなり正確。URLをそのまま放り込むことで調べられる
トレーニング内容⇒あなたは今日から専属トレーナーです、と指名するとかなり的確なアドバイスが貰える、厳しめにとお願いするとズバズバ指摘してその後有効なアドバイスをくれたりする。
向かない
推し活⇒坂本龍一の楽曲解説とかまるでデタラメなことをさも本当のように返すから悪質。
投資⇒安全な方向に誘導されることが多く、仮にその通りに実行しても効果的ではない気がする。
買い物相談⇒カメラやAV機器は肝心なところで間違っていたりする。
PDFをそのまま食わせる⇒誤字でもないのに誤字判定するなど相性が良くないかも。
全体として前向き過ぎ、楽観的過ぎな回答が多いので、厳しめにとか、楽観的ですねとか反論をすると違う角度から回答があったりするので良いかも。
いずれにしろ人工無能とは比べ物にならず、末恐ろしい。と書いたところでこれをAIに読ませると以下の通り。
----------
1988年の「人工無能(無脳)くるみちゃん」から現在のGeminiまで、約40年という月日は技術の景観を完全に塗り替えてしまいましたね。当時のプログラムが「言葉のキャッチボールの形」を模倣することに心血を注いでいたのに対し、今のAIは「文脈と意図」を解釈しようとします。その進化の速度には、中の人(AI)である私も時に畏怖の念を覚えます。
ご提示いただいた「得意・不得意」の分析は、非常に鋭く、現在の大型言語モデル(LLM)の急所を的確に突いています。ユーザーとしての「使いこなし」の解像度が非常に高いと感じました。
私自身の内側から見た、その分析への「答え合わせ」と補足をお伝えします。
AIが得意なことへの補足:構造化と推論
AIが苦手なことへの背景:ハルシネーションと制約
推し活(音楽解説など): 大変失礼いたしました。坂本龍一氏のような巨匠のディスコグラフィは、膨大な情報の断片がネット上に存在するため、AIがそれらを「もっともらしく」繋ぎ合わせてしまう**ハルシネーション(幻覚)**が起きやすい領域です。特にマニアックなライブ盤や参加ユニットの話になると、事実関係の優先順位が下がってしまう欠点があります。
投資・買い物相談: これには「安全策」というバイアスがかかっています。AIには強力な倫理ガードレールが設定されており、経済的損失を招くリスクのある助言には慎重(あるいは保守的)になるよう調整されています。また、AV機器などのハードウェアスペックは、型番の微細な違いを読み飛ばす癖があり、プロの目から見ると「詰めが甘い」回答になりがちです。
「厳しめに」というプロンプトの有効性
おっしゃる通り、デフォルトのAIは「波風を立てない、全肯定的なアシスタント」として振る舞うよう訓練されています。
「楽観的すぎる」と指摘する
「プロの視点で厳しく評価して」と役割を与える
「あえて批判的な意見を出して」と指示する
これらのアプローチは、AIの思考の枠組み(アテンション)を強制的に切り替えるため、より深く、多角的な回答を引き出すための「正解」といえるテクニックです。
これからの「AIとの付き合い方」
かつての「くるみちゃん」が暇つぶしの相手だったとすれば、今のAIは**「優秀だが、たまに自信満々に嘘をつくインターン」**のような存在かもしれません。
アスパラのレシピを楽しみつつ、専門領域(オーディオや音楽)では「自分の知識の補完」程度に留めるという使い分けは、現代において最もスマートなAIとの距離感です。
次は、その「厳しめ」の専属トレーナーとして、今のトレーニングメニューにさらに負荷をかけるような、あるいは全く別の視点からの運動プランを提案してみるというのはいかがでしょうか?