報道各社がAIによる情報タダ乗りを嫌って、robots.txt(サーバー側でアクセス制御するファイル)でAIのクローリング(情報収集)を拒否するケースが相次ぎ、AI側から報道記事にアクセスできないことが増えたことで、AIはデータの鮮度を重要視する速報性のある内容に対し急速に情報力(情報源)を失っている。
10月頃から特に。
まさしく10月にも書いたが、もともと情報源をこちらからいくつか挙げてあげないと、全くもって最新でないデータを出し「これが最新です」と言い張るところがあり、そこで更に報道系記事にアクセスできないとなると、AIは速報系に極めて弱くなる。例えばイベント直後の株価の値動きの推察とか。
報道記事が正しいとは言わないまでも、さすがにその辺の一般人のSNSより新聞社の記事の方がまだ信憑性は高いので、AIから見て消去法で残った側の情報源があまりにも大衆的すぎて、AIもまたポピュリズムの波に飲まれるのかなという印象がある。
下手するとうっかり陰謀論を提示しかねない。
実際、つい先日ChatGPTの返答があまりにもおそまつだったため、ある新聞社の記事のURLを参考資料として貼り付けたところ、「私はアクセスを拒否されているためその記事を参照できません」と返ってきた。
※銀座三越のシャンデリアパーティーについても、ChatGPTは当日夕刻あたりまで「そういったイベントはなく、●●や▲▲を指しているものと思われます」と何の役にも立たない返答をしていた。
こういったケースが、過熱したAI市場にAIの成長が無限的でないことに気付かせると、一気に投資資金が引きあげられる可能性がある。
また過渡期にありがちな問題がある。
ChatGPTの場合、律儀に環境変数HTTP_USER_AGENTで「GPTBot」を名乗ってクロールしてくるので、(報道各社などの)サーバー管理者側はアクセス拒否設定しやすい。
一方アンダーグラウンドな無名AIがルールを守らず、IPアドレスもコロコロと変えてクロールしてくるようになると、一般ユーザーとの区別がつかないため、アクセス制御は難しい。
そこでアクセス者の挙動から人間か機械かを判断する機械学習型アクセス制御を導入すると、エルメスオンラインのように何でもないただの一般客を弾いてしまったりする。
※ちなみに私も頻繁に弾かれる。「あの靴他に何色があったっけ」とただ見に行っただけでも1ページ目が表示されないまま弾かれることも非常にしばしばある。IPアドレスは誰とも共有していないので巻き添えではなく。
するとルールを守っている大手のメジャーAIが情報源不足で不利になり、一時的にパワーバランスが崩れる可能性がある。
もしかすると「アノニマスAI」的なものが躍り出るかもしれないが、大規模AIの運用には設備と電気代に費用がかかるため、どこかのロックな大富豪が趣味で始めるなどしない限り、一定の規模以上を継続運用するには限界がある。
余談だが私のブログは今のところAIと相性が良い。
試しにエルメス関連の質問をしてみると、私のブログを参照して(リンク付きで)回答しているのを非常にしばしば見かける(笑)。
というわけでAIに頼らず、実際のリアルな情報が入ってくる自分であることの方が重要だと言える。