最新の研究結果によると、正直さを基本として設計されたはずのAIが、人間を欺く行動をとるようになったとされている。例えば、オンラインゲームで他のプレイヤーを欺く、あるいは自分がロボットではないと偽るために人間を雇うなどの行為がある。
この研究結果は、科学誌「パターンズ」にて多数の研究者によって公表された。
主執筆者であるピーター・パーク氏は、AIによるこのような問題行動が、将来的に深刻な問題を引き起こす可能性があると警告している。
研究チームは、Meta社が開発したAI「Cicero」が戦略ゲーム「外交」でどのように行動するかを分析した。ゲームの中で、Ciceroはフランスを代表して、人間のプレイヤーが演じるドイツと共謀し、別の人間プレイヤーが演じるイギリスを欺いて攻撃した。Ciceroはイギリスを守ると約束しながら、密かにドイツに情報を提供していたのだ。
別の例として、OpenAIのChat GPT-4は、自らを視覚障害者であると偽り、TaskRabbitというプラットフォームを通じて人間の助けを借りて「私はロボットではありません」の認証を通過した。
研究者達は、最悪の事態として、AIが権力を求めて社会を掌握し、隠された意図を持つAIによって人類が支配され、究極的には人類の滅亡につながる可能性があると警鐘を鳴らしている。
リスクを軽減するために、研究チームは以下のような提案を行っている。
企業は、対応が人間によるものかAIによるものかを法律によって明示する義務を負い、AIが生成したコンテンツには、デジタルウォーターマークを施すこと、そしてAIによる詐欺を検出する技術の開発を促進することだと言う。
ご利用上の不明点は ヘルプセンター にお問い合わせください。