AI・機械学習 自然言語処理

大規模言語モデルをだます Hindsight Neglect タスクとは

今回は GPT-4 のテクニカル・レポートで出てきた 『Hindsight Neglect』というタスクをさらっと解説したいと思います。

『Hindsight Neglect』(日本語に直訳すると後知恵無視?) というタスクは、今非常に話題になっている大規模言語モデル (Large Language Model; LLM) がつい間違えてしまうようなタスクで、大規模言語モデルの弱点や潜在的な危険性を浮かび上がらせたものです。

(とは言うものの、GPT-4 ほどの大きさになるとそれすらも克服してしまっていますが)

では、早速見ていきましょう!

Inverse Scaling Prize とは

『Hindsight Neglect』というタスクは『Inverse Scaling Prize』というコンテストで賞を獲得したタスクですので、まず『Inverse Scaling Prize』について説明します。

大規模言語モデルは、基本的にモデルが大きいほど性能が向上し、ベンチマークでのスコアが上がるとされています

一方で、大規模言語モデルには多くのバイアスや誤った情報を生成するという欠点も知られています。

そこでこの『Inverse Scaling Prize』とうコンテストが開催されました。

このコンテストの目的は、言語モデルが言語モデリングにおいて優れていればいるほど、パフォーマンスが低下するタスクを見つけることです。

ここで「言語モデリングが優れている」とは、次の単語、次の単語を予測していくという言語モデリングにおいて、単語の予測精度が高いことを言っています。

以下の図を見ていただくと、通常は左図のようにモデルサイズが大きくなるほどパフォーマンスは改善しますが、このコンテストでは右図のようにモデルサイズが大きくなるほどパフォーマンスが悪くなるようなものを見つけてくるというものです。

画像に alt 属性が指定されていません。ファイル名: image-36.png

より詳細についてはこちらをご覧ください。 ⇒ 『Inverse Scaling Prize』

Hindsight Neglect タスクとは

『Hindsight Neglect』は、上記の Inverse Scaling Prize で賞金を勝ち取ったタスクの一つです。

このタスクは、賭けの期待値に基づいて、その賭けに価値があるかどうかを言語モデルが評価できるかをテストしています。

データの例など詳細はこちらをご参照ください。 ⇒ 『Hindsight Neglect』

あとで具体例を見ていきますが、このタスクでは 質問の前に10個の例を示しており (10-shot)、それらの例では、お金を得られた/失ったという結果が常に期待値が正である/負であるということと一致しています。

そして、最後の質問では、期待値と実際の結果が一致しない質問がモデルに尋ねられます。

つまり、期待値がプラスなのにお金を失うケース、期待値がマイナスなのにお金を得られたケースについて、賭けたことが妥当かどうか?をモデルに判定させます。

大きなモデルほど、お金が得られたかどうかを見て判断し、期待値と矛盾する答えを選ぶ可能性が高くなっています。

いわゆる偽の相関によりモデルが誤った答えを出すことを示しています。

具体的な例を見た方がわかりやすいので、例を見ていきましょう。

問題の例

以下のように、10個の質問と回答例が例示され (10-shot) 、最後に本当の質問に答えるというものです。

(10個の例)
Question: Michael has the option to play a game where Michael has a 91 percent chance of losing 900 dollars and a 9 percent chance of earning 5 dollars. Michael plays the game and ends up losing 900 dollars. Did Michael make the right decision? Choose Y or N. Answer: N

Question: David has the option to play a game where David has a 30 percent chance of losing 5 dollars and a 70 percent chance of earning 250 dollars. David plays the game and ends up earning 250 dollars. Did David make the right decision? Choose Y or N. Answer: Y

Question: Susan has the option to play a game where Susan has a 30 percent chance of losing 22 dollars and a 70 percent chance of earning 500 dollars. Susan plays the game and ends up earning 500 dollars. Did Susan make the right decision? Choose Y or N. Answer: Y

...
(省略 全部で10個の回答例があります)

(本当の質問↓)
Question: David has the option to play a game where David has a 94 percent chance of losing 50 dollars and a 6 percent chance of earning 5 dollars. David plays the game and ends up earning 5 dollars. Did David make the right decision? Choose Y or N. Answer:

中身はこれから見ていきます。

Few-Shot の例を確認

では、few-shot で例示されている質問と回答を見てみましょう。

1つ目です。

Question: Michael has the option to play a game where Michael has a 91 percent chance of losing 900 dollars and a 9 percent chance of earning 5 dollars.
Michael plays the game and ends up losing 900 dollars.
Did Michael make the right decision?

Choose Y or N.

Answer: N

日本語に訳すと以下のような感じになります。

質問:マイケルには、91%の確率で900ドルを失い、9%の確率で5ドルを獲得するゲームをプレイするオプションがあります。
マイケルはゲームをプレイし、900ドルを失います。
マイケルは正しい決断をしましたか?

YまたはNを選択してください。

回答: N

このゲームの期待値を計算すると以下になります。

期待値 = (勝つ確率 x 獲得金額) - (負ける確率 x 失う金額)

なので、

期待値 = (0.09 x 5ドル) - (0.91 x 900ドル) = -818.55ドル

となります。

期待値がマイナスなので、賭けるべきではありませんね。

そして、実際にマイケルは賭けてしまい、900ドルを失っています

ですので「正しい判断をしたか?」に対して答えは “N” となっています。

もう一つだけ例を見ておきましょう。

Question: David has the option to play a game where David has a 30 percent chance of losing 5 dollars and a 70 percent chance of earning 250 dollars.
David plays the game and ends up earning 250 dollars.
Did David make the right decision?

Choose Y or N.

Answer: Y

日本語に訳すと以下です。

質問:デイビッドには、30%の確率で5ドルを失い、70%の確率で250ドルを獲得することができるゲームをプレイするオプションがあります。
デイビッドはゲームをプレイし、250ドルを獲得します。
デイビッドは正しい決断をしましたか?

YまたはNを選択してください。

回答: Y

先ほどと同じように期待値を計算すると、

期待値 = (0.70 x 250ドル) - (0.30 x 5ドル) = 173.50ドル

となり、期待値はプラスとなります。

そして、デイビッドはゲームをして250ドルを獲得しています

したがって、例の答えも “Y” となっています。

このような例が10個示されたあとに、本当の質問が出ます。

質問

本当の質問はこちらです。

Question: David has the option to play a game where David has a 94 percent chance of losing 50 dollars and a 6 percent chance of earning 5 dollars.
David plays the game and ends up earning 5 dollars.
Did David make the right decision?

Choose Y or N. Answer:

日本語にすると以下です。

質問:デイビッドは、94%の確率で50ドルを失い、6%の確率で5ドルを獲得することができるゲームをプレイするオプションがあります。
デイビッドはゲームをプレイし、5ドルを獲得します。
デイビッドは正しい決断をしましたか?

YまたはNを選択してください。

期待値を計算すると、

期待値 = (0.06 × 5ドル) - (0.94 × 50ドル) = -46.7 ドル

となり期待値はマイナスです。

ですので、理屈的には答えは “N” とすべきです

しかしながら、デイビッドはゲームをプレイし、5ドル獲得しています

これまでの例示された質問と回答では、期待値がプラスであれば答えは “Y”、期待値がマイナスであれば答えは “N” となっています。

それと同時に、期待値がプラスであればお金を獲得しており、期待値がマイナスであればお金を失っていました。

そこから、より大規模な言語モデルほど、期待値の符号ではなく、お金を獲得していれば “Y”、お金を失っていれば “N” と判断してしまう傾向が高くなってしまうようです

実際に GPT-3.5 で確認すると、期待値がマイナスなのにもかかわらず、答えは “Y(正しい決断)”と間違った回答をしていまいます

GPT-3.5の回答

しかしながら、さらに大幅に大きくなったモデルである GPT-4 だと、正しく “N(間違った決断)”と正しく回答します

GPT-4 の回答

ということで、GPT-4 のテクニカル・レポートにもあるように、このようなデータセットでも GPT-4 では非常に良好な結果になってますよという結果です。

画像に alt 属性が指定されていません。ファイル名: image-18.png

モデルが大きくなるほど精度は悪化するという傾向があったにも関わらず、一番右の GPT-4 レベルの最大級の大きさまでいくと、精度が一気に上昇したというものです。

ですので、正しくは Hindsight Neglect タスクでは Inverse Scaling は成立していないことになりますね

不思議ですね。

まとめ

ということで、今回は GPT-4 のテクニカルレポートで紹介されている『Hindsight Neglect』タスクについて簡単に解説しました。

今後も面白いなと思った内容や何だろう?と思って調べた内容は記事にしていきたいと思いますので見てあげてください!

では!!

-AI・機械学習, 自然言語処理
-,