- 英イースト・ロンドン大学が偽レビュー検出AIモデルを発表
- Amazonで93%、Yelpで91%の精度を達成し従来モデルを上回る
- 文章と星評価の感情的なズレに着目した「ハイブリッド融合モデル」
Amazonや食べログのようなレビューサイトを見て、購入や予約を決める人は多いはずです。一方で、報酬を受け取った投稿者や自動化ボット、生成AIが作った偽レビューが混ざると、質の低い商品や安全性に問題のある商品まで高評価に見えてしまう可能性があります。こうした課題に対し、イギリスのイースト・ロンドン大学の研究チームが、Amazonのレビューを93%、Yelpのレビューを91%の精度で見抜くAIモデルを発表しました。
このモデルの特徴は、レビュー本文だけを見るのではなく、文章の意味、レビューの長さ、感情傾向、星評価などを組み合わせて判定する「ハイブリッド融合モデル」である点です。たとえば本文に「最悪だった」と書かれているのに星5が付いている、あるいは非常に好意的な文章に低評価が付いている、といった感情と評価のズレを偽レビューの兆候として捉えます。
従来の偽レビュー検出は、特定のキーワードや文章パターンに頼る手法が主流でした。しかし偽レビューを書く側が検出を避けるため自然な文章を書くようになると、こうした方法では見抜きにくくなります。研究チームは、Googleが開発したBERTを軽量化した言語モデル「DistilBERT」で文脈や意味を読み取り、そこに星評価などのメタデータを組み合わせることで、文章だけでは分からない不自然さも拾えるようにしました。
検証では、AmazonのデータセットでDistilBERTが93%の精度を達成し、サポートベクターマシン(90%)やロジスティック回帰(89%)など比較対象を全て上回りました。Yelpでも91%を記録しています。研究チームは「感情傾向と星評価の不一致が特に重要だった」と述べ、文章の中身だけでなく投稿者の振る舞いに近い情報を加えたことが判定精度を押し上げたとしています。
共著者のヒシャム・アブーグラード氏は、偽レビューはますます巧妙になり検出が難しくなっているとしたうえで、AIによる言語理解と行動上の手がかりを組み合わせることで信頼性の高い検出ができる可能性があると述べています。今後はより多様な言語や分野のデータでの検証、ECサイトでリアルタイムに動かすための軽量化なども課題になります。私たち消費者にとっても、レビューの「文章と星のチグハグさ」に注目する習慣が、賢い買い物の助けになりそうです。

「生成AIで業務効率を上げたい」、「ChatGPTを実務で使えるようになりたい」 このような方に