2019年、米トランプ大統領訪問で都内警備にあたる警察官(Photo credit should read KAZUHIRO NOGI/AFP via Getty Images)

ビッグデータが暴く自称リベラルの正体

第1回のコラム<なぜ人は共産主義に騙され続けるのか>で、左翼活動家はリベラリスト(自由主義者)とは最も遠い存在であるにもかかわらず、リベラルを自称し、その称号を社会的に広く認めさせると述べた。これまでは、それを事例ベースで裏付けてきたが、今回はビッグデータに基づいて、より客観的なエビデンスを提示したいと思う。なお、本稿では便宜上、上述の自称リベラルをリベラルと記すことにする。

昨年、米国のイェール大学から大変興味深い研究成果が報告された。Cydney DupreeとSusan T. Fiskeは、過去25年間、計74回にのぼる米国大統領選挙の演説を調査し、民主党の候補の演説において、聴衆に黒人が多い場合と白人が多い場合とでは言葉遣いが異なるという分析結果を得た。民主党の候補は、聴衆に黒人が多い場合のみ、わざと平易で温かみのある言葉を選び共感を呼び起こすという戦略が用いられていることが見出されたのである。

さらに同研究では、一般の白人被験者に対して、白人らしい名前(Emilyなど)の人物宛と黒人らしい名前(Lakishaなど)の人物宛のメールについて、文面に使う単語を選ばせる実験も行われた。その結果、リベラル派を自認する被験者については、黒人宛の場合、文面に平易な言葉を有意に多用する傾向があることが分かった。具体的には、白人宛の場合は”euphoric, melancholy”のような知性を感じさせる単語を多く用いるのに対し、黒人宛の場合は”happy, sad”のような易しい単語をより多く用いるといった使い分けがされていた。一方、保守派を自認する被験者については、相手によって使用する言葉に違いはなかった。この結果は、普段差別反対を主張しているリベラル派の言葉遣いの中に、むしろ黒人をバカにするような差別意識が見出されることを示している。

筆者の研究グループも、この種の言葉に着目した研究を10年以上前から行っている。その一つに、新聞の社説を読ませて、それがどの新聞の社説かを言い当てる人工知能に関する研究成果(2007~2008年)がある。1991年から2005年までの15年分の社説を機械学習した結果、読売新聞と毎日新聞の2択の場合は91.7%、読売新聞、毎日新聞、日本経済新聞の3択の場合は83.3%の正解率が得られた。

当時、機械学習に用いたのが最大エントロピー法という手法で、統計的に特定の新聞に偏って多く用いられる語句に注目して判定するため、各新聞に特徴的な表現を抽出することができる。表1は、読売新聞と毎日新聞の2択で機械学習をしたときに得られた、それぞれの新聞に特徴的な名詞である。

表1 読売新聞、毎日新聞に特徴的に使用される名詞

A:「市民」、「私たち」、「人々」、「キム」、「金権」、「庶民」、「論理」、「納得」、「差別」、「提案」、「腐敗」、「賃金」、「要望」、「補助」、「援助」、「司法」、「朝鮮民主主義人民共和国」、「労働者」、「温床」、「残念」、「モラル」、「民意」、「浄化」、「周辺諸国」、「アジア」、「国民」、「人権」、「民衆」、「闘争」、「男女」、「道義」、「武力」

B:「わが国」、「国際社会」、「昭和」、「体制」、「阻止」、「市場経済化」、「成長」、「国益」、「平成」、「着実」、「建設的」、「安定」、「財源」、「責任」、「効果的」、「責務」、「市場開放」、「無責任」、「GHQ」、「過去」、「司令部」、「連合国軍」、「官民」、「社会資本」、「原子力発電所」、「常識」、「極東国際軍事裁判」、「憲法改正」、「独裁」、「歴史」

どちらが読売(保守系)でどちらが毎日(リベラル系)かは一目瞭然だろう。Aが毎日新聞、Bが読売新聞である。

次に、同じ機械学習をしたときに得られた、それぞれの新聞に特徴的な末尾表現を表2に示す。

表2 読売新聞、毎日新聞に特徴的に使用される末尾表現

X:「ものだ。」、「とされる。」、「て欲しい。」、「のだろう。」、「かも知れない。」、「えるだろう。」、「てもいる。」、「があろう。」、「としている。」、「と言える。」、「と言ってよい。」、「と言えるだろう。」

Y:「であった。」、「のである。」、「なのである。」、「るのだ。」、「れなければならない。」、「たのである。」、「はない。」

Xには弱気な表現、Yには断定口調、命令口調の表現が並ぶ。このどちらが読売新聞、毎日新聞かを、これまで講演会等で学者、官僚、マスコミ関係者等の文系知識人に何度かクイズとして出したことがある。大多数の人はXが毎日新聞で、Yが読売新聞であると答えた。しかし、正解はXが読売新聞、Yが毎日新聞である。ビッグデータによる機械学習が人間の気づかない特徴を見出したというわけである。

一般に、リベラル派の方が保守派より穏健で柔らかい表現を使うと思われがちである。実際、名詞にはその印象を反映する偏りが見られる。しかし、末尾表現を見ると、リベラル派の方が断定的、命令的な表現を用いている。それを人間の意識に残らないように行っているのが、リベラル派の巧みさである。

最後に、筆者の研究グループの最新の研究成果を紹介する。新聞社員のようなプロではなく、一般人における保守派・リベラル派の違いを調べるため、過去15年間の年間売り上げ上位20に入った書籍のうち、保守派・リベラル派が書いた本のレビューを、Amazon(amazon.co.jp)から収集した。保守派の著者にはケント・ギルバート、曽野綾子、百田尚樹、リベラル派の著者には香山リカ、姜尚中、上野千鶴子らが含まれる。保守派の本に高評価、あるいはリベラル派の本に低評価をつけたレビュアを保守系レビュア、逆をリベラル系レビュアと定義し、彼らのAmazon上での全レビューを分析した。

その中で興味深かったのが、映画(DVD、Blu-ray)のレビューである。保守系レビュアのみが複数レビューしており且つ彼らの平均評点が高い映画を保守派が好む映画、リベラル系レビュアのみが複数レビューしており且つ彼らの平均評点が高い映画をリベラル派が好む映画と定義し、その違いを分析した。その結果、保守派は人間ドラマを好み、リベラル派は好色的内容や猟奇的内容の映画を好む傾向が見出せた。実際、それぞれのカテゴリの映画の解説文を機械学習にかけると、リベラル派が好む映画に「殺す」「誘う」「事件」などの表現が偏って多く見られることが分かった。この結果は、これまでのコラムで紹介した事例ベースで見られるリベラル派の特徴を統計的に裏付けるものである。

この研究には、学会未発表の内容も多くあるので、今回は速報に留める。詳細の開示は学会発表後までお待ちいただきたい。保守派、リベラル派の違いに関するビッグデータを用いた研究は今後も続ける予定なので、機会があれば適宜その成果を紹介していきたいと思う。

執筆者:掛谷英紀

 筑波大学システム情報系准教授。1993年東京大学理学部生物化学科卒業。1998年東京大学大学院工学系研究科先端学際工学専攻博士課程修了。博士(工学)。通信総合研究所(現・情報通信研究機構)研究員を経て、現職。専門はメディア工学。特定非営利活動法人言論責任保証協会代表理事。著書に『学問とは何か』(大学教育出版)、『学者のウソ』(ソフトバンク新書)、『「先見力」の授業』(かんき出版)など。

※寄稿文は執筆者の見解を示すものです。

※無断転載を禁じます。

関連記事
レプリコンワクチン「コスタイベ筋注用」の販売元の製薬企業 MeijiMeiji Seika ファルマ株式会社が、同社の社員が同ワクチン販売について内部事情を告発したとする書籍について内容に相違点があると発表した。
神韻芸術団2025年日本公演間近、全国42公演予定。伝統文化復興を目指す公演に観客の支持と絶賛の声が相次ぎ、チケットも記録的な売上を上げている。
北海道の2024年11月輸出額は前年同月比30.8%増の406億7500万円で6か月連続プラスとなった。輸出では鉄鋼、石油製品などが減少したものの、再輸出品(日本から輸出する外国産貨物)、魚介類・同調整品、一般機械などが増加した。
LGBT理解増進法の施行により、女性専用スペースの利用に混乱が生じる懸念がある中、自民・女性を守る議連が19日、公衆浴場などで「身体的な特徴」により男女を区別し、脱衣所などを分けるよう求める議員立法をまとめた。
海外にいる華人の中国国内の家族を人質にとって意のままに操るのは中国共産党当局の十八番。