キャンパスライフ

「めざせニュース検定」をテキストマイニングしてみた

2022/11/03

マネジメント研究科所属の修士2年の稲田です。

経営学科で13年間にわたって提供してきた「めざせニュース検定」が終了したことから八木先生の振り返り、その出題傾向はどうだったか調べてみてくれないかと、森先生から頼まれました。私が修士の研究で行っているテキストマイニングを利用して分析してほしいとのことでした。その結果が出たので、簡単に紹介してみたいと思います。


ニュース時事能力検定」(ニュース検定、N検)が2007年9月より行われています。これは、日本ニュース時事能力検定協会などが主催している検定試験で、新聞やテレビのニュース報道を読み解き,活用する力(時事力)をつけるための検定です。このN検の対策講座として、経営学科(その前身である社会情報学科)で模擬問題を提供してきたのが「めざせニュース検定」です。2008年10月2日から、毎日新聞岡山版に、週1回のペースで連載されてきました。問題は、四択式で、次のようなものです。

米人気コミック「バットマン」シリーズの舞台になっている架空都市「ゴッサム・シティ」と友好都市提携を結んだ都市は?
 1 出雲市
 2 福山市
 3 丸亀市
 4 土佐市


これは、3月28日に掲載された「めざせニュース検定」最後の模擬問題で、ハリウッド映画と日本の地方都市のコラボレーションが話題になったニュースをとりあげたものです。

これらの出題、計600題強を分析しようというのが今回の目的です。使用するのはテキストマイニングという手法です。これは、大量のテキスト型データからコンピュータを用いて自動的に言葉を取り出し、さまざな統計手法を利用して有益な情報を取り出すことの総称です。テキストマイニングを実行するためのソフトウェアとして樋口耕一氏によるKH Coderがあり、これを使用して分析を行いました。(テキストマイニングの詳細は、miniレクチャーを見てください。今回のニュース検定の分析を例に説明しています。)

さて、実際の分析結果です。
「めざせニュース検定」で使用された問題621問のうち、学生が制作した9問を除く612問を分析に使用しました。データは、抽出する品詞や語の取捨選択を行った後、KH Coderにかけました。

すべての問題文に使われている単語それぞれの使用頻度を見てみると、大体の着目分野がわかること、単語と単語のつながり具合を集計すると、どういった出題が多いかがかわること、出題者や出題年とクロスさせると、出題者や年による傾向の違いがわかること、などがあります。わかったこととしては、よく出題されていた話題として、
・政府が公表した調査結果を基にした出題、特に厚生労働省の人口統計(子ども数、高齢者数、女性に関する数など)
・オリンピックや東京オリンピック(選手やメダル数)
・世界遺産に関連した話題(あらたに登録された地域など)
・選挙に関する話題(大統領選もとりあげている)
・経済に関する話題
・日本と世界との関係
などがわかりました。

次に、出題者で違いがあるかにも興味があったので、それもみてみました。出題者は、森先生(238題)、八木先生(198題)、木村先生(176題)の3人です(正確には、3人以外の先生からの出題もあったのですが、数が少ないことから、それらは木村先生として集計しました)。
その結果、森先生は、「日本人」、「女子」、「調査」、「制度」、「厚生労働省」、「開発」、「宇宙」、「オリンピック」などが特徴的でした。データサイエンスの先生であることから、統計的なネタ、日本や女子に関する話題、制度に関連する話題を多く取り上げていることがわかります。また、宇宙(開発)やスポーツネタも多かったようです。「改正」という単語が顕著なので、法令等が改正されると、出題に使っていたようです。
八木先生は、「報告」、「割合」、「都道府県」、「大統領」、「首相」、「受賞」、「ノーベル」が特徴的です。「平均」や「女性」という単語もみられることから、八木先生も統計的な話題が多かったといえます。また、政治的な話題も多いことがわかります。ノーベル賞はよく取り上げていたようです。
木村先生は、「科学」、「選手」、「地球」、「遺産」、「登録」、「東京」、「地域」、「社会」と、科学ネタ、世界遺産関係、地域の問題(特に、東京)などが多く取り上げられていました。「条約」が特徴的で社会ネタも多かったようです。
木村先生と八木先生は、元新聞記者でもあり、バランスよく出題されていたように思います。

「めざせニュース検定」の出題傾向を調べてみたところ、公的統計に基づく出題やオリンピック、世界的なニュース、経済、政治などに関する話題が多いことがわかり、出題者については、その専門の分野に沿った出題傾向があることを感じることができました。

以上、「めざせニュース検定」の出題傾向のレポートでした。

このページのトップへ