miniレクチャー

miniレクチャー

データサイエンス

視聴率、1%の差で一喜一憂するけど・・・? ~標本調査における比率のからくり~

標本調査の結果には幅がある


たとえば、「現政権支持率30%」と報道されたとき、実際の値(全員を調査したときの値=真の値)は1%の狂いもなく30%だと思いますか。ピッタリ30%かもしれませんが、一部の人を調査した結果(標本調査の結果)なので、30%に近い値ほど可能性が高く、実際は30.5%や28.1%だったりしても、おかしいとは思いませんよね。そして、調査人数によっても印象が変わるでしょう。200人と3,000人・・・当然、3,000人の方がより正確だと感じると思います。

このように、私たちは、調査結果としての比率をある程度の幅をもってとらえます(とらえていなかった人、この機会に認識を新たにしてくださいね)。一定の値をプラスマイナスした範囲に真の値があると認識しているわけです。この一定の値を「誤差」(標本抽出による誤差なので「標本誤差」)といいます。そして、この誤差は、調査人数によって異なり、人数が多ければ多いほど、小さくなります。

では、視聴率で考えてみましょう。

視聴率30%の番組Aと40%の番組Bがあったとします。調査数は200としましょう。このとき、誤差は、それぞれ±6.4%、±6.8%となります(詳しくは次の節を見てください)。ということは、番組Aの真の視聴数は、30-6.4(%)と30+6.4(%)の間、すなわち、23.6%~36.4%のどこかあることがわかります。同様に、番組Bの真の値の範囲は33.2%~46.8%となります。(この値は、100回調査したとき、95回はこの範囲に収まるという条件の下で求められたものです。これを信頼度95%といいます。)
この範囲を図に表すと次のようになります。

30%の範囲(オレンジ)40%の範囲(青)が重なっている部分がありますね。ということは、真の視聴数は逆転しているかもしれないということになります(たとえば、番組Aが35%で、番組Bが34%)。調査数が200ぐらいだと、30%より40%の方が「必ず多い」とはいい切れないことになるわけです。一方、調査数が400になると、誤差はそれぞれ±4.5%と±4.8%となりますので、重なるところがなく、40%の方が多いといってもよいことになります。

標本誤差について

この視聴率(テレビ視聴率)、どんなテレビ番組をどれぐらいの世帯・人が見ているかを標本調査によって明らかにするもので、世の中の動向を把握したり、放送局の制作・編成に活用したりするための重要な調査です。視聴率調査は社会調査の1つであり、データサイエンスが活かされている典型的な例です。
調査は、株式会社ビデオリサーチが全国を27地区に分けて行っており、2020年4月現在、関東地区では2,700、関西地区では1,200、名古屋地区では900、北部九州と札幌では400、これら以外の各地区では200の世帯から視聴データを収集・集計し、視聴率(世帯視聴率と個人視聴率)を公表しています。
ビデオリサーチ社は、正しいデータを得るために、統計理論に基づいて調査を設計し、調査対象の抽出、データ収集、データ集計を行っていますが、同時に、視聴率を利用する人にも注意すべきことをホームページ等で示しています。その1つが「標本誤差」です。

標本誤差は、

で計算されます(ビデオリサーチ社では、1.96のところを2にして説明しています)。
30%のときの誤差を求めるには、上式の[比率]のところに30を入れて計算します。実は、この式、データサイエンスのminiレクチャー第2回「なぜこんなにも早く当確が出るの?」にも出ています(第2回の式では、全体を100%ではなく 1 としていますので、比率が30%の場合は0.3として式に代入します)。
下の表は、縦方向に比率、横方向に調査数をとって、それぞれの場合の誤差を上式から Excel で求めたものです。同じ比率でも調査数が増えるほど、誤差が小さくなるのがわかります。

これを用いて、タイトルにある1%の差の場合を見てみましょう。
表内の24%と25%のところを見てください。調査数が3,000でも誤差は±1.5ほどあります。ということは、差が1%の場合、調査数をそれなりに多くしても、真の値の逆転はありえるんですね。なので、「うちの番組は視聴率26%、ライバル番組は25%。1%勝ったぞ!」、「最高瞬間視聴率12.3%、あー、あと0.3%で1位になれたのに・・・」といった一喜一憂は、理論的にはあまり意味がないということですね。
別の例でいうと、「統計理論に基づいて、1,200人に好きなタレントを聞いたところ、トップはタレントKで4.9%、次はSで4.2%、そしてGが3.5%でした。この結果、日本人に好まれているタレントの第1位はKさんです。」というのも、信頼できる情報とはいえないことになります。こういったことをわかった上で、標本調査で求められた比率をしっかり見るようにしたいものです。

この視聴率調査、2020年3月30日から新しい取り組みが行われています。デジタルデバイスの普及や見逃し配信サービスの普及などにより、視聴者の視聴行動やテレビを取り巻く環境が大きく変化してきているからです。こうした変化を踏まえ、より正確にテレビの視聴を測定し、テレビの正しい価値を把握することを目的に、録画番組を7日以内に視聴した「タイムシフト視聴率」を全地区で計測したり、BS番組や動画配信でも視聴率を計測することが始まっています。

社会の動きを知るためには、社会の変化を敏感にとらえ、しっかりした調査設計の下、データを取り、そして、結果を利用する際も、数値に惑わされることなく、正しく解釈できるよう心掛けることが大切だということですね。

このページのトップへ