1. ホーム > 
  2. 新着情報 > 
  3. データサイエンスラボ⑤(経営コンペチーム:最終報告会)

新着情報

データサイエンスラボ⑤(経営コンペチーム:最終報告会)

2022年03月04日イノベーション・ラボ

秋学期、「データサイエンス」ラボは、3つのチームに分かれて、公募型のデータ解析コンペティションに参加しています。「第5回和歌山県データ利活用コンペティション」(わかやまチーム)、「第 11 回スポーツデータ解析コンペティション」(スポーツチーム)、「令和3年度データ解析コンペティション(経営科学系研究部会連合協議会)」(経営チーム)の3つです。その経営チームが「令和3年度データ解析コンペティション(経営科学系研究部会連合協議会)」が予選にあたる部会の最終報告会を終えましたので、報告をします。(これが「データサイエンス」ラボ、最後の報告です。)

経営科学系研究部会連合協議会が主催する「データ解析コンペティション」は、1994年から毎年開催されているコンペで、同連合協議会に名を連ねる団体(今年度は11団体)ごとにデータ分析結果の報告を行い、その優秀チームで全体最終報告会に臨むというものです。
私たちのチームは、「日本計算機統計学会データ解析スタディーグループ」(CS-DAS部会)に属し、32チームと戦うことになりました。審査は、学生部門(27チーム)と一般部門(5チーム)に分けて行われるので、実際には27チームと争います。

スケジュールは次のとおりです。

  • 2021年8月10日:発会式
  • 2021年9月9日:データ提供
  • 2021年12月18日:CS-DAS部会中間発表会
  • 2022年2月19日:CS-DAS部会最終報告会
  • 2022年3月8日:成果報告会

提供されたデータは、次のようなものです。妊婦さんや乳幼児をもつ親向けのポータルサイト(コネヒト株式会社さんが提供する「ママリ」)に投稿されたQ&Aと検索履歴のデータ3年分です。ユーザー情報が290万、質問が540万、回答が3500万、検索情報が1.2億と、膨大な量です。Excelが扱えるのは104万行・・・さて、どうするか。しかも自然言語ですから、テキストマイニングが主たる分析手法になる・・・でも、手近にあるソフトで扱えるデータ量にも限界が・・・工夫のしどころです。
そこで、巨大ファイルが扱えるエディタ(EmEditor)を手に入れ、このエディタを駆使して、単純集計や対象とするデータの抽出を行っていきました。
分析の目標としたのは、このサイトの利用者を増やすこと。そのためには、よりよい回答を増やす必要があるという提案をすべく、良い回答(グッドアンサー)と普通の回答(ノーマルアンサー)の様相を提供されたデータから分析していくことにしました。単純集計された結果はExcelで可視化し、グッドアンサーとノーマルアンサーの特徴の分析には、テキストマイニングソフト(KH Coder)を使い、頻出語や文字数、共起ネットワークなどにより、グッドアンサーとノーマルアンサーの比較を行い、良い回答の特徴を明らかにしていきました。


(内容は契約の関係で無許可では公開できませんので、イメージだけご覧ください。)

そのまとめをもって、12月18日の中間発表会に臨みました。発表会はオンラインで行われました。参加チームが32もあるということに驚き、かつトップバッターということで、緊張して発表を行いました。

この中間発表会で勉強になったのは、他チームの取り組み方でした。使っている手法が高度で、分析結果にも納得させられたりしましたが、何よりも、各チームの分析の観点や発表のまとめ方が参考になりました。学年が上のチーム、特に一般部門の5チームは一味も二味も違っていて、とても感心させられました。(この日、うちの「わかやまチーム」の最終審査会がYouTubeで生配信されていましたので、途中、その応援に回りました。)

中間発表会で感化され、しかし、私たちは私たち、ということで、得たことを活かし、これまでの分析をより正確なものにするとともに、中間発表会で参考となったネガ・ポジ分析という分析手法も追加して、最終報告会の準備にかかりました。

最終報告会は、8~10分の発表動画を事前に提出して、当日、質疑を行うというもの、ギリギリまで分析を行い、前日の2月18日、ビデオ撮りを行いました。

いよいよ、本番。今回もオンラインです。発表順は中間発表会と同じで、トップバッター。9時50分、まず、自分たちの動画を見ながら、質疑の時間を待ちます。動画が終了すると、2件ほど、質問をいただきました。きちんと回答できました!

続けて、17時35分まで、32件の報告と質疑が続きます。同時進行で、審査が行われました。当日の18時30分、審査結果が報告されました。

結果は・・・残念ながら、CS-DAS部会の代表として、全体の成果報告会には行けませんでした。ですが、全国の大学が参加するコンペティションに参加し、多くの人の前で発表を行ったことや企業が扱うビッグデータについて実際に目にして扱うことができたことなど、自分の成長に繋がるよい経験となりました。

新着情報

イノベーション・ラボ(課題解決型学習)とは?

資料請求

Copyright (c) 岡山理科大学経営学部 イノベーション・ラボセンター All Rights Reserved.