Twitterでの番組の評判を番組作りに活かすNHKのつぶやき解析技術
テレビを見ながらその番組についての感想や思ったことをツイートするのは今や当たり前の行為ですが、せっかくそういったツイートがあるのだったら番組制作に何か活かせるのではないか、ということでNHKがつぶやきを解析して分類する技術を開発・運用しています。
展示項目14 評判分析のためのTwitter解析技術 | NHK技研公開2013
http://www.nhk.or.jp/strl/open2013/tenji/tenji14/index.html
NHKでは、まずTwitter上で「NHK」というキーワードの入ったツイートを収集しました。すると、その大半はNHKのニュースをリツイートしたものだったり、NHK自体についてのツイートだったりで、正式な番組名が明記されたツイートというのは20~30%でした。そこで、たとえばNHKスペシャルであれば「Nスペ」、クローズアップ現代であれば「クロ現」のように、略したものであっても拾えるようにした番組名判定アルゴリズムを開発し、番組ごとにそれぞれどの放送回のツイートなのかも推定できるようにしました。
これは、4月28日から5月5日までの、NHKに関連したツイートの数。5月3日は特にツイートが多いことが分かります。
その5月3日に、連続テレビ小説「あまちゃん」についてのツイートがどれぐらい行われたのか、時間別に並べたもの。本放送の時間帯にツイートしている人が最も多く、ほかに再放送の時間帯になるとツイート数が増えています。
「5月3日22時」という時間に限ったときの、ツイートされた番組ランキング。1位は「双方向クイズ 天下統一」で、この番組は視聴者がリモコンで参加できるクイズ番組であることもあって、ツイート数が伸びています。また、「あまちゃん」がBSでの再放送のおかげで2位に食い込んでいます。
ツイートはTwitterで検索して表示できるものから拾われていて、我々が見られるのと同じデータを使用しています。分析・解析するにあたって、ツイートを大きく「意見」「行動」「情報」の3カテゴリに分類。このカテゴリ内で、「意見」はネガ・ポジ・中立・要望・期待、行動は推薦・宣言・待機・視聴・見逃・録画・NOD、情報は商品・予定・内容・自分・リンク・ニュース・公式@・指標の20種類の項目に分かれています。たとえば「八重の桜が始まるまで待機、今日も楽しみ」というツイートであれば「ポジ」「待機」としてカウントされる、という仕組みです。
ゴールデンタイムの1週間平均ツイートを見てみると、番組関連は4割弱で、残りは非番組関連のツイート。さらに、正式な番組名や公式ハッシュタグを使ってのツイートは全体の13.5%で、番組名を省略しているものが7.3%、番組名の表記がないもの(「あまちゃん」を「じぇじぇじぇ」と愛称で呼んでいるものなど)が6.7%。
少しでも多くのツイートを拾うため、番組名表現の検出・出演者とEPGとの照合による番組判定・ツイート時刻からの番組判定という3種類の判定を組み合わせているとのこと。
イメージとしてはこんな感じ
このシステムで得られた意見は実際に番組制作のチームに渡されているとのことですが、システム自体については社内向けのものなので、一般に向けて公開するようなものではないとのことでした。今後は検出精度・分類精度を高めて、より効率的な集計作業を実現していく予定です。
この技術は、6月2日までNHK技術研究所で行われているNHK技研公開2013にて実際に見ることができます。事前の登録などは不要で、入場無料です。
・関連記事
Twitter公式のアクセス解析「Twitter Web Analytics」新登場、ツイートボタンの効果測定が可能に - GIGAZINE
アニメの人気度をTwitter言及数からグラフ化する「アニメソーシャル解析」 - GIGAZINE
どんな夢を見ているのか睡眠中の脳活動を解析して高い精度での解読に成功 - GIGAZINE
・関連コンテンツ