メモ

400万件のホテルレビューを機械学習させてわかったこととは?

by Jennifer Woodard Maderazo

旅行情報サイト・トリップアドバイザーに投稿された世界中のホテルのレビュー400万件を、機械学習によるテキスト分析を行っているMonkyLearnが分析した結果、いろいろなことが見えてきました。

Machine Learning over 1M hotel reviews finds interesting insights | MonkeyLearn Blog
https://blog.monkeylearn.com/machine-learning-1m-hotel-reviews-finds-interesting-insights/



まず、レビューの評価内容を「ポジティブ」「ネガティブ」で分けると、ポジティブな評価を与えたレビューの割合が82%でした。


このホテル評価を都市別に分けると、ロンドンのホテルの評価において、明らかに他の都市と比べてネガティブ評価が多かったことがわかりました。下記がそのグラフで、左からニューヨーク、パリ、ロンドン、バンコク、マドリード、北京、リオデジャネイロの7都市が並んでいますが、おおむねポジティブ評価は8割を超えているのに、ロンドンだけは8割を切っています。


理由を知るべく、評価軸ごとに分けたものがコレ。「心地よさと設備面」で、ロンドンは最もネガティブ評価の多い都市となっています。


食事の面でも、ロンドンは他に比べてややネガティブ評価が多い状況。


「所在地」の点では、いずれの都市もほぼ同じような結果に。つまり、ロンドンの評価の足を大きく引っ張っているのは、施設面の問題であると考えられます。


登録されているホテルは「1つ星」から「5つ星」という格付けが行われています。星の数が多いほどサービスや設備の質が高いということになりますが、それはレビューの結果にも表れており、ポジティブ評価の割合は星の数が多いほど増えています。


ところが、「インターネット」という点だけに絞ると、3つ星ホテルでも5つ星ホテルでも評価は同じぐらいという結果が出ています。


さらに、金額面だと、5つ星ホテルよりも3つ星ホテルの方が高評価の割合が高いという結果に。「この設備でこの価格ならOK」と考えた人が多かったということです。


このほか個別の問題として、いずれの都市においても衛生面の問題としてカーペット、ベッド、落ちている髪の毛、南京虫、汚れなどが上げられていましたが、バンコクのホテルだけは「ゴキブリが出る」という指摘が含まれていました。また、ニューヨークでは「共用トイレ」が汚いという苦情がありました。「クロワッサン」という語はパリのホテルに関するレビューにのみ登場するのですが、いずれもネガティブな文脈で登場していて、深く見ていくと、どのホテルでも朝食がクロワッサンばっかりという点が苦情に繋がっていました。

なお、このデータ分析で用いられたコードはGitHubで公開されています。

GitHub - monkeylearn/hotel-review-analysis: Sentiment analysis and aspect classification for hotel reviews using machine learning models with MonkeyLearn.
https://github.com/monkeylearn/hotel-review-analysis

この記事のタイトルとURLをコピーする

・関連記事
死ぬまでには一度は泊まってみたい世界の豪華ホテル21選 - GIGAZINE

世界で最も高級なホテル トップ7 - GIGAZINE

貧乏バックパッカーなのにドバイで三ツ星ホテルに泊まってみた - GIGAZINE

1万円以下でパリに宿泊できてWi-Fiも完備「Hôtel du Roussillon」宿泊レポ - GIGAZINE

7000円台で朝食付き、ニューヨークの好立地ホテル「コロニアルハウスイン」に泊まってみました - GIGAZINE

安宿のコストパフォーマンスを比較、バンコクで快適に過ごすにはいくら必要なのか? - GIGAZINE

はたしてホテルのルームサービスの料金は高いのか? - GIGAZINE

in メモ, Posted by logc_nt

You can read the machine translated English article here.