ソフトウェア

95億円で買収・人間のような自然な文章を自動で生成可能な「Wordsmith」プラットフォームとは


エクセルなどの表計算ソフトを使えば見やすい表やグラフを簡単に作ることができますが、そのデータを分析してわかりやすく伝えるというのは全く別の仕事になります。これまでは豊富な知識や経験のある専門家が求められたそのような作業を、必要なデータを与えるだけで自動的に文章にしてくれるというプラットフォームが、Automated Insights(AI)社が開発した「Wordsmith」です。そんな技術を開発したAI社は8000万ドル(約95億円)という額で投資会社に買収され、さらなる成長を伺っています。

Automated Insights - Natural Language Generation and Business Intelligence Reporting
http://automatedinsights.com/

データから文章を自動で生成するメリットを解説した以下のムービーを見れば、その内容がよく理解できます。

Automated Insights @ Google Demo Day - YouTube


こちらの男性が、AI社の創業者でCEOのRobbie Allen氏。非常にわかりやすいミニドラマを使ってデータから自動で文章を生成するメリットを解説しています。


午前9時、病院にて。


「はい、これがあなたの健康データです」と医者からレポートを渡されましたが……


その内容は数値やグラフだけのデータシート。


そのまま医者は部屋を出て行ってしまいました。「先生、ところで僕の健康状態は……あ、あれ?先生!」こんなデータだけ渡されても、患者はどう理解すればいいのかチンプンカンプン。


午後1時、会社のオフィスにて


「今日は、あなたの人事考課をお伝えするために来てもらいました」


手渡されたのは、やっぱりグラフだらけのデータシート。


「で、私の評価についてはいったい…?」と尋ねる男性。


「専門のデータ分析官を呼びましょう。ポチッ」とスタッフを呼び出し。


「このグラフはあなたのリーダーシップについて説明しており……」と解説するスタッフ。どうせなら、その内容を最初から書いておけば理解しやすいのですが。


そして午後8時のディナータイム。


「僕と結婚してくれるかい?」とプロポーズ。


「ん~……」と苦い表情の女性。その理由は……


「このチャートが示すように、実は懸念材料があり……」と図を示しながら説明。


撃沈する男性。これはひとたまりもありません。


このように、グラフや表だけでは説明を行うことはできず、伝えるためには「言葉」が必要だというのがAI社のコンセプト。


同社の特許技術である「Wordsmith」テクノロジーは、数字の羅列だけのデータをもとに自動で分析を行い、人が理解しやすい文章を自動で生成する変換エンジンです。


対応する分野は経済だけにとどまらず、スポーツの分野にも取り入れられています。以下のYahooスポーツのページでは、フットボールリーグの戦況をまとめたレポートが自動で生成されている模様。


AI社のWordsmithテクノロジーは、広い分野ですでに導入されており、Samsungやヤフー、Microsoft、AP通信など聞き慣れた企業にも取り入れられているとのこと。


このWordsmithテクノロジーを、マーケティングに応用する技術も開発されているそうです。


なお、Wordsmithの名称は「鍛冶屋」を意味する「Swordsmith」から名付けられている模様。言葉を扱う専門の職人という意味が込められているようです。Wordsmithのテキスト生成の仕組みは、以下のページでもざっくりと紹介されています。

Automated Insights - How it Works
http://automatedinsights.com/how_it_works/

まずは必要なデータの取得。1.APIを通じてデータを取得したり、XMLデータやCSVデータからの吸い上げなど、ありとあらゆる形式からデータを集め、2.データセットを独自の方式で分析し、トレンド解析や時間軸の並び替えを行います。


3.分析したデータをもとにインサイトを見つけ出し、4.自然言語生成技術を用いて読みやすい文章を生成。ここでは文章の長さを変えたり、見出し形式やビジュアライゼーションなどの表現を取り入れることも可能とのこと。そして、5.さまざまなプラットフォームへの発信までを行うというのが、AI社が提供しているサービスの概要です。


そんなWordsmithが作った文章の自然さを試すムービーがこちら。3つの文章を読み上げて、どれがWordsmithで書かれた文章かを推測します。

Does Our Content Sound Robotic? | Ask Ai - YouTube


自動車関連のトピックでは、2014年型BMW7シリーズの仕様を解説する文章や……


企業の決算情報のレポートは、詳細なデータをもとに実績を分析。


そして、フットボール関連のネタなど、バラエティ豊かな文章が読み上げられました。


「さぁ、Wordsmithが自動で生成した文章はどれかな?」


その答えはなんと「3つすべて」というもの。そう思ってもう一度聞き直してみても、不自然さは全く感じられないのが不思議なほどの仕上がりでした。


Wordsmithによって書かれたニュースはすでに一般ユーザーにも届いています。例えば、世界的に有名なAP通信が配信するニュースにも、その技術が取り入れられています。例えばマコーミック社の四半期決算を取り上げた以下のページ。「マコーミック社は木曜に第3四半期の決算報告を発表し、1億2290億ドルの利益を計上した」という内容が書かれています。


ここで興味深いのは、単なる売上データを羅列するだけではないということ。「市場の期待を超える」などの分析内容を盛り込んでいたり、マコーミック社について「スパイス・シーズニング材料を扱う企業」と違う言い回しを取り入れることで、より自然な文体を実現しているところが、Wordsmithが可能にしているNatural Language Generation(自然言語生成)の技術の成果といえそうです。

AI社の技術により生成された記事には以下のようなクレジットが入っているので、簡単に見分けることができるようになっています。


試しに「story was generated by Automated Insights」のフレーズで検索してみたところ、アメリカのYahoo!ニュースやCNBCの記事など、約4万件のページがヒットしました。想像以上に多くの場所で使われていたことに少し驚きを感じます。

Apple tops Street 1Q forecasts - Yahoo Finance


AerCap beats Street 4Q forecasts


それまでは、ただでさえ仕事に忙殺される記者が空いている時間や早朝に企業からの発表資料に目を通し、必要な数字を抜き出したうえで、あらかじめ作成しておいたアウトラインに数字を入れて成形し、記事として公表するという作業を強いられていたわけですが、Wordsmithの導入でこの作業がほぼ自動化されることになり、わずか数秒で記事が完成するようになったとのこと。Wordsmith導入により、それまでは四半期あたり300件が限界だったこの種の記事作成が、現在では3000件にまで増加したそうです。

このような突出した技術を開発したAI社は、「世界最大の未公開株式投資会社」といわれるVista Equity Partners(VEP)により8000万ドル(約95億円)で買収されています。VEPでは、AI社のライバルでスポーツの分野に特化したSTATS社をすでに買収しており、不動産やマーケティング分野、経済、スポーツの分野に強いAI社を取り込むことで、傘下に収める26社が保有するデータの活用に役立てられるものとみられます。

We’ve Been Acquired! But Wait, There’s More. - Automated Insights
http://blog.automatedinsights.com/post/110808141052/weve-been-acquired-but-wait-theres-more

この記事のタイトルとURLをコピーする

・関連記事
ゴッホの絵をコンピュータに描かせるとどうなるか? - GIGAZINE

Googleの自動運転カーは毎秒1GBのデータを処理、これがGoogleカーから見た世界 - GIGAZINE

コンピュータを進化させてきた偉大なるアルゴリズムまとめ - GIGAZINE

Googleの人工知能開発をリードするDeepMindの天才デミス・ハサビス氏とはどんな人物なのか? - GIGAZINE

自分で判断して行動する「シロアリロボット」の開発がハーバード大で進行中 - GIGAZINE

IBMのスパコンWatsonの頭脳を持ちあらゆる疑問に答えられる知育玩具「CogniToys」 - GIGAZINE

マリオが自己学習し感情さえも持つ人工知能のプロジェクトとは? - GIGAZINE

Skypeがリアルタイム音声翻訳プレビュー版を公開、その仕組みとは? - GIGAZINE

in ソフトウェア,   動画, Posted by darkhorse_log

You can read the machine translated English article here.