2021年01月28日 09時00分 ソフトウェア

「記事中の誤字を教えてくれるエディタ」をイギリスの新聞社が開発



イギリスの大手新聞社・The Guardianが、言葉使いなどを統一する「スタイルガイド」に則した記事執筆をサポートするエディタ「Typerighter」を開発しました。Typerighterが実際に動作する様子やシステム構成などが詳細に語られています。



How we made Typerighter, the Guardian’s style guide checker | | The Guardian

https://www.theguardian.com/info/2021/jan/26/how-we-made-typerighter-the-guardians-style-guide-checker





1928年に初版が発行されたThe Guardianのスタイルガイドは、記事作成時点ではインターネット上に公開されており、誰でも閲覧することが可能。The Guardianは1821年に設立された長い歴史を持つ新聞社であるため、スタイルガイドも大規模なものとなっています。



副編集長として中途入社した社員が正規表現を用いてスタイルガイドに基づく正誤判定ルールを作成したところ、その数は1万3000個にも及んだとのこと。また、スタイルガイドは時代に合わせて更新されていくため、ライターが最新のスタイルガイドに則した記事を執筆できる仕組みが求められていました。



こうした背景から、The Guardianの編集ツール開発チームはスタイルガイドに則した記事を簡単に執筆できる「Typerighter」というエディタを開発しました。YouTubeでは、Typerighterが実際に動作する様子やシステム構成などが公開されています



Typerighter hard at work on a production article. - YouTube





Typerighterに文章を読み込ませると、The Guardianのスタイルガイドに基づく誤字などがハイライトされます。





ハイライトされた部分をクリックすると、正しい表記がポップアップで提案されます。緑色のボタンをクリックすれば……





提案された単語で誤字を訂正することが可能。こんな感じで、Typerighterは非常に簡単に文章をスタイルガイドと照合できるエディタとなっています。





Typerighterのシステム設計はこんな感じ。スタイルガイドのルールは図の「Rule management service」にあたるGoogle スプレッドシートに保存されており、ブラウザから見たTyperighterのUIはReact上でエディタフレームワークの「ProseMirror」を用いて開発されているとのこと。中心機能となるScala製の「Rule application service」は、スプレッドシートからルールを取得し、ブラウザから送信される単語をルールと照合して、結果をブラウザに返す役割を担っています。





また、「どの提案がライターに頻繁に受け入れられているか」といったログ情報については、もともとThe Guardian内で運用していたElasticsearchに集約。GrafanaでElasticsearchのログを可視化することで、Typerighterの利用状況がすぐにわかるようになっています。Typerighterの開発は開発チームのメンバーだけでなく、ライターからのフィードバックも参考にして通信量の削減やUIの洗練といった改良を施していったそうです。





Typerighterの大きな特徴は、誤字を「自動修正」するのではなく「正しい単語を提案」する点。この特徴について開発チームは「Typerighterはスタイルガイドとの整合性を図ることはできますが、現場における編集上の判断に代わるものではありません」とコメント。Typerighterの目的はあくまでも、ライターの余計な作業を減らして記事執筆に集中できる環境を提供すること、というわけです。



2021年1月時点で、TyperighterはThe Guardianに投稿される記事の半分に利用されており、今後はGoogle スプレッドシートを独自のルール管理システムに置き換える予定とのこと。なお、Typerighterについて説明している今回の記事自体もTyperighterでチェックされており、いくつか誤字が見つかったそうです。





TyperighterはオープンソースとしてGitHub上に公開されており、誰でも利用することができます。



GitHub - guardian/prosemirror-typerighter: The client-side companion of Typerighter: manage matching ranges in Prosemirror documents with spellchecker-like semantics.

https://github.com/guardian/prosemirror-typerighter