レビュー

テキストを古活字(くずし字)に変換できる「そあん(soan)」が登場したので現代の文章を趣深い見た目に変換してみた


現代の日本で利用されている日本語のテキストを、16世紀末から17世紀初めという非常に短い期間に日本で刊行された古活字版で使用された古活字(くずし字)に変換することができる「そあん(soan)」をROIS-DS人文学オープンデータ共同利用センターが公開しました。そあんではテキストを古活字に変換した画像を生成してくれるということで、さっそく使ってみました。

そあん(soan):現代日本語を古活字(くずし字)に変換するサービス | ROIS-DS人文学オープンデータ共同利用センター(CODH)
http://codh.rois.ac.jp/soan/




そあんの使い方は簡単で、専用ページにアクセスして画面上部の「古活字(くずし字)変換サービス」と書かれた部分の「サーバ共有型サービス」の下にあるテキストボックスに変換したいテキストを入力して、「古活字(くずし字)画像を生成!」をクリック。サンプルとして「吾輩は猫である」と「日本国憲法第九条」が用意されているので、今回は「吾輩は猫である」の一文を変換してみました。


しかし、利用者が殺到しているのか、記事作成時点ではサーバ共有型サービスではエラーを起こして画像が出力されないケースが頻発します。


そんな場合はブラウザ完結型のそあんを利用すればOK。ブラウザ完結型のそあんは以下から利用できます。

そあん(soan):現代日本語を古活字(くずし字)で描画するライブラリ
http://codh.rois.ac.jp/soan/demo/


利用方法は簡単で、テキストボックスに画像化したテキストを入力して「画像生成」をクリックするだけ。


すると、テキストボックスの下に画像が生成されます。画像の下には「画像ダウンロード」というボタンがあるので、ここから生成した画像をダウンロードすることもできます。


ダウンロードした画像が以下です。縦1100×横900ピクセルのJPG画像として出力されてました。


なお、「画像生成」ボタンの横にある「設定」ボタンから、フォントの使用や連綿(続け字)の使用、行長、行間、余白、生成画像サイズ倍率などを変更できます。


GIGAZINEについてのページにある紹介文を変換してみると以下のようになりました。アラビア数字やカタカナは古活字に置き換えられますが、アラビア数字の「0」は記号の「〇」に置き換えられ、アルファベットの表記は古活字に置き換えられないまま出力されるようです。


そあんは400年ほど前に活字を用いて印刷された本から作成した「古活字データセット」と、この古活字データセットの古活字画像を用いて現代日本語テキストを描画するJavaScriptライブラリ「そあん(soan)ライブラリ」を用いてテキストをくずし字に変換しています。

なお、そあんを利用して生成した画像は自由に利用可能ですが、そあんが利用する古活字データセット自体はクリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下で提供されているので、古活字データセット全体を利用する場合はライセンスに注意を払う必要があります。

この記事のタイトルとURLをコピーする

・関連記事
AIくずし字認識アプリ「みを(miwo)」を使ってみた - GIGAZINE

「日本語のくずし字をAIで活字に直す試み」の活発化に海外の研究者らも注目 - GIGAZINE

日本語翻訳の「漢字表記の間違い」を海外の開発者にも端的に説明してくれる「Your Code Displays Japanese Wrong」 - GIGAZINE

人類最古の文字「楔形文字」の書き方 - GIGAZINE

DeepMindの碑文解読AI「Ithaca」で失われた碑文を72%の精度で復元することに成功 - GIGAZINE

in レビュー,   ネットサービス, Posted by logu_ii

You can read the machine translated English article here.