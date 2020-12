2020年12月27日 18時00分 メモ

絵文字の偉大な功績の1つは「文字コードを統一したこと」



数字を処理するコンピューター上で文字を扱うためには、文字コードと呼ばれるバイト表現が重要となります。かつては国や言語ごとにバラバラの文字コードを使っていましたが、記事作成時点ではUnicodeにほぼ統一されているといえます。そんなUnicodeへの統一には絵文字が大きな役割を果たしたと、ソフトウェア開発企業のIbexaでシニアデベロッパーアドボケイトを務めるJani Tarvainen氏が解説しています。



Emojis paved the way for UTF-8 everywhere

https://developers.ibexa.co/blog/emojis-paved-the-way-for-utf-8-everywhere



Tarvainen氏の母語であるフィンランド語には、アルファベットに「Ä」などのウムラウトや「Å」などのリングといった記号を伴うことがあります。これらの記号はアメリカ英語に登場しないため、かつては「Ä」や「Å」を「A」と表記せざるを得ませんでした。



やがて1991年にUnicodeが登場したことで、コンピューターv上でさまざまな文字を使うことができるようになり、ウムラウトやリングも表記することが可能になりました。



by ☃



しかし、Unicode登場以前は国や言語ごとに定められている文字コードが異なっていたこともあり、環境によっては特殊文字を表示できないことが多くありました。この問題は、複数の環境からインターネットを介して1つのテキストにアクセスする状況が生まれることで顕著になりました。



例えば、2000年代初めにTarvainen氏はWindows NTのワークステーションを使ってHTMLをテキストエディタで打ち込んでいましたが、同僚のアートディレクターはMacintosh Latin環境のPower Macintosh G3とMacOS 9を使っており、Travainen氏が打ち込んだ「lärvilautanen」「Rytsölä」などの特殊文字を使った言葉が文字化けしてしまい、正常に表示することができませんでした。



また、Nokiaなどの北欧にある携帯電話メーカーの開発プロジェクトに携わっていたTravainen氏は、ヘブライ語やハンガリー語などの取り扱いで、環境差による文字表記の問題が無視できなくなるほど大きくなっていったと述べています。ラテンアルファベットであれば「charset = iso-8859-1」のメタタグを使うなどすれば解決できましたが、アラビア語や日本語、中国語になるともはや解決は不可能でした。



by Greg Grossmeier



1996年に英語圏で主に使われていたASCIIと互換可能なUnicodeの符号化方式であるUTF-8が制定されました。しかし、デフォルトでUnicodeに対応していない環境はたくさん存在していたとのこと。Unicodeに漢字などの特殊文字が少しずつ追加されているものの、英語のアルファベットには新しい文字が追加されることがないので、わざわざUnicode・UTF-8には対応しないソフトウェアや環境が英語圏で多かったためです。



しかし、英語圏でもUTF-8やUTF-16への対応が一気に進んだのは、絵文字の流行のおかげだとTarvainen氏は指摘しています。スマートフォンが普及し、英語圏の人もアルファベットと同じように日本生まれの絵文字を使い、「Emoji」という言葉も浸透するまでになりました。



by Forsaken Fotos



絵文字はソーシャルメディアの時代に他人とコミュニケーションを築くための必須ツールとなりました。Googleが積極的に絵文字のUnicodeへの採用を推し進め、2010年にUnicode 6.0として採用。多くの絵文字をサポートするUnicodeとその符号化形式であるUTF-8やUTF-16へのソフトウェアの対応が進んだというわけです。



Tarvainen氏は「絵文字を使っていただき、本当にありがとうございます。皆さんはは私の🍑(peach≒pinch)を救ってくれました」と述べました。