上のトーフの例では分かりにくいのですが,これらのトーフは実はそれぞれが互いに異なっています。HTMLソースを GNU Emacs(フリーでクロスプラットフォームのテキストエディタ)で開き,当該箇所を確認してみますと,図1のように各トーフにはコードポイント(ユニコード文字集合の中における当該文字の符号位置)が16進数で振られていることが分かります。
Emacs はフル・ユニコード・サポートのアプリケーションソフトですから,例えば「線文字Bの牡ウシ」文字のコードポイントは16進数で 1008d,10進数で 65677,8進数で 200215 であることも分かります。Emacs では Ctrl x 8 キーを打った後 Enter キーを叩き,続けて当該文字の16進数コードもしくはユニコードによる正式名称 LINEAR B IDEOGRAM B109M BULL を打ち込むことで全ユニコード文字を入力できるようになっています。出力には,しかし,当該文字を含むフォントが必要です。図1の Emacs では Noto を設定していなかったためこのようにトーフが現れてしまいましたが,Emacs に正しく Noto を設定してやれば線文字Bも正しく表示されるようになります。
たとえば Noto Color Emoji の使用は Linux(Android も含む)上に限られ,Windows と Mac では使えない(白黒の Noto Emoji でしたら Windows や Mac でも使えます)とか,欧文フォントの基本ファミリ(書体)であるセリフ体とサンセリフ体の双方に対応する Upright や Italic シェイプはあるものの,専用にデザインされた Small Caps シェイプは存在しないとか,現時点で少々の瑕疵がなくはないとは言え,それでも Noto は画期的な素晴らしいフリーのフォントです。特に,統一されたフォントデザインから来る多言語混在時の「多文字種間の視覚的調和美」(Pan-Language Harmony)は特筆ものです。図2は『創世記』1:1 のテキストを Noto を使って英語(ラテン文字),ロシア語(キリル文字),ギリシア語(ギリシア文字,アクセント・気息記号も含む),ヘブライ語(ヘブライ文字,右から左書き,ニクード記号も含む),中国語(繁體字および简化字),日本語,朝鮮語(한글)で混在表示させたものです。
CJK に関しては 简化字として GB 18030(「信息技术中文编码字符集」)および「通用规范汉字表」の漢字全て,繁體字として Big5(台湾)および HKSCS(香港)の漢字(「教育部國字標準字體」)全て,朝鮮語では各種ハングル(한글)および KS X 1001 と KS X 1002 の漢字全て,日本語では平仮名・片仮名をはじめ Adobe-Japan1-6(JIS X 0208 と JIS X 0213 および JIS X 0212)の漢字全て,がセリフ体(明朝体)およびサンセリフ体(ゴシック体)の2種で,しかも,7種類のウェイト(文字の線の太さ)で用意されているという充実ぶりです。
Webページであれプリントアウトを目的とした文書であれ,多言語や多文字種を取り扱う場合に用いるフォントはフリーの Noto がおすすめ
異体字(変体仮名も含む)に関し Noto でもなお力不足であればフリーの IPAmj明朝 を使うと良い(ただし明朝体のみ)
ドイツ古典主義時代の文豪ゲーテの今際の言葉は「もっと光を!」(原語で Mehr Licht! 英語では More Light!)であったとされています。大詩人に相応しい見事な辞世の句ですが,何やら出来過ぎの感無きにしも非ずです。生粋のフランクフルトっ子であったゲーテはフランクフルト方言をしゃべっていたので,実際は Mer lischt [hier so schlescht].(ここはとっても寝心地悪い)だったのでは,という説もあります。真相は不明です。
Noto も IPAmj明朝 も「もっと文字を!」という方針で開発が続けられていますが,大きな弱点が一つあります。それは巨大なフォントファミリはファイルサイズも巨大である,という点です。このことはフォントのロードやレンダリングに時間がかかることを意味し,使用勝手に「心地悪さ」を感じる原因の一つとなります。
本稿では「Webフォント」と呼ばれる技術を使って,クライアント(本稿をお読みくださっている皆さんがお使いの端末)側に Noto がなくとも,サーバから当該フォントが自動的に読み込まれ表示が行われるような仕組みにしてあります。しかし「多言語・多字形」に関わる箇所では「画像」を用いています。これは,全てをWebフォントで処理しようとすると表示までに長い時間がかかってしまうためです。