[Message Prev][Message Next][Thread Prev][Thread Next][Message Index][Thread Index]

Re: 古代ギリシャ文字の表示方法



こんばんは。赤羽伸之といいます。

> 上平と申します。
> windows 上で、meadow を使って古代ギリシャ文字と、ラテン文字(長音なども
> 合成された文字)を表示させる方法について質問があります。

日本語の駅のローマ字とかで使われる長母音用のラテン文字の
ことでしょうか?
C-u C-\ latin-4-postfix エンター
でLatin-4用の入力器に切り替えて、
a -
と入力すると、aの上に横線が付いた文字が入力できます。
これはQuailという機能で、いろんな文字用があります。
C-u C-\ をした時、tabキーで補完させてみると、
いろいろ出てきます。

> 3. これは多分基本的な質問で恐縮なのですが、フォントファイルに入って
>   いる文字は、文字コード系に依存しているのですか? あるいは独立
>   なのですか? 例えば、unicode 用のフォントファイル、とか、xxx コード
>   用のフォントファイル、という言葉に意味はありますか? それとも
>   フォントファイルは、具体的な文字コード系とは独立した概念なので
>   しょうか?

うまく説明できないし、自分の理解も不十分なんですが、
試しに説明してみます。

一般には、フォントファイルと、文字コードとは、独立しているんだと
思います。
(もちろん、xxx用のフォントファイルという言葉に意味はあります。)

Mac OS Xで使えるというOpenTypeフォントでは
グリフ(文字の形)に独自の番号を振っています。
(これは、Adobe社が決めているようです。)
その結果、沢山の異体字を表示できるわけです。
そして、Shift_JISコードとの変換表を持っているので、
通常の日本語ファイルを何もしなくても表示できるわけです。

ロシア語の場合、かつては文字コードごとに別々のフォントファイルを
使用していたようです。
KOI-8とかISO8859-5とか...。
この場合、文字コードの文字順に、フォントファイル内にも
グリフが定義されているわけです。(仕組みが簡単)

しかし、文字コードとフォント番号を自動変換する機能があれば
一種類のフォントで、いろんな文字コードのテキストファイルを
表示できるはずです。

実際、日本語の場合でも、日本語フォントは1種類しかなくても
UTF-8やShift_JIS、EUC-JP、JIS(ISO-2022-JP)コードで書かれた
ホームページを表示できてます。
ロシア語のホームページも、エンコーディング(文字コード)を
変更するだけで、文字化けを解消できるはずです。

以上で大事な点は、文字コードとグリフとの対応表が
必要、ということです。

Unicodeフォントの場合、対応表を切り替えることで、
Shift_JISコード用のフォントになったり、Latin-1コード用のフォントになったり、
しているわけです(多分)。
Windowsの場合、この対応表がコードページと呼ばれています。
コードページを指定すると、Shift_JISコードの文字に対して、
対応するUnicode番号を探して、Unicodeフォント内のグリフを
表示しているわけです。

さて、Meadowではどうなのか?
Meadow(というか、Emacs)は、内部的には独自の文字コードを使用して、
多言語環境を実現しています。
独自というか、既存のコードの寄せ集めというか...。
(CGREEKは、この独自コードを拡張しているはずです。
この拡張性がEmacs(Mule)の特徴の一つ。)
だから、既存のフォントファイルを使用するためには、
Meadowの内部コード(Muleコード)と、そのフォントファイル内のグリフとを
対応づける機能が絶対に必要なわけです。
(これがCCLプログラムというものらしいです。)
Latin-1コードとかJISコード(JIS X 0208など)とかは、
単純な対応になっています。
ロシア語は、Mule内部ではISO 8859-5 に従ったコードになっています。
そのため、KOI8コードの読み書きには変換表が使われているわけです。
中国語のBig5コードの場合、ちょっと複雑な
対応表になっているはずです。(本当は、計算式から対応がわかるわけですが。)
Unicodeフォントの場合は、巨大な対応表を利用しているはずです。

長くなってごめんなさい。

そうそう、問題は「紙への印刷」、ですよね、きっと。

余談:
最近『ギリシア語のかたち』(白水社)という本を買ったのですが、
古典ギリシア語と現代ギリシア語って、文字の読み方がかなり
異っているんですね。びっくりしました。
ゲイアサスではなくて、ギアサスになんですね、きっと。
(昔、ひやかしで、大学の教養科目で古典ギリシア語の授業を
受けたことがあります。全然身についていませんが。)

同じシリーズで『アラビア語のかたち』を読むと、
MeadowのHELLOファイルのアラビア文字が、気になって
しかたがありません。(左から読まないといけない...)
(ラームとアリフの合成は、ちゃんと合成されているのに....)

このシリーズ、ヘブライ語やヒンディー語もあります。
http://www.hakusuisha.co.jp/osusume/gogaku.html

自分はCGREEKのことは、
『よしだともこのルート訪問記書籍版』よしだともこ著 ソフトバンク発行
http://www.tomo.gr.jp/root/book/
で知りました。(4ページの記事あり)