[Message Prev][Message Next][Thread Prev][Thread Next][Message Index][Thread Index]

Re: Windows-1252



中村さん、こんばんは。
赤羽伸之といいます。

ごめんなさい、codepage.elの中身を全然見ないで発言していました。
(尚、Meadow1.15附属のcodepage.elでは既にpatchはあたっていました。)
これは、中村さんのおっしゃる通り、
変換テーブルを使ってCP**の文字をiso-8859-**の
文字に変換するものなのですね。

やはり、他のエディターを使った方が簡単なようです。

以下、Unicodeを使った場合、Meadowでできることは何か、
自分なりに試してみました。

1.
「文字コード表」と「メモ帳」を使って
CP1252の文字(0x80-0x9f、以下C1領域と呼ぶ)をテキストファイルに
保存する。
これを(なんらかのソフトを使って)UTF-16-leに変換する。
2.
これをMeadow1.15+Mule-UCS-0.84で読み込んでみる。
すると、jisx-0208やjisx-0212、ksc5601、iso-8859-2などの
文字で表示される。(従って、全角文字で表示される文字もある。)
ただし、表示されない文字(豆腐になっている)もある。
3.
上で、豆腐になっている文字は、C-u C-x = してみると、
全て mule-unicode-0100-24ff という文字集合の文字になっている。
しかも、各文字で符号位置は異っている。

※と、いうことは、
mule-unicode-0100-24ff のフォントを適切に設定して、
un-define-change-charset-order を適切に設定すれば、
ひょっとしたら、C1領域の文字も使えるようになる???

4.
他のアプリケーションとの間の
コピーアンドペイストについては、
フリーウェアのUniconvを利用すれば
うまくいっているような気がします。
(Unicodeクリップボードに対応していないソフトとの間では、
Uniconvを2回使う形にすれば良い。)

5.
ファイルの読み書きの時にCP1252とUnicodeとの変換をするようにすれば、
(上で調べた意味で)CP1252のファイルも読み書きできるような気がします。
これが、多分CCLプログラミングというものなのだと思います。
(どうすればいいのかは、全然わかりませんが。)

以上。あんまり役に立てそうにないです。すみません。
なにか勘違いした事を書いていたら、ごめんなさい。


参考:CP1252からユニコードへの変換に使ったソフト:
・xyzzy.exe
・Simredo.jar
・J2SDKに附属のnative2ascii.exe
いずれも、単純に0x00を付加する、という形では
なかったです。