[Message Prev][Message Next][Thread Prev][Thread Next][Message Index][Thread Index]
Re: euc-jp text vs utf-8
- X-ml-count: 1960
- Subject: Re: euc-jp text vs utf-8
- From: Hideyuki SHIRAI (白井秀行) <shirai@xxxxxxxxxxxxxxxxxxx>
- Date: Wed, 23 Feb 2000 10:21:08 +0900 (JST)
- X-mailer: Mew version 1.95b28 on Emacs 20.5 / Mule 4.1 (葵) / Meadow-1.12 Beta1 (指貫:60)
白井です。
From: Miyashita Hisashi(宮下 尚:HIMI) <himi@xxxxxxxxxxxxxxxxxxxxxxxxx> さん曰く
Subject: Re: euc-jp text vs utf-8
Message-ID: <u3dqk3h3v.fsf@xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx>
Date: 23 Feb 2000 09:19:48 +0900
> Shin Miyazaki <shinm@xxxxxxxxx> writes:
>
> > UTF-8 のマルチバイト文字の先頭は 0xC0 以上の値になるはずですので、
> > この場合は、少なくとも「UTF-8じゃない」というのはわかると思います。
>
> 完全には、そうもいかないんですよ。Muleの自動判別は、
>
> 「あらゆる可能なsequeceの部分列も、許す。」
>
> ということになっているので、(process inputのとき、これは特に重要)
ふむふむ、そういうもんなのですか。(わかっていない私)
> とはいえ、今回の場合は、6バイトあるから、rejectできるはずだなぁ。
# 実は、"仕様です" と言われて終わるかと思っていた ^^;;;
> というわけで、patchです。
1.12b1 に patch をあててちゃんと『スコア』になりました。ありがと
うございます。
> ## しかし、「ス」だけだと、むりだな。こりゃ。
From: 小関 吉則 (KOSEKI Yoshinori) <kose@xxxxxxxxxxxxxxxxxx> さん曰く
Subject: Re: euc-jp text vs utf-8
Message-ID: <2000Feb23puto7myo.kose@xxxxxxxxxxxxxxxxxx>
Date: 23 Feb 2000 09:59:43 +0900
小関> 「スコ」でも駄目でした。:-)
# 小関さんに先に言われてしまったな。
小関> ;; どなたか linespace-patch をあてて Meadow をコンパイルしてく
小関> ;; れないかしら。Emacs20.6 が出たらすかさずリリースしてくれる方
小関> ;; も随時募集中。^^)v
temacs.exe.bz2 (1,264,299 byte) なのですが、あとで netlaputa に
おいておきます。
P.S.
日本語 file 名の問題で
(let ((fnlst '("人" "文" "社" "会" "伸" "日" "本" "語" "演" "炎"))
fn)
(while fnlst
(find-file (expand-file-name (car fnlst) "c:/tmp"))
(insert (car fnlst))
(save-buffer)
(kill-buffer (current-buffer))
(setq fnlst (cdr fnlst))))
などというのを遊びでやったのですが、'社' は何文字あっても euc-jp
とみなされちゃうのですね。
# まぁ、'undecided には、それ以上にお世話になっているのでなにも
# 文句はありませんです。
--
白井秀行@小関さんから挑発のメールが(謎)。。。:-)