[Message Prev][Message Next][Thread Prev][Thread Next][Message Index][Thread Index]

Re: euc-jp text vs utf-8



白井です。

From: Miyashita Hisashi(宮下 尚:HIMI) <himi@xxxxxxxxxxxxxxxxxxxxxxxxx> さん曰く
Subject: Re: euc-jp text vs utf-8
Message-ID: <u3dqk3h3v.fsf@xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx>
Date: 23 Feb 2000 09:19:48 +0900

> Shin Miyazaki <shinm@xxxxxxxxx> writes:
> 
> > UTF-8 のマルチバイト文字の先頭は 0xC0 以上の値になるはずですので、
> > この場合は、少なくとも「UTF-8じゃない」というのはわかると思います。
> 
> 完全には、そうもいかないんですよ。Muleの自動判別は、
> 
> 「あらゆる可能なsequeceの部分列も、許す。」
> 
> ということになっているので、(process inputのとき、これは特に重要)

ふむふむ、そういうもんなのですか。(わかっていない私)

> とはいえ、今回の場合は、6バイトあるから、rejectできるはずだなぁ。

# 実は、"仕様です" と言われて終わるかと思っていた ^^;;;

> というわけで、patchです。

1.12b1 に patch をあててちゃんと『スコア』になりました。ありがと
うございます。

> ## しかし、「ス」だけだと、むりだな。こりゃ。

From: 小関 吉則 (KOSEKI Yoshinori) <kose@xxxxxxxxxxxxxxxxxx> さん曰く
Subject: Re: euc-jp text vs utf-8
Message-ID: <2000Feb23puto7myo.kose@xxxxxxxxxxxxxxxxxx>
Date: 23 Feb 2000 09:59:43 +0900

小関> 「スコ」でも駄目でした。:-)

# 小関さんに先に言われてしまったな。

小関> ;; どなたか linespace-patch をあてて Meadow をコンパイルしてく
小関> ;; れないかしら。Emacs20.6 が出たらすかさずリリースしてくれる方
小関> ;; も随時募集中。^^)v

temacs.exe.bz2 (1,264,299 byte) なのですが、あとで netlaputa に
おいておきます。

P.S.
日本語 file 名の問題で

(let ((fnlst '("人" "文" "社" "会" "伸" "日" "本" "語" "演" "炎"))
      fn)
  (while fnlst
    (find-file (expand-file-name (car fnlst) "c:/tmp"))
    (insert (car fnlst))
    (save-buffer)
    (kill-buffer (current-buffer))
    (setq fnlst (cdr fnlst))))

などというのを遊びでやったのですが、'社' は何文字あっても euc-jp
とみなされちゃうのですね。

# まぁ、'undecided には、それ以上にお世話になっているのでなにも
# 文句はありませんです。

-- 
白井秀行@小関さんから挑発のメールが(謎)。。。:-)