[Message Prev][Message Next][Thread Prev][Thread Next][Message Index][Thread Index]

Re: EUCにおける半角カナの扱い



山下 純司です。

バイト列 0xA5 0xA2 0x8e 0xB1 は
EUC-JPと解釈すれば『ア[ア]』、
Shift_JISと解釈すれば『[・][「]竺』となります。

* [ア][・][「]はそれぞれ半角文字(katakana-jisx0201)の意味。


一応確認です。文字化けして表示されるとありますが、どのように
表示されているのでしょうか。


以下、実はShift_JISとして『[・][「]竺』が表示されていただけ
という仮定下での発言:

   Shift_JISとEUC-JPのどちらとでも解釈できるバイト列パターンが
   あるってのはFAQだと考えてたけど、そうでもなさそう?

   coding-systemの自動認識って魔法がかってるから完全には信用
   できないと割り切りが必要だよね。

以上
-- 
山下 純司	mailto:ysjj@xxxxxxxxxxxx