[Message Prev][Message Next][Thread Prev][Thread Next][Message Index][Thread Index]

Re: Word Count?



矢木です。

Takeshi TAKIYAMA <takiyama@xxxxxxxxxxxxxxxxxxxxxxx> writes:
>TeXで文章をつくっていて、ここは何文字、など知りたいのです。
>
>例えば
>-----
>abstract{
>This paper descrive foo is dummy.
>But, How funny it is.
>}
>このペーパーは、テストです。
>でもfooって一体だれが言い出したんだろう。
>うーん???
>-----
>
>アブストラクトは何word、日本語部分は何文字、と言った具合です。

----- ではさまれた部分の英単語を数えたい場合、つまり
abstract This paper descrive foo is dummy But How funny it is foo
を数えたいとすると正規表現は単に [a-z]+ にする必要があります。
最後の foo が間隔をはさまずに日本語に囲まれているので \<[a-z]+\> には
マッチしません。

日本語の文字数については記号類を除きたいとすると
\cH\|\cK\|\cC などとすべきでしょう。

\cH…ひらがな
\cK…カタカナ
\cC…漢字

おわり