[Message Prev][Message Next][Thread Prev][Thread Next][Message Index][Thread Index]
Re: Word Count?
- X-ml-count: 2010
- Subject: Re: Word Count?
- From: yagi@xxxxxxxxxxxxxxx
- Date: Tue, 21 Mar 2000 18:31:48 +0900
- User-agent: Nana-gnus/6.13.9 SEMI/1.13.5 (Meihō) FLIM/1.13.2 (Kasanui) Emacs/20.4 (i386-*-windows98.1998) MULE/4.1 (AOI) Meadow/1.10 (TSUYU)
矢木です。
Takeshi TAKIYAMA <takiyama@xxxxxxxxxxxxxxxxxxxxxxx> writes:
>TeXで文章をつくっていて、ここは何文字、など知りたいのです。
>
>例えば
>-----
>abstract{
>This paper descrive foo is dummy.
>But, How funny it is.
>}
>このペーパーは、テストです。
>でもfooって一体だれが言い出したんだろう。
>うーん???
>-----
>
>アブストラクトは何word、日本語部分は何文字、と言った具合です。
----- ではさまれた部分の英単語を数えたい場合、つまり
abstract This paper descrive foo is dummy But How funny it is foo
を数えたいとすると正規表現は単に [a-z]+ にする必要があります。
最後の foo が間隔をはさまずに日本語に囲まれているので \<[a-z]+\> には
マッチしません。
日本語の文字数については記号類を除きたいとすると
\cH\|\cK\|\cC などとすべきでしょう。
\cH…ひらがな
\cK…カタカナ
\cC…漢字
おわり