dポイントプレゼントキャンペーン実施中!

LaTeX で 単語数(英文)を数えるにはどうすれば良いでしょうか?

Linux上で使っていますが、wc コマンドでは、LaTeXの制御文字までカウントしてしまいます・・・

何か方法がないでしょうか?

A 回答 (2件)

\alpha のような文字になるコマンドもあれば


\bf のような文字にならないコマンドもあるし
\setlength{#1} みたいな引数の中が文中に出てこないものもあれば
\section{#1} みたいな引数の中が文中に出てくるものもあるし
explanクラスみたいなitemやtable環境の
指定方法を変えちゃってるものもあって
コマンドの書式に一般性がないから
detexではそういう処理になってるんじゃないかな。

なんとか.sed というファイルに

 s/%[^\n]*$//g
 s/\\begin{[^}]*\}//g
 s/\\end{[^}]*\}//g
 s/\\part\[\([^\]*]\)\]/$1/g
 s/\\chapter\[\([^\]*]\)\]/$1/g
 s/\\section\[\([^\]*]\)\]/$1/g
 s/\\subsection\[\([^\]*]\)\]/$1/g
 s/\\subsubsection\[\([^\]*]\)\]/$1/g
 s/\\[a-zA-Z@]*//g
 s/\\[a-zA-Z@]*//g
 s/[{}]//g

のように書いて

 $ sed -f なんとか.sed < なんとか.tex

とすればもう少しまともな結果で出てくると思うけど…。

確実なのはdviファイルからdvi2ttyで抜き出すか
psに変換してpstotextで抜き出すか
pdfに変換してxpdfのpdftotextで抜き出すかかな。
それぞれの変換方法では表の罫線の出力とかが若干変わると思います。
    • good
    • 0

detexでTeXコマンドを取り除いてから,wc -wをかけてはいかがでしょう.



detexでうまくいかなければ,dvi2ttyやuntexを探してみてくださいな.

参考URL:http://www2.odn.ne.jp/107steps/plamo.html#detex

この回答への補足

detex は試したのですが、たとえば、

\begin{itemize}
\item ABCDE
\end{itemize}

これが、

beginitemize item ABCDE enditemize

となってしまいます。
つまり、本来 ABCDE の1単語だけなのに、4単語になってしまいます。

jyunnaさんはどのように使っているのですか?

補足日時:2004/10/10 23:22
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!