
No.2ベストアンサー
- 回答日時:
\alpha のような文字になるコマンドもあれば
\bf のような文字にならないコマンドもあるし
\setlength{#1} みたいな引数の中が文中に出てこないものもあれば
\section{#1} みたいな引数の中が文中に出てくるものもあるし
explanクラスみたいなitemやtable環境の
指定方法を変えちゃってるものもあって
コマンドの書式に一般性がないから
detexではそういう処理になってるんじゃないかな。
なんとか.sed というファイルに
s/%[^\n]*$//g
s/\\begin{[^}]*\}//g
s/\\end{[^}]*\}//g
s/\\part\[\([^\]*]\)\]/$1/g
s/\\chapter\[\([^\]*]\)\]/$1/g
s/\\section\[\([^\]*]\)\]/$1/g
s/\\subsection\[\([^\]*]\)\]/$1/g
s/\\subsubsection\[\([^\]*]\)\]/$1/g
s/\\[a-zA-Z@]*//g
s/\\[a-zA-Z@]*//g
s/[{}]//g
のように書いて
$ sed -f なんとか.sed < なんとか.tex
とすればもう少しまともな結果で出てくると思うけど…。
確実なのはdviファイルからdvi2ttyで抜き出すか
psに変換してpstotextで抜き出すか
pdfに変換してxpdfのpdftotextで抜き出すかかな。
それぞれの変換方法では表の罫線の出力とかが若干変わると思います。
No.1
- 回答日時:
detexでTeXコマンドを取り除いてから,wc -wをかけてはいかがでしょう.
detexでうまくいかなければ,dvi2ttyやuntexを探してみてくださいな.
参考URL:http://www2.odn.ne.jp/107steps/plamo.html#detex
この回答への補足
detex は試したのですが、たとえば、
\begin{itemize}
\item ABCDE
\end{itemize}
これが、
beginitemize item ABCDE enditemize
となってしまいます。
つまり、本来 ABCDE の1単語だけなのに、4単語になってしまいます。
jyunnaさんはどのように使っているのですか?
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
DTCP-IPファイルをmp4などに変...
-
いきなりPDFで文書の切り取り
-
写真を撮ってxml形式にしたい場合
-
DXFからJWWに一括変換す...
-
ai、psd、PDF形式のファイルをp...
-
パーソナル編集長で作成したフ...
-
Canon R6で撮影したRAWデ...
-
mac です。vob ファイルを mp4 ...
-
iTunesへ取り込んだ音楽の曲名...
-
WAVファイルIMA ADPCMをCDプレ...
-
DVDfab8が約30%変換途中で止まる
-
KMZ形式のファイルをCSV形式に...
-
CANDY→AutoCADへの変換
-
WAVEからMIDIへの変換が出来ま...
-
WMAなどシークができない動画フ...
-
一括ファイル変換(コンバート...
-
.mpgファイルを.isoに変換する...
-
.cdaファイルをMP3に変換できま...
-
Photoshopで見るEPSとPNGの色の...
-
写真ファイルJPGをDCF形式にし...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Excelのファイルがいつの間にか...
-
写真を撮ってxml形式にしたい場合
-
CAD ZSD→DXF変換
-
DTCP-IPファイルをmp4などに変...
-
拡張子OA2のファイルをWord2010...
-
自動でpdf化したい
-
DXFからJWWに一括変換す...
-
いきなりPDFで文書の切り取り
-
三四郎ファイル を エクセルフ...
-
AudacityでMP3をMIDIに変換
-
「.rtf」の拡張子が開けないの...
-
BUP・IFO・VOBをMACで開きたい。
-
word作成書類を文面が崩れない...
-
ISOファイルをFLAC、もしくはMP...
-
mac です。vob ファイルを mp4 ...
-
Canon R6で撮影したRAWデ...
-
BASE64のエンコード時のサイズ...
-
ビットマップの色数を変更する...
-
タブ区切りのテキストファイル...
-
写真ファイルJPGをDCF形式にし...
おすすめ情報