重要なお知らせ

「教えて! goo」は2025年9月17日(水)をもちまして、サービスを終了いたします。詳細はこちら>

電子書籍の厳選無料作品が豊富!

特定の文字列間の文字列を抽出したいのですがなにか
いいソフトはありませんでしょうか?例えば、

<p>△△△</p>
<span>◯◯◯</span>
<span>□□□</span>
という文があったら
<span>◯◯◯</span>
<span>□□□</span>
もしくは
◯◯◯
□□□
を抽出したいのですが。

回答お待ちしています。

A 回答 (5件)

No1-3です。


別件でRFTからテキストへ変換してくれるソフトを探していたら、Macに標準で入っているtextutilがあるのですね。
http://ascii.jp/elem/000/000/597/597604/index-2. …
初めて知りました。ちょっと使ってみると、RTFだけでなくテキストファイルの文字コード変換もできるようです。
chasenと組み合わせて
textutil -convert txt test.rtf -stdout|chasen-utf8
で動いています。

textutil -convert txt test.rtf と出力を指定せずにやってみたら、勝手にtest.txtファイルができ、しかも上書きされてしまします。
要注意です。

ご存知かと思いますが、mecabやchasenなどはMacPortsなどのパッケージ管理ソフトでインストールすると管理が楽です。
    • good
    • 0

すみません、まちがってちがうところの回答を書き込んでしまいました。


気にしないでください。
    • good
    • 0

No.2です。


文字列として取り出すのではなく、見るだけならCotEditorなどの正規表現が使えるエディタが使えます。
検索で正規表現にチェックを入れ<span>.+</span>で一括検索すれば一覧として見ることができます。
一括して取り出す機能は無いようです。
http://sourceforge.jp/projects/coteditor/releases/

データの加工を考えればNo.2の方法が便利なような
    • good
    • 0

Macに標準で入っているRubyを使えばどうすか。


変数aに文字列が入っているとすると
puts a.scan(/<span>.+<\/span>/)
で上の結果が
puts a.scan(/<span>(.+)<\/span>/)
で下の結果が得られます。

日本語の場合は文字コードを合わせてください。
TerminalやAutomatorで使えます。
    • good
    • 0

Openofficeやterminalで簡単に出来るでしょ

    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!