プロが教える店舗&オフィスのセキュリティ対策術

サイトのソースで、本文に<br>、</div>などのHTMLタグが挿入されていますが、
これらのタグを一括して削除する方法はないでしょうか。
私が最初に試したのは、ソースをメモ帳に張り付けて、置換機能を利用して
ワイルドカードを使い、<*>の文字列を空白に置き換える方法ですが、
上記のようなタグがあるにも関わらず、該当する文字列がないと
エラー表示され置換できません。

具体的には、以下のように編集したいです。

(置換前)

<div class="t_h ">7: <span style="color: green; font-weight: bold;">名無しさん</span> <span style="color: gray;"> 2013/09/26(木) 15:55:59.62 ID:FahaifvL0</span></div>
<div class="t_b " > 山田太郎だったら営業に有利そうだな </div><br />

(置換後)
7: 名無しさん2013/09/26(木) 15:55:59.62 ID:FahaifvL0
山田太郎だったら営業に有利そうだな

どなたかいい方法を教えていただけますでしょうか。
よろしくお願いします。

A 回答 (2件)

そのままをHTMLファイルにしてブラウザで表示し、それをメモ帳にでもコピー&ペーストしてやるとか、ブラウザの「ページを保存」でテキストファイルで保存してやればタグは取れてしまいます。

    • good
    • 0
この回答へのお礼

ありがとうございました。ベストアンサーにさせていただきます。

お礼日時:2013/10/04 07:04

正規表現の扱えるテキストエディタで、「タグを削除する(

http://www.din.or.jp/~ohzaki/perl.htm#Tag_Remove )」などの方法で取り除く。
 そんなことするより、普通にブラウザで開いて、Ctrl+A → Ctrl+C の方が早いと思いますけど。スタイルシートで複雑にレイアウトされている場合は、ブラウザの[表示]→[スタイルシート]→[スタイルシートなし]から行うと良いです。
 Lynxなどのテキストブラウザを使うとキーボードだけで出来ます。Lynxだと、カソールをShiftを押しながら選択して[Enter]だけでクリップボードにコピーされます。
 Firefoxだと AutoCopy 2( https://addons.mozilla.jp/firefox/details/337159 )のようなアドオンがありますので、Lynxと同じような簡単な操作でテキストだけコピーできます。 Dafizilla Table2Clipboard( https://addons.mozilla.jp/firefox/details/1852 )だとtable(表)もexcelにコピーできます。

 
    • good
    • 0
この回答へのお礼

ありがとうございました。
色々な方法があるんですね。

お礼日時:2013/10/04 07:05

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!