アプリでもっと教えて！goo

アプリ版：「スタンプのみでお礼する」機能のリリースについて

つらい・・・

LINUXでHTML内（複数行）の<div class="main">から</div>までを抽出する

締切済

質問者：seinosuke20
質問日時：2016/09/18 20:03
回答数：1件

LINUXでHTML内（複数行）の<div class="main">から</div>までだけを抽出するには
grepやsedで整理しながら変数に当てはめていく以外に正規表現などで複数行を抽出事は可能なのでしょうか？

この質問への回答は締め切られました。

質問の本文を隠す

回答 (1件)

最新から表示
回答順に表示

No.1

回答者： k-841
回答日時：2016/09/22 04:09

全体が必ず1行に収まっているならこれでいけると思います。

sed 's#.*\(<div class="main">.*</div>\).*#\1#g' ファイル名 | grep '<div class="main">.*</div>'

<div ...>～</div>が複数行にまたがった内容を抽出するとしたら、
sed, awk, grepなどの行処理プログラム単体では、
どうしても</div>が存在するかどうかを見極めるまで出力すべきか判断できないので、
何等か抽出した文字列を記憶しておく必要はあると思います。

あとは、perlでファイル全体を1つの文字列として、正規表現で抽出とか。
もちろんこの方法はファイルサイズがでかいとアウトです。

- 0
- 件

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう！

質問する（無料）

似たような質問が見つかりました

PHP ランキングを表示する際の画像の大きさを固定することは可能でしょうか？ <?php if ( has_ 1 2022/07/21 14:55
PHP アップロード画像数でCSSを分けることに成功したのですが、画像の横に文字を並べることが出来ません。 3 2023/07/28 17:16
JavaScript 【Javascript】ボタンクリックで2つのclassに対し、それぞれ別のclassを追加したい 1 2022/07/29 20:52
HTML・CSS テキストを画面の真ん中に配置したいです。 2 2022/11/25 16:11
JavaScript 入力フォームの javascript でメールアドレスの正規チェックをを行い、ボタンをクリックして 2 2022/04/27 16:06
PHP アップロードファイルの数に応じてCSSを動的に変更したいのですが、方法がわかりません 3 2023/07/23 21:59
Ruby No route matches [GET] "/posts/5/destroy" 1 2022/03/24 13:00
その他（プログラミング・Web制作） pythonのWebスクレイピングでfind_allだとurlがNoneに 4 2022/04/17 18:21
HTML・CSS htmlとcssで吹き出しの中に文字を置きたいのですが、 html 〈div class bb〉〈 3 2023/02/04 22:44
HTML・CSS ヘッダーの画像にメインエリアがかぶってしまいます 1 2022/11/28 14:06

関連するカテゴリからQ&Aを探す

ページトップ

おすすめ情報

質問する（無料）

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

おすすめ情報