スクリプトについて教えてください。

Question

教えてください。お願いします。
ひとつのファイルの中身を読み、ある一定の文字列が出て来てから、また決まった文字列が出てくるまでを別のファイルに書き出す方法（スクリプトの書き方）を教えてください。

hp-uxの中にあるrunacctというスクリプトによってできる月次ファイルfiscalというのがあってそのファイルの中には３つのデータが書き出されます。
どこからどこまでがひとつのデータという事はわかります。
これを一つずつ、３つのファイルに書き出すスクリプト（手動でよいので）をつくりたいのです。
hp-uxについてもスクリプトについても全くというほど知識がないので、
ヒントでも良いので下さい。お願いします。

a-kuma · Accepted Answer

> 教えていただいたスクリプトを実行したところ

> awk: test3:14: (FILENAME=fiscrpt06 FNR=6) fatal: expression for `>' redirection has null string value
> というメッセージが出ます。

ああ、しまった。

a-kuma> {
a-kuma> gsub( /<tab><tab>*/, " " );
a-kuma> print > out;
a-kuma> }

を

out != "" {
gsub( /<tab><tab>*/, " " );
print > out;
}

としなければ、駄目でしたね　m(_ _)m

a-kuma · Answer

課金情報のレポートは見たことが無いのですが、こんな感じのファイルでしょうか？

決った文字列

データ1   データ2   データ3
データ1   データ2   データ3
データ1   データ2   データ3

決った文字列（その2）

こんな感じのファイルをデータ1だけのファイル、データ2だけのファイル、を
作りたいということですか？

やり方はいろいろ有ると思いますが、awk のスクリプトが一番簡単でしょう。
こんな感じ。

#!/usr/bin/awk -f

BEGIN { found = 0 }
/決った文字列/ { found = 1 ; next }
/決った文字列（その2）/ { exit }
found && NF == 3 {
    print $1 > "出力ファイル1"
    print $2 > "出力ファイル2"
    print $3 > "出力ファイル3"
}

このスクリプトファイルに実行権限をつけて、引数に入力のファイルを指定すれば
三つの出力ファイルが作成されます。

a-kuma · Answer

> データの説明をもうちょっとしますと。。。

あるデータの固まりは、空白行で終わる、と考えていいのでしょうか？
であれば、こんな感じ。

BEGIN { out = "" }
/決った文字列1/ { out = "出力ファイル1"; next }
/決った文字列2/ { out = "出力ファイル2"; next }
/決った文字列3/ { out = "出力ファイル3"; next }
/^$/ { out = "" }
out != "" {
    print > out
}


> 空白行の削除などは、空白行がみつかったら最初の一行しか消さないのでしょうか？

ちょっと質問の意図が分かりません。この回答のスクリプトでは、空白行が出た
時点で、そのデータの固まりを終了とみなして出力を一旦中止します。

つまり、出力ファイルには空白行は出力されません。

> タブをスペースに変換についても同じなのでしょうか？

こちらも意図がよくわから無いんですが、入力ファイルのタブを出力ファイルに
出す時点でスペースに変換したい、ということでしょうか？

awk のスクリプトで書くと、ちょっと大変かも。行頭のタブだけだったら、簡単
なんですけどね。

タブ→スペース変換のコマンドがある（はず）ので、それを使うのが簡単かも。
例えば、file1 のタブを４桁区切りでスペースに変換して file2 にするには、
こんな感じ。

% expand -4 file1 > file2

a-kuma · Answer

> ファイルの中身なのですが、

(snip)

データ１の固まりの前だけに、決った文字列があって、後は、ページ番号だけが
頼りなんですね。

BEGIN { out = "" }
/決った文字列/ { out = "出力ファイル1"; next }
/page1/ {
if ( out == "出力ファイル1" ) { out = "出力ファイル2"; next }
if ( out == "出力ファイル2" ) { out = "出力ファイル3"; next }
}
/page/ { next }
/^[<space><tab>]*$/ { next }
{
gsub( /<tab><tab>*/, " " );
print > out;
}

って感じになるかな。項目間のタブをひとつの空白で置換えてます。

> sedコマンドを使って削除しようと試みたのですが

おかしいですねぇ。page の p が大文字になっているのは、愛敬としても、
書き方は正しいと思います。

kokucho81 · Answer

chibitotoroさんこんにちわ。
私はhp-uxについては触ったことがないので存じ上げませんが、
Perlが使用できるのでしたら、こんな感じでしょうか？

############################

#!/usr/bin/perl

$FileNo=1; 
foreach $line (<>) {
if ($line =~ /^
?$/ || $line =~ /^page\d/) {
;
} else {
$line =~ s/	/ /g;
print PH $line;
}

if ($line =~ /^page1/) {
# close PH || die "";
$FileNo++; 
print $str=sprintf("OutPut%05d処理します。
", $FileNo); 
open PH, ">".sprintf("OutPut%05d.txt", $FileNo) || die ""; 
}
}  

########################

このファイルをkk81.pl とでも保存して、
perl kk81.pl （読みこみファイル名）とすれば、だいたいお望みのとおりの
挙動をすると思うのですが、、、

ご参考になりましたら。

スクリプトについて教えてください。

課金情報のレポートは見たことが無いのですが、こんな感じのファイルでしょうか？

この回答への補足

> データの説明をもうちょっとしますと。

この回答への補足

> ファイルの中身なのですが、

この回答への補足

chibitotoroさんこんにちわ。

この回答への補足

> 教えていただいたスクリプトを実行したところ

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング