dポイントプレゼントキャンペーン実施中!

同じ行で重複した単語を削除したいです。

テキストファイル

sapporo aomori akita iwate akita yamagata
sendai miyagi hukushima miyagi akita
mito


上記のようなファイルの同じ行で重複した単語を削除し下の形にしたいです。

sapporo aomori akita iwate yamagata
sendai miyagi hukushima akita
mito



open(FILE1, "<xxx.txt") || die "File1 Open Error! \n";
open(OUT, ">zzz.txt") || die "OUT Open Error! \n";

$string1 = <FILE1>;
my @array = split(/\t/,"$string1");

my %count;
@array = grep {!$count{$_}++}@array;
foreach my $element (@array) {
print OUT "$element\t";
}
close(FILE1);
close(OUT);

このプログラムを実行すれば初めの一行は重複した単語を削除できるのですがそこで終了してしまいます。2行目、3行目・・といったように複数行に対して重複した単語を削除するためにはどのようにすればいいのですか。宜しくお願いします。

A 回答 (2件)

>$string1 = <FILE1>;


これは配列で受け取ってないので、入力ファイルから1行だけ取得する処理です。

なので全行を読み込むのであれば、No.1さんの言うとおり、ループさせる必要があります。
ループの書き方ですがファイルハンドルをwhileでループさせるか、一度配列に落としてforeachでループさせるかがベタではないかと。配列に落とすんならこんな感じですかね…。

---
my @data = <FILE1>;
chomp @data;

foreach my $line (@data) {
my @array = split(/\t/, $line);
my %count;
@array = grep {!$count{$_}++}@array;
foreach my $element (@array) {
print OUT "$element\t";
}
print OUT "\n";
}
---
改行を削除しないと整形したファイルの先頭に\tがつくんで、とりあえずchompして、レコードの最後に改行付けてます。
    • good
    • 0
この回答へのお礼

splitで文字列を分割してリストにした後、どのようにループさせれば
良いかを考えてしまい、悪戦苦闘していました(> <)
chompの使い方含め、大変勉強になりました。有難うございました。

お礼日時:2012/10/22 11:21

ループする

    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!