同じ行で重複した単語を削除したいです。テキストファイル sapporo aomori akita iwate akita yamagata sendai miyagi hukushima miyagi akita mito ・・上記のようなファイルの同じ行で重複した単語を削除し下の形にしたいです。 sapporo aomori akita iwate yamagata sendai miyagi hukushima akita mito ・・ open(FILE1, " zzz.txt") || die "OUT Open Error! \n"; $string1 = ; my @array = split(/\t/,"$string1"); my %count; @array = grep {!$count{$_}++}@array; foreach my $element (@array) { print OUT "$element\t"; } close(FILE1); close(OUT); このプログラムを実行すれば初めの一行は重複した単語を削除できるのですがそこで終了してしまいます。2行目、3行目・・といったように複数行に対して重複した単語を削除するためにはどのようにすればいいのですか。宜しくお願いします。

>$string1 = ; これは配列で受け取ってないので、入力ファイルから1行だけ取得する処理です。なので全行を読み込むのであれば、No.1さんの言うとおり、ループさせる必要があります。ループの書き方ですがファイルハンドルをwhileでループさせるか、一度配列に落としてforeachでループさせるかがベタではないかと。配列に落とすんならこんな感じですかね…。 --- my @data = ; chomp @data; foreach my $line (@data) { my @array = split(/\t/, $line); my %count; @array = grep {!$count{$_}++}@array; foreach my $element (@array) { print OUT "$element\t"; } print OUT "\n"; } --- 改行を削除しないと整形したファイルの先頭に\tがつくんで、とりあえずchompして、レコードの最後に改行付けてます。

grep関数を用いた複数行からの抽出

解決済

質問者：nanashim
質問日時：2012/10/18 23:08
回答数：2件

同じ行で重複した単語を削除したいです。

テキストファイル

sapporo　aomori　akita　iwate　akita　yamagata
sendai　miyagi　hukushima　miyagi akita
mito
・
・
上記のようなファイルの同じ行で重複した単語を削除し下の形にしたいです。

sapporo　aomori　akita　iwate　yamagata
sendai　miyagi　hukushima　akita
mito
・
・

open(FILE1, "<xxx.txt") || die "File1 Open Error! \n";
open(OUT, ">zzz.txt") || die "OUT Open Error! \n";

$string1 = <FILE1>;
my @array = split(/\t/,"$string1");

my %count;
@array = grep {!$count{$_}++}@array;
foreach my $element (@array) {
print OUT "$element\t";
}
close(FILE1);
close(OUT);

このプログラムを実行すれば初めの一行は重複した単語を削除できるのですがそこで終了してしまいます。2行目、3行目・・といったように複数行に対して重複した単語を削除するためにはどのようにすればいいのですか。宜しくお願いします。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (2件)

ベストアンサー優先
最新から表示
回答順に表示

No.2ベストアンサー

回答者： taco0603
回答日時：2012/10/22 00:15

>$string1 = <FILE1>;

これは配列で受け取ってないので、入力ファイルから1行だけ取得する処理です。

なので全行を読み込むのであれば、No.1さんの言うとおり、ループさせる必要があります。
ループの書き方ですがファイルハンドルをwhileでループさせるか、一度配列に落としてforeachでループさせるかがベタではないかと。配列に落とすんならこんな感じですかね…。

---
my @data = <FILE1>;
chomp @data;

foreach my $line (@data) {
my @array = split(/\t/, $line);
my %count;
@array = grep {!$count{$_}++}@array;
foreach my $element (@array) {
print OUT "$element\t";
}
print OUT "\n";
}
---
改行を削除しないと整形したファイルの先頭に\tがつくんで、とりあえずchompして、レコードの最後に改行付けてます。