perlでご助言お願い致します。

Question

あるテキストファイルが以下の内容で記述されているとします。
a　　　file1
a　　　file1
a　　　file1
b　　　file1
b　　　file1
b　　　file1
c　　　file2
c　　　file2
d　　　file2
d　　　file2
e　　　file2
e　　　file2
f　　　file3
f　　　file3
f　　　file3

上記のように列が二つあるテキストファイルについて、
2列目のfile名が1列目のどの値とひもづいて
いるかを処理するperlプログラムを作ることを考えます。
出来上がったperlによって上記テキストファイルを処理した結果は、
file1は　aとb
file2は　cとdとe
file3は　f
とひもづいていることが分かる　ということにしたいです。
これをperlプログラムで書くとき、条件として
一行一行を読みとるとき
if ( $_ =~ /(\S+)\s+(\S+)/ ){
を使っています。
そのため$1と$2に現在行の1列目,2列目が与えられた後、
ハッシュと配列を組み合わせて考えた場合どのようにすれば
いいのでしょうか。

ご助言ご鞭撻宜しくお願い致します。

root139 · Accepted Answer

> file名が一度変わり、さらに変わるときに既に出てきたfile名はエラーとする　です。

同じfile名の行はひとかたまりに成っていなくてはダメということでしょうか？
であるなら、生成する部分で「直前のfile名と違い、かつ、既に出現済のfile名を取得した」場合にエラーにすれば良いでしょう。

例) ----------------------------------------------

my $previousFile = '';
while (<FILE>) {
if ($_ =~ /(\S+)\s+(\S+)/) {
if ($previousFile and $2 ne $previousFile and exists($data{$2})) {
die "$2は既に出てきたためエラーとして処理をストップしました";
}
$data{$2}{$1} = 1;
$previousFile = $2;
}
}

--------------------------------------------------

> これをループ文(whileやforeach)などで取り出す場合の記述例を御教授願います。

%result のキーでループさせてその内側で値の配列をループさせれば全要素を走査できます。file名順に並べなくても良いなら while と each の組合せでも大丈夫です。

例) ----------------------------------------------

foreach my $file (sort(keys(%result))) {
print "* $file
";
foreach my $str (@{$result{$file}}) {
print "        - $str
";
}
}

--------------------------------------------------

単に配列が値になっているハッシュというだけの話なので、perlの制御構文やハッシュの使い方を調べれば、走査のやり方は分かるでしょう。
http://rfs.jp/sb/perl/02/06.html
http://rfs.jp/sb/perl/02/05.html

なお、ベストアンサーはどうでも良いですが、マルチポストは止めましょう。いちおう、このサイトのルールですし、質問する方も回答する方も面倒なだけでしょう。

root139 · Answer

> $data{$2} = 値 のようにキーは$2のみにして$1は値として

一度ハッシュのハッシュを作った上で、それから配列のハッシュを作るのが簡単でしょう。

例) ----------------------------------------------

my %data = ();

open(FILE, 'hoge.txt') or die "file open failed.";

while(<FILE>) {
if ( $_ =~ /(\S+)\s+(\S+)/ ) {
$data{$2}{$1} = 1;
}
}

close(FILE);

# 配列のハッシュを作る

my %result = ();

while(my ($key, $val) = each(%data)) {
$result{$key} = [sort(keys(%$val))];
}

# 生成したデータ表示してみる。

foreach my $file (sort(keys(%result))) {
print $file . " -> " . join(',', @{$result{$file}}) . "
";
}

use Data::Dumper;
print Dumper(\%result);

--------------------------------------------------

1ループでも出来ない事はないですが、かえって面倒だと思いますよ。

> また出力はただのprintでお願いできますか。

えーと、データ表示の部分に関しては、実行した際にデータがどの様に格納されているのか確認できるように付けただけですので、コード自体の意味が分からなかったら無視して頂いても大丈夫です。

root139 · Answer

やり方はいろいろ有ると思いますが、ハッシュのハッシュを使うのが簡単だろうと思います。

例) ----------------------------------------------

my %data = ();

open(FILE, 'hoge.txt') or die "file open error!.";

while(<FILE>) {
if ( $_ =~ /(\S+)\s+(\S+)/ ) {
$data{$2}{$1} = 1;
}
}

close(FILE);

# 生成したデータ表示してみる。

foreach my $file (sort(keys(%data))) {
printf("%s -> %s
", $file, join(',', sort(keys(%{$data{$file}}))));
}

use Data::Dumper;
print Dumper(\%data);

--------------------------------------------------

生成しているデータは、最後の Data::Dumper の出力を見てもらえば分かりますが、1列目の[a, b, c]がキーで値が1のハッシュを2列目のfile名がキーのハッシュに格納しています。

perlでご助言お願い致します。

> file名が一度変わり、さらに変わるときに既に出てきたfile名はエラーとする です。

この回答への補足

> $data{$2} = 値 のようにキーは$2のみにして$1は値として

この回答への補足

やり方はいろいろ有ると思いますが、ハッシュのハッシュを使うのが簡単だろうと思います。

この回答への補足

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

> file名が一度変わり、さらに変わるときに既に出てきたfile名はエラーとする　です。

> $data{$2} = 値のようにキーは$2のみにして$1は値として