動的な？　多次元ハッシュ

Question

text---------------------
社会	1
社会	社会問題	4
社会	社会問題	教育問題	5
---------------------text

タブ区切りのテキストファイルを読み込んで
最後の値がハッシュ値になるような
深さがまちまちな多次元ハッシュをループで作りたいのです

手作業だと
$HASH{社会}=1
$HASH{社会}{社会問題}=4
$HASH{社会}{社会問題}{教育問題}=5

できるだけ動作を軽くしたいので、evalや$1での置き換え等は
使いたくないのです
どなたか教えてください

BLUEPIXY · Accepted Answer

＞キー自体を使いたい(splitするコストがかかりますよね)
キー自体は、読み出す時にsplitするのだろうし、キーと値が切り出せれば別にsplitする必要もなく、'	'を'/'にする必要もない（タブそのままでも良い）ですし、
ハッシュから値を読み出す時にも、キーが既に別々になっている状態で
$key1."/".$key2
のように連結すればいいだけのことで、
かえってテキストファイルによって動的に深さが決まるようなキーの場合、
%HASH{$key1}{$key2}…のような形で動的に深さを決定してアクセスするのが面倒です。

＞いかんせん大量のデータ数&量を処理しようとしているので、なるべく軽くと思ってます
読み込みの部分が大量にあるとしても、それほど、重くなるとも思えません。
ハッシュからのアクセスの部分で言えば、かえって手順が簡単だと思います。

＃３で指摘されているように、構造としてもうまく行かない場合があるようです。
＃３でも言われているように、大量にデータがあるようなハッシュの場合、データの構造を変更して、DBに接続したハッシュにするのも１つの方法だと思います。

Tacosan · Answer

#1 です.

う～ん, ちょっとはチェックしたつもりだったんですけど, やっぱりそうなりましたか....
チェックの結果が奇妙だったんですがうまくいったように見えたので....
$hash{a}{b} って ${$hash{a}}{b} と同じだから当然といえば当然.

で,
while (@keys > 1) {
....
}
を
foreach my $key (@keys) {
    $vref->{$key} = { };
    $vref = $vref->{$key};
}
$vref->{val} = $val;
くらいでいいかと.

社会	1
に対して
$hash{社会}{val} = 1
になりますけど, まあ許容範囲ではないでしょうか.

osamuy · Answer

> $HASH{社会}=1
> $HASH{社会}{社会問題}=4
> $HASH{社会}{社会問題}{教育問題}=5

evalとかを使わないと記述が複雑になって、そんなに軽くならないし、メンテナンス性が悪くなるかと。

それと別に、こういうデータ構造だと、いくつか問題がありそう。
例えば、

$HASH{社会}=1;
$HASH{社会}{社会問題}=4;
$HASH{社会}{社会問題}{教育問題}=5;
$HASH{社会}{人生問題}=4;
$HASH{社会}{人生問題}{教育問題}=15;
print $HASH{社会}{社会問題}{教育問題};

??で、5と出力されません。
use strictを指定した場合、エラーになってしまいますし、リファレンスが生成されるため、通常のハッシュより遅くなります（微々たるものでしょうが）。

なので、BLUEPIXYさんみたいなやり方が適切と思われます。
タブ区切りテキストをやめてdbmにするという手も。

BLUEPIXY · Answer

回答とは違うのですが、多重ハッシュにする理由がよくわかりません。
キーを{社会}{社会問題}{教育問題}とかしないで
社会/社会問題/教育問題とかすれば、
簡単だし軽いと思うのですが

#サンプル
my %HASH;

while (<>) {
chomp;
my (@keys) = split /	/;
my $val = pop @keys;
print join('/', @keys) . "
";
print "$val
";
$HASH{join('/', @keys)}=$val
} 
print $HASH{'社会'} . "
";
print $HASH{'社会/社会問題'} . "
";
print $HASH{'社会/社会問題/教育問題'} . "
";

Tacosan · Answer

こんな感じかなぁ?

my %HASH;

while (<>) {
    chomp;
    my (@keys) = split /	/;
    my $val = pop @keys;
    my $vref = \%HASH;
    while (@keys > 1) {
        $vref->{$keys[0]} = {};
        $vref = $vref->{shift @keys};
    }
    $vref->{$keys[0]} = $val;
}

動的な？ 多次元ハッシュ

＞キー自体を使いたい(splitするコストがかかりますよね)

#1 です.

この回答への補足

> $HASH{社会}=1

この回答への補足

回答とは違うのですが、多重ハッシュにする理由がよくわかりません。

この回答への補足

こんな感じかなぁ?

この回答への補足

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

動的な？　多次元ハッシュ