なにがおかしいのでしょうか？

Question

先の質問「プログラムのヒントを下さい」でも扱ったのですが、

apple
best
apple
END
apple
beer
beer
END
zero
child
death
zero

のようなテキストから、ENDとENDの間か、ENDと最初もしくは最後の間の重複した文字列を取り除くスクリプトを書こうと思います。出力例は以下のようになってもらいたいです。

apple
best
END
apple
beer
END
zero
child
death

自分で頑張って下のコードまで書きましたが動きませんでした。特に、ENDと最初もしくは最後の間
の取り扱いがわかりません。どなたかご教授お願いいたします。

open(IN, "datafile");
@xx = <IN>;

@zz = ();

foreach $yy (@xx) {
     if ($yy eq "end"){
     @uniq = uniqArray(\@zz);
     foreach my $value ( @uniq ){
     print "$value
";
     }
     @zz = ();   
     }else{
     push(@zz,$yy);
     }
}
close(IN);

sub uniqArray{
    my $array = shift;
    my %hash  = ();

foreach my $value ( @$array ){
        $hash{$value} = 1;
    }

return(
        keys %hash
    );
}

N60-BASIC · Accepted Answer

@ARGV = ('datafile');
my %h;
print grep { ! exists $h{$_} && ++$h{$_} && !(/^END$/ && undef %h) } <>;

Tacosan · Answer

「うまく動かない」というなら, 「何がどう『うまく動かない』のか」くらい書けない? 前のやつも「同一の単語が出現しているとエラーが起きてしまいました」で終わらせてるけど, 「どんなエラーが起きるのか」は書けるはずだよね (そもそも普通に考える限り「エラーが起きる」ことがありえないと思うのだが).
それくらいやってもバチはあたらないと思うよ.

本題に入ると, #1 で言われている「@zzには最後のEND以降の部分が残ってます。」というのは, 実際にやってみればすぐわかります. そのままでは「最後の END より後ろの部分」が出力されないはずです.

ただ, このプログラムは不自然. 自分だったら
sub uniqArray {
my %hash;
my @result;
foreach my $element (@_) {
unless ($hash{$element}) {
push @result, $element;
$hash{$element} = 1;
}
}
@result;
}

open my $fh, '<', 'datafile';
my @tmp;
while (my $line = <$fh>) {
chomp($line);
push @tmp, $line;
if ($line eq 'END') {
foreach my $element (uniqArray(@tmp)) {
print "$element
";
}
@tmp = ();
}
}
foreach my $element (uniqArray(@tmp)) {
print "$element
";
}
くらいかなぁ. #1 で言われるように, 表示するところまでサブルーチンにしそうだけど.

「動かない」とか「エラーが出る」とか答えてくれるのは全くかまわないけど, そういうときは最初に書いたように「どういう入力に対してどんな結果になることを期待したが実際に得られた結果はそれと違ってこんなふうになっている」とか, あるいはエラーが出るというならどんなエラーなのか, メッセージを完全に書いてほしい. それくらいの手間は惜しむものじゃないと思う.

shiren2 · Answer

こんな感じですかね。
こういう問題はハッシュを使うと簡単ですよ。
インデントは全角スペースになっています。

#!/usr/bin/perl
use strict;

my %h;

while(<DATA>){
　chomp;

if(/^END$/){
　　undef %h;
　　print "END
";
　}else{
　　if(not exists $h{$_}){
　　　print "$_
";
　　　$h{$_} = 1;
　　}
　}
}

__DATA__
apple
best
apple
END
apple
beer
beer
END
zero
child
death
zero

kmee · Answer

> open(IN, "datafile"); > @xx = ; INはここまでしか使わない(使えない)ので > close(IN); > if ($yy eq "end"){ 「eq」は正しく「等しい文字列」の判定です。大文字小文字は区別されます。 'END' ne 'end' です > foreach $yy (@xx) { ... > } このループが終わった段階で @zzには最後のEND以降の部分が残ってます。ここでもう一度一連の処理(↓)が必要です。これもsubにしておいてもいいでしょう @uniq = uniqArray(\@zz); foreach my $value ( @uniq ){ print "$value"; # ← あと、 @xx=で読み込んだ文字列は改行コードまで含まれます。 #ここでを入れていると、改行が2つになります #あるいは、はそのままにして、 foreach $yy (@xx) {の後で chomp $yy 等で改行コードを取り除くか。 }

なにがおかしいのでしょうか？

@ARGV = ('datafile');

こんな感じですかね。

> open(IN, "datafile");

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング