データ項目の並び替えについて

Question

下記のようなcsv形式のファイルがあります。
--元データ--
,,,,,,,07月01日,,,,07月02日
ID,発拠点名,ID,着拠点名,試験ファイル,測定項目,基礎化値,0-5時,6-11時,12-17時,18-23時,0-5時,6-11時,12-17時,18-23時
001,大阪,002,兵庫,test01,遅延,最大,11,11,13,13,13,12,12,12
001,大阪,002,兵庫,test01,遅延,最小,8,9,9,9,9,10,10,10
001,大阪,002,兵庫,test01,遅延,平均,10,10,10,10,10,11,11,11
------------
これを
--変換後イメージ--
発拠点名,着拠点名,日,時,遅延最大,遅延最小,遅延平均
大阪,兵庫,07月01日,0-5時,11,8,10
大阪,兵庫,07月01日,6-11時,11,9,10
大阪,兵庫,07月01日,6-11時,13,9,10
大阪,兵庫,07月01日,6-11時,13,9,10
-----
といった形式にperlで変換するスクリプトを作りたいのですが初心者でどのように書けばよいのかわからず困っています。どなたかご教授願えないでしょうか？
よろしくお願い致します。

sakusaker7 · Accepted Answer

質問で提示されているデータだけでは規則がどういうものが判断できない部分があります。
もう少し明確に規則を書いてもらえれば二度手間を避けることもできると思います。

たとえば変換前のデータでは、
001,大阪,002,兵庫,test01,遅延,最大,11,11,13,13,13,12,12,12
001,大阪,002,兵庫,test01,遅延,最小,8,9,9,9,9,10,10,10
001,大阪,002,兵庫,test01,遅延,平均,10,10,10,10,10,11,11,11
の三行しかデータがないのに、変換後になると
大阪,兵庫,07月01日,0-5時,11,8,10
大阪,兵庫,07月01日,6-11時,11,9,10
大阪,兵庫,07月01日,6-11時,13,9,10
大阪,兵庫,07月01日,6-11時,13,9,10
四行に増えているのでしょう?

,,,,,,,07月01日,,,,07月02日
どのような理由で、7/1と7/2がそれぞれこの位置に置かれているのか不明です。
サンプルデータには7/2で出力するものがありませんし。

多分二行目(ヘッダ?)の
0-5時,6-11時,12-17時,18-23時,0-5時,6-11時,12-17時,18-23時
の部分に入っている数字が何かの基準になるのでしょうが
まったくもって不明です。

変換後のヘッダにある
> 遅延最大,遅延最小,遅延平均
もどのように求める数値なのか規則がわかりません。

適当に判断して書いたところで「実は…」というパターンは避けたいので、
出せるものは出してください。

とはいうものの出されたら必ず書きますとはお約束できません。
努力はしますが。

> 教授
こういうときに使うのは「教示」ですよん。

sakusaker7 · Answer

あ、先越されてるしw せっかく書いたのでぺたり。一行目に入る日付は二日分しか想定してないとかありますんで、 #2の方の回答のほうがいいでしょう。少しでもわかりやすくしようと思って効率的に悪いところがあります。そんなにでかいデータでもなければ無視できるほどでしょうけど。 use strict; my %data; my $date1; my $date2; my $line; $line = ; chomp $line; (undef, $date1, $date2) = split /,+/, $line; $line = ; while ($line = ) { #my @fields = split /,/, $line; chomp $line; my ($id1, $from, $id2, $to, $file, $mesure, $base, @rest) = split /,/, $line; $data{$date1}{from} = $from; $data{$date1}{to} = $to; $data{$date2}{from} = $from; $data{$date2}{to} = $to; $data{$date1}{$base} = [@rest[0..3]]; $data{$date2}{$base} = [@rest[4..7]]; } print join(q{,}, qw(発拠点名着拠点名日時遅延最大遅延最小遅延平均)), " "; foreach my $day ($date1, $date2) { my @time_table = ('0-5', '6-11', '12-17', '18-23'); for (my $idx; $idx < scalar @time_table; $idx++) { my $tzone = $time_table[$idx]; my @out; push @out, $data{$day}{from}, $data{$day}{to}, $day, ($tzone . '時'), $data{$day}{'最大'}[$idx], $data{$day}{'最小'}[$idx], $data{$day}{'平均'}[$idx]; print join(q{,}, @out), " "; } } __END__ ,,,,,,,07月01日,,,,07月02日 ID,発拠点名,ID,着拠点名,試験ファイル,測定項目,基礎化値,0-5時,6-11時,12-17時,18-23時,0-5時,6-11時,12-17時,18-23時 001,大阪,002,兵庫,test01,遅延,最大,11,11,13,13,13,12,12,12 001,大阪,002,兵庫,test01,遅延,最小,8,9,9,9,9,10,10,10 001,大阪,002,兵庫,test01,遅延,平均,10,10,10,10,10,11,11,11

g_p_ · Answer

こんにちは、＃１氏への補足でなんとなく分かったような気がしたので、試しにやってみました。で、こんな感じですか？１行目と２行目は必ず所定のデータが入っているつもりです。全部ハッシュに貯めているので、ファイルが大きくなるとまずい事になるかも知れませんが…。とりあえず、実行してみてうまくいったなら、 DATAを読んでるトコを標準入力からにして（つまり<>） windows ならコマンドプロンプトから、 type 元のファイル名 | perl スクリプト名 > 新しいファイル名でやってみて下さい。うまく行かなかったらごめんなさい。 #!perl use strict; use warnings; my %LINES_OF = (); my @TIME_RANGE = qw( 0-5時 6-11時 12-17時 18-23時 ); #1行目は必ず日付の行？ chomp ( my $line = ); my @DATE = grep {$_} split /,/ , $line; #２行目無視 $line = ; while () { chomp; my( @headers , @datas); #見出しとデータに分割 (@headers[ 0..6 ],@datas) = split /,/; my $header = join ',' , @headers[ 1 , 3 ]; #ハッシュに展開 for my $date (@DATE) { for my $range (@TIME_RANGE) { $LINES_OF{ $date }->{ $header }->{ $range }->{ $headers[6] } = shift @datas; } } } #ハッシュぐるぐるで表示 print "発拠点名,着拠点名,日,時,遅延最大,遅延最小,遅延平均 "; for my $date ( @DATE ) { for my $header ( sort keys %{ $LINES_OF{$date} } ) { for my $range ( @TIME_RANGE ) { my $line = join ',' , $header , $date , $range; for ( '最大' , '最小' , '平均' ) { $line .= ',' . $LINES_OF{ $date }->{ $header }->{ $range }->{ $_ }; } print $line , " "; } } } __DATA__ ,,,,,,,07月01日,,,,07月02日 ID,発拠点名,ID,着拠点名,試験ファイル,測定項目,基礎化値,0-5時,6-11時,12-17時,18-23時,0-5時,6-11時,12-17時,18-23時 001,大阪,002,兵庫,test01,遅延,最大,11,11,13,13,13,12,12,12 001,大阪,002,兵庫,test01,遅延,最小,8,9,9,9,9,10,10,10 001,大阪,002,兵庫,test01,遅延,平均,10,10,10,10,10,11,11,11

データ項目の並び替えについて

質問で提示されているデータだけでは規則がどういうものが判断できない部分があります。

この回答への補足

あ、先越されてるしw

こんにちは、

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング