先回に引き続きお伺いします。
■フォルダツリー体系が次のようになっているとき、
D:\TEMP
├─フォルダ名の末尾に機能
│ test1.txt
├─フォルダ名の末尾に表
│ test2.txt
├─途中に機能がある
│ test3.txt
└─途中に表がある
test4.txt
■次のスクリプトを処理させるのですが、
#!perl
use strict;
&subdir($ARGV[0]);
sub subdir {
my($dir) = $_[0];
opendir(DIR,"$dir") || die "'$dir' $! stopped";
foreach(sort readdir(DIR)){
next if(/^\.+/);# '.' '..' はパス
if(-f "$dir\\$_"){
print "'$dir\\$_'\tはファイルです\n";
}elsif(-d "$dir\\$_"){
print "'$dir\\$_'\tはフォルダです\n";
&subdir("$dir\\$_");
}else{
print "'$dir\\$_'\tは何ですか?\n";#出て欲しくない
}
}
closedir(DIR);
}
■結果は、次のようになります。
(※フォルダ名の末尾に特殊な漢字コードがある所が判定できない)
C:\>test.pl d:\temp
'd:\temp\フォルダ名の末尾に機能' は何ですか?
'd:\temp\フォルダ名の末尾に表' は何ですか?
'd:\temp\途中に機能がある' はフォルダです
'd:\temp\途中に機能がある\test3.txt' はファイルです
'd:\temp\途中に表がある' はフォルダです
'd:\temp\途中に表がある\test4.txt' はファイルです
先回、色々と教わったこと
use encoding "Shift_JIS"; や 局所的に $dir を decodeさせるなどしても上手く行きません。良い方法があれば教えてください。
No.6ベストアンサー
- 回答日時:
ファイル名が'一覧表'とかみたいになっている場合の対処について考えてみました。
相変わらずですが^^
----------------------------------------------------------------
#!perl
use strict;
use File::Basename;
&subdir($ARGV[0]);
sub subdir {
my($dir) = $_[0];
my $wk;
opendir(DIR,"$dir/") || die "'$dir' $! stopped";
foreach(sort readdir(DIR)){
next if(/^\.+/); # '.' '..' はパス
my ($base,$path,$type) = fileparse("$dir/$_", qr{\..*});
$wk = "$dir/$_" . ($type ? "" : "\.");#拡張子が無い場合ピリオドを付ける
if(-d "$dir/$_/"){
print "'$dir/$_'\tはフォルダです\n";
&subdir("$dir/$_");
}elsif(-f $wk){
print "'$dir/$_'\tはファイルです\n";
}else{
print "'$dir/$_'\tは何ですか?\n";#出て欲しくない
}
}
closedir(DIR);
}
なるほどー
#拡張子が無い場合ピリオドを付ける
がミソですね。
fileparse("$dir/$_", qr{\..*});
の関数でファイル名が正しく分離できるんだったら、
今回のような問題もすんなり対応できるようにperl本体が進化してくれれば良いですね。
あ、だから、jperlがあるのか・・・Own Goal!!(^^;
No.5
- 回答日時:
-fや-d, opendir などを使った場合にはCのランタイムライブラリ(さらにはもぐってWindowsAPI)を呼び出すのですが、これには
Unicode文字列を渡せない(少なくとも現状では)ので、今回のケースでは
use encoding や decode することは対策にはなりません。
で、機能とか表はバイト列で見ると '\' で終わっています。Perlの内部で
-fなどの処理をするときに末尾の'\' を '/' で置き換える等の処理をしています(ライブラリのバグ回避等のため)。
このとき、ShiftJISの文字列であるかどうかを気にしていないので、
「機能」とかが末尾に来ると置き換えてはいけないものを置き換えてしまうので、誤動作することになります。
WindowsAPIやライブラリのレベルではパスの区切りとして'\'でも'/'でも
許すので、Perlでも区切りとして'/’が使えるようになっています。
対策としては、BLUEPIXYさんがしているように、末尾に'/'を加えて
みるというものなどがあります。ただ、ディレクトリ名ではなく
ファイル名が'一覧表'とかみたいになっていると多分どうしようも
ないです。
以上重箱の隅でした。
なるほど勉強になりました。
ありがとうございます。
>>ただ、ディレクトリ名ではなくファイル名が'一覧表'とかみたいになっていると多分どうしようもないです。
確かに、そうですね・・・
ただ今回の場合は、MS系の文書ファイル類が主なので、必ず半角英数字で拡張子が付くため、結果オーライの感じです。
(”ぎじゅつ者”的には、少し許せないところではありますが)
ありがとうございました。
No.4
- 回答日時:
sub subdir {
my($dir) = $_[0];
opendir(DIR,"$dir/") || die "'$dir' $! stopped";
foreach(sort readdir(DIR)){
next if(/^\.+/); # '.' '..' はパス
if(-f "$dir/$_"){
print "'$dir/$_'\tはファイルです\n";
}elsif(-d "$dir/$_/"){
print "'$dir/$_'\tはフォルダです\n";
&subdir("$dir/$_");
}else{
print "'$dir/$_'\tは何ですか?\n";#出て欲しくない
}
}
closedir(DIR);
}
としてみるとか
この回答への補足
追伸ですが、
Windows用でも、perlスクリプトの中では、デリミタを'/'としても良いのですね・・・
これまでは、わざわざ、
$_DLM = ("$^O" =~ /linux/i)? "/" : "\\";# OS別パスデリミタ
のようなことをしていました・・・
encodeを使わない方法もあるのですね。
示して頂いたスクリプトで、目的のことができるようになりました。
夜遅くにご回答ありがとうございました。
No.3
- 回答日時:
「表」も「能」も、S-JISでは第2バイトが「\」です。
ですので、-dまたは-f付きif文は、falseを返します。
perlでは、漢字を含む文字列を処理する際、文字列がS-JISだと漢字の第2バイトが悪さをして正常に動きません。
一時的に文字列をS-JIS以外の文字セットに変換するなどして、文字列中に「\」や「|」などの文字が入らないようにして下さい。
この回答への補足
深夜に素早いご回答、ありがとうございました。
>>一時的に文字列をS-JIS以外の文字セットに変換するなどして、
ですが、やってみたこととして、
use Encode;
を使って、
my($dir) = Encode:decode("s-jis",$_[0]);
opendir(DIR,"$dir") || die "'$dir' $! stopped";
foreach(sort readdir(DIR)){
next if(/^\.+/); # '.' '..' はパス
$_ = Encode:decode("s-jis",$_);
if(-f "$dir\\$_"){
print "'$dir\\$_'\tはファイルです\n";
}elsif(-d "$dir\\$_"){
print "'$dir\\$_'\tはフォルダです\n";
&subdir(Encode:encode("s-jis","$dir\\$_"));
}else{
print "'$dir\\$_'\tは何ですか?\n";#出て欲しくない
}
のようにしてみたのですが、これでも上手く行きませんでした。
良い指定の方法などがあれば教えてください。よろしくお願い致します。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
ディレクトリ構造の表示
-
batファイルでrenameができませ...
-
Windowsで複数のファイルを同じ...
-
ディレクトリツリーの表示
-
メールアドレスでメンバー認証
-
Net::FTPを使いファイル一覧の...
-
パスから最後のディレクトリだ...
-
grepの書き方がわかりません。
-
教えて!perlから.exeファイル...
-
Perlで特定行から特定行までを...
-
VBAでCSVファイルの特定行を書...
-
VBAでCSVファイルを途中行まで...
-
awkスクリプトでダブルクォーテ...
-
sprintfについて
-
C言語で特定の行を抽出する方法...
-
JavaでCSVファイルを高速に読む...
-
VBAで巨大なファイルの途中から...
-
バッチファイルの作り方(CSV→...
-
file_exists関数について
-
perlで先頭の数値をみて昇順に...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
batファイルでrenameができませ...
-
vba dir の相対パス
-
FindFirstFileとFindNextFileで...
-
readdir()で得られるファイル・...
-
ディレクトリ名を取得したい
-
C言語でファイル名を取得
-
dos変数の%~dp0は powershellで...
-
パスから最後のディレクトリだ...
-
Windowsで複数のファイルを同じ...
-
chdirがうまくできない
-
テキストファイルの結合
-
UNIXの"find"コマンド同等のプ...
-
ディレクトリの判別
-
Windows漢字フォルダ名の扱い(...
-
Perlで フォルダ内の全て...
-
makefileでファイルをコピー(...
-
ディレクトリツリーの表示
-
空白を含むディレクトリにある...
-
メールアドレスでメンバー認証
-
複数ファイルの読み込みについて
おすすめ情報