素人で大変申し訳ございません。
他の人が作ったPerlを改良しようと思っております。
仕様は、csvのカンマからカンマの間に入っている
文字を取得するというのですが、
英数字の場合は、正常に取得できるのですが、
半角ひらがなが入ると文字の取得ができません。
下記の$outputで、私が必要な情報を得ようと思っているのですが、
下記の右辺をどのように変えれば、半角ひらがなも取得できるでしょうか?
$output =~ s|/\*\s(([A-Z0-9_])+)\s\*/|$D->{$1}|g;
※エンコードが必要でしたら、utf-8を使いたいと思っています。
一部分の大変失礼な質問と思いますが、何卒よろしくお願い致します。
No.8
- 回答日時:
繰り返しますが、CSVはアプリケーション依存です。
様々なフォーマットがあります。1) ,,間に,があるとき\,でエスケープする
2) ,,間に日本語があるときは全体を""で囲む
3) ,,間に"があるときは\でエスケープする
などがあると思います。
それらがわからないと正規表現は書けません。
詳しくは、
CSV形式の行から値のリストを取り出す ( http://www.din.or.jp/~ohzaki/perl.htm#CSV2Values )
以降の記事をお読みください。
No.7
- 回答日時:
あなたが行いたいことは本当に「csvのカンマからカンマの間に入っている文字を取得する」なのでしょうか?
>$output =~ s|/\*\s(([A-Z0-9_])+)\s\*/|$D->{$1}|g;
の右辺は正規表現部分は、カンマ~カンマの間をあらわすようなものではないですけど。
ぱっと見、
"/*空白文字"~"空白文字*/"で囲まれたアルファベット大文字・数字・アンダーバーで
構成された文字列
なのですが。
No.6
- 回答日時:
「文字の取得ができない」というのは, 具体的にはどのような入力に対してどのような結果を期待しているところでどのような答えになってしまうのですか?
あと,
$output =~ s|/\*\s(([A-Z0-9_])+)\s\*/|$D->{$1}|g;
は何を意図しているのですか? 「csvのカンマからカンマの間に入っている文字を取得する」こととの関連性が見えないのですが.
できればファイルのオープンとか読み込みの部分も見たいねぇ.
No.5
- 回答日時:
「半角ひらがな」を含む入力ファイルというのは、一般にはないと思いますが、どのようなエンコードでしょうか?
半角カタカナであれば、入力ファイルのエンコードは特に気にする必要はないと思います。
「csvのカンマからカンマの間に入っている文字を取得する」ということは「カンマを区切り文字と考えて、カンマの間にある文字や数字を取り出す」ということであれば、split関数が使えます。
例えば、入力ファイル(input.csv)が
ABC,アイウエオ,10000
DEF,カキクケコ,20000
GHI,サシスセソ,30000
というcsvファイルであれば、下記のスクリプトで
open(IN1,"input.csv");
open(OUT1,">output.txt");
while($line1=<IN1>){
chomp($line1);
my $tmp=$line1;
@in1=split(",",$line1);
$out1=join("\t",@in1);
printOUT1"$out1\n";
}
close(IN1);
close(OUT1);
$in1[0]にABCやDEF、GHIが入り、$in1[1]にアイウエオ、カキクケコ、サシスセソなどが入ります。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
matlabで、平均値を求める方法...
-
エクセルで編集したCSVファイル...
-
perlでカンマ区切り(CSV)デー...
-
utf-8のコードを使いたい
-
UTF-8で5~6バイトになる文字コ...
-
10Mバイトて文字数に すると何...
-
エクセルシート名の制限を変更...
-
CGIを勉強しています。¥n(改...
-
ピクセル,dpiから容量(バイト...
-
printfの%eで指数部分の桁数を...
-
Excel 1セル当りの文字数が2...
-
Excel VBA メール作成について ...
-
VB.NET LeftBの代用
-
64bit対応
-
VBAでUnicodeしか存在しない文...
-
COBOLのCOMP形式について
-
アプリケーション
-
機種依存文字をチェックしたい。
-
メールの件名をデコードしたい
-
SQLで1バイト、2バイト混在...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
昇順に整列するプログラムにつ...
-
VB6.0でMSChartをタイマーを使...
-
mkdirでのファイルロック
-
MATLAB(マトラボ)とcsvファ...
-
エクセルで編集したCSVファイル...
-
C言語のプログラム問題
-
文字型変数を使って2進数表示す...
-
VBScripの2次元動的配列
-
matlabで、平均値を求める方法...
-
perl これは前文検索システムの...
-
utf-8のコードを使いたい
-
csvファイルでの,(カンマ)の...
-
UTF-8で5~6バイトになる文字コ...
-
10Mバイトて文字数に すると何...
-
エクセルシート名の制限を変更...
-
char str[256]の256の意味は?
-
Excel 1セル当りの文字数が2...
-
stable diffusionのエラー
-
Excel VBA メール作成について ...
-
COBOLのCOMP形式について
おすすめ情報