素人で大変申し訳ございません。
他の人が作ったPerlを改良しようと思っております。
仕様は、csvのカンマからカンマの間に入っている
文字を取得するというのですが、
英数字の場合は、正常に取得できるのですが、
半角ひらがなが入ると文字の取得ができません。
下記の$outputで、私が必要な情報を得ようと思っているのですが、
下記の右辺をどのように変えれば、半角ひらがなも取得できるでしょうか?
$output =~ s|/\*\s(([A-Z0-9_])+)\s\*/|$D->{$1}|g;
※エンコードが必要でしたら、utf-8を使いたいと思っています。
一部分の大変失礼な質問と思いますが、何卒よろしくお願い致します。
No.8
- 回答日時:
繰り返しますが、CSVはアプリケーション依存です。
様々なフォーマットがあります。1) ,,間に,があるとき\,でエスケープする
2) ,,間に日本語があるときは全体を""で囲む
3) ,,間に"があるときは\でエスケープする
などがあると思います。
それらがわからないと正規表現は書けません。
詳しくは、
CSV形式の行から値のリストを取り出す ( http://www.din.or.jp/~ohzaki/perl.htm#CSV2Values )
以降の記事をお読みください。
No.7
- 回答日時:
あなたが行いたいことは本当に「csvのカンマからカンマの間に入っている文字を取得する」なのでしょうか?
>$output =~ s|/\*\s(([A-Z0-9_])+)\s\*/|$D->{$1}|g;
の右辺は正規表現部分は、カンマ~カンマの間をあらわすようなものではないですけど。
ぱっと見、
"/*空白文字"~"空白文字*/"で囲まれたアルファベット大文字・数字・アンダーバーで
構成された文字列
なのですが。
No.6
- 回答日時:
「文字の取得ができない」というのは, 具体的にはどのような入力に対してどのような結果を期待しているところでどのような答えになってしまうのですか?
あと,
$output =~ s|/\*\s(([A-Z0-9_])+)\s\*/|$D->{$1}|g;
は何を意図しているのですか? 「csvのカンマからカンマの間に入っている文字を取得する」こととの関連性が見えないのですが.
できればファイルのオープンとか読み込みの部分も見たいねぇ.
No.5
- 回答日時:
「半角ひらがな」を含む入力ファイルというのは、一般にはないと思いますが、どのようなエンコードでしょうか?
半角カタカナであれば、入力ファイルのエンコードは特に気にする必要はないと思います。
「csvのカンマからカンマの間に入っている文字を取得する」ということは「カンマを区切り文字と考えて、カンマの間にある文字や数字を取り出す」ということであれば、split関数が使えます。
例えば、入力ファイル(input.csv)が
ABC,アイウエオ,10000
DEF,カキクケコ,20000
GHI,サシスセソ,30000
というcsvファイルであれば、下記のスクリプトで
open(IN1,"input.csv");
open(OUT1,">output.txt");
while($line1=<IN1>){
chomp($line1);
my $tmp=$line1;
@in1=split(",",$line1);
$out1=join("\t",@in1);
printOUT1"$out1\n";
}
close(IN1);
close(OUT1);
$in1[0]にABCやDEF、GHIが入り、$in1[1]にアイウエオ、カキクケコ、サシスセソなどが入ります。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- PHP phpのメールフォームの完了画面でメール受信のコードを書いています。 1 2023/05/31 11:39
- その他(コンピューター・テクノロジー) 【Tableau Desktop】文字列から8桁の数字を日付型(yyyyMMdd)として取得 1 2023/07/31 10:17
- マウス・キーボード macからリモートデスクトップでwindowsに接続した際のキーボード配列 3 2023/07/10 08:40
- その他(プログラミング・Web制作) プログラミング pythonの問題について 2 2022/04/19 00:41
- JavaScript javascriptで文字分割は、 split() などメソッド不要??? 4 2023/02/06 22:50
- Visual Basic(VBA) 集めたシートのシート名を変更したい。 下記のコードでサブフォルダにあるファイルのSheet3を集めて 6 2022/08/23 10:38
- コンサルティング・アドバイザー UL など海外規格をまとめる方法について 3 2023/08/16 10:29
- Visual Basic(VBA) Selenium Basicの件 5 2023/04/10 20:55
- Access(アクセス) Accessのテキストボックスの入力文字制限 1 2023/01/18 20:43
- オープンソース Python openpyxlを使用したセル番地の使用について 1 2023/08/03 22:05
関連するカテゴリからQ&Aを探す
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
Perlでファイル名を変更したい...
-
ポインター引数の関数でコンパ...
-
char str[256]の256の意味は?
-
エクセルシート名の制限を変更...
-
UTF-8で5~6バイトになる文字コ...
-
10Mバイトて文字数に すると何...
-
「1TB」のHDDに日本語は何字入...
-
Excel 1セル当りの文字数が2...
-
Excel VBA メール作成について ...
-
バイト列とバイナリ列の違いが...
-
10個の実数に対する降順ソート...
-
COBOLのCOMP形式について
-
64bit対応
-
半角、全角の判別方法
-
Cのプログラムがどうしても動き...
-
memcmp バイナリデータの比較方法
-
【VB2005】テキストボックス内...
-
SQLで1バイト、2バイト混在...
-
バイナリとBCDコード
-
3バイト文字(UTF-8)をprintfで...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
MATLAB(マトラボ)とcsvファ...
-
matlabで、平均値を求める方法...
-
VBA エクセルで1列で表示したい。
-
VBScripの2次元動的配列
-
いつどこゲームのようなテキス...
-
VB6.0でMSChartをタイマーを使...
-
メールアドレスをテキストファ...
-
複数のCSVを一度にダウンロード
-
MSDOSからワイルドカード指定で...
-
utf-8のコードを使いたい
-
ポインター引数の関数でコンパ...
-
10Mバイトて文字数に すると何...
-
UTF-8で5~6バイトになる文字コ...
-
エクセルシート名の制限を変更...
-
COBOLのCOMP形式について
-
stable diffusionのエラー
-
ビットスワップとバイトスワッ...
-
char str[256]の256の意味は?
-
Excel VBA メール作成について ...
-
バイナリとBCDコード
おすすめ情報