お世話になっております。
テキストファイルを読み込んで、データベースに格納をしたいと思っております。
全角と半角、全角スペースや半角スペースなどが混在しているため
意図した通りに読み込めません。
test.txt
--------------------------------------------------
山田 太郎 ヤマダ タロウ 神奈川県○○○区1-2-3 0312345678 ・・・1\n\r
高橋 花子 タカハシ ハナコ 東京都○○○○区4-5-6 0312345678 ・・・1\n\r
(カタカナは半角カタカナです。半角カタカナの後ろのスペースは半角スペースです。)
sample.php(EUC)
--------------------------------------------------
$fp = fopen($file_path, "r");
while (!feof($fp)) {
// テキストファイルがShift-JISなのでEUC-JPに変換
$row = mb_convert_encoding(fgets($fp), "EUC-JP", "Shift-JIS");
// 全角スペースは半角スペース2に変換
$line = str_replace(" ", " ", $row);
$d['name'] = trim(mb_substr($line, 0, 20));
$d['kana'] = trim(mb_substr($line, 20, 20));
$d['address'] = trim(mb_substr($line, 40, 40));
$d['tel'] = trim(mb_substr($line, 80, 20));
:
:
$d['flag'] = trim(mb_substr($line, 1300, 1));
}
よろしくお願いいたします。
No.2ベストアンサー
- 回答日時:
mb_substr(テキスト,開始位置,文字長)
の文字長は、バイトではありません。文字数ですので、
名前部分を取り出す時、元のデータでカナの前までという意味で文字数を指定する場合は20ではなく、10です。
(全角文字も半角文字も1文字と数える)
また、この処理をする前に、全角スペースを半角スペースにしていますが、全角スペースが含まれる数によって全体の文字長が変わってしまって固定長ではなくなってしまうので、
まず、切り分けてから、変換した方がよろしいでしょう。
No.1
- 回答日時:
個人的感想ですが、mb_substrは動きが怪しげです。
この手は正規表現の方がいいんじゃないんですか?
$pat = "^(.+)\s(.+)\s+([ァ-ヶ]+)\s([ァ-ヶ]+)\s+(.+)\s+([0-9])";
$lines = file($file);//一行ずつ配列で一気に読込み
$i = 0;
foreach($lines as $line){
$row = mb_convert_encoding($line,"EUC-JP", "Shift-JIS");
$row = mb_convert_kana($row,"s");//全角スペースを半角スペースに変換
if(mb_ereg($pat,$row,$reg)){
$sei[$i] = $reg[1];//姓
$mei[$i] = $reg[2];//名
$sei_k[$i] = $reg[3];//姓(カナ
$mei_k[$i] = $reg[4];
$address[$i] = $reg[5];
$tel[$i] = $reg[6];
}else{
echo "\n<br />{$row} はマッチしませんでした";
$err[$i] = 1;
}
$i++;
}
検証してませんが、こんなイメージでどうでしょう(笑。
この回答への補足
taketan_mydns_jpさん ご回答ありがとうございます。
テキストファイルの一行は、項目のバイト数が決まっているので
mb_substr() を使っています。
mb_substr() や mb_strcut() を使って出来ないでしょうか?
よろしくお願いいたします。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
メッセージボックスで1025文字...
-
eval 半角カナが文字化けする
-
全角括弧と全角読点の間隔を狭...
-
文字の入力で横バー上段、中断...
-
PHPでMySQLに入力した半角スペ...
-
半角記号、全角記号を含む正規...
-
特定の文字を簡単な操作で半角...
-
エクセルでの漢字、カタカナ、...
-
半角英数字のみを受け付ける入...
-
HTML_QuickFormでの日本語の扱...
-
PHPの空白除去
-
VBScriptである文字列に半角文...
-
エクセルのCOUNTIFが正しくカウ...
-
2つ以上の連続する空白文字を除去
-
VBのソース検索で、コメントア...
-
なぜインターネットでは半角カ...
-
PHPでメールアドレスをチェック...
-
入力内容の確認を行う前に$_POS...
-
ホームページのアップロード
-
VBAのコマンドボタンの文字列の...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
メッセージボックスで1025文字...
-
文字の入力で横バー上段、中断...
-
全角括弧と全角読点の間隔を狭...
-
エクセルのCOUNTIFが正しくカウ...
-
Excel関数「COUNTIF」で”文字”...
-
エクセルでの漢字、カタカナ、...
-
半角記号、全角記号を含む正規...
-
記号は半角と全角どちらがよい...
-
VBScriptである文字列に半角文...
-
文字列中の両丸括弧を取り除くV...
-
XMLのタグ名の禁則文字
-
Replace関数は文字数の制限ある...
-
VBAで英数字入力チェックしたい。
-
半角数字かどうかの判定
-
なぜインターネットでは半角カ...
-
全角半角変換 C++/CLI
-
全角英数文字が嫌われる理由を...
-
IT企業の技術屋にとって全角英...
-
2つ以上の連続する空白文字を除去
-
バッチファイル 全角検索
おすすめ情報