お世話になっております。
テキストファイルを読み込んで、データベースに格納をしたいと思っております。
全角と半角、全角スペースや半角スペースなどが混在しているため
意図した通りに読み込めません。
test.txt
--------------------------------------------------
山田 太郎 ヤマダ タロウ 神奈川県○○○区1-2-3 0312345678 ・・・1\n\r
高橋 花子 タカハシ ハナコ 東京都○○○○区4-5-6 0312345678 ・・・1\n\r
(カタカナは半角カタカナです。半角カタカナの後ろのスペースは半角スペースです。)
sample.php(EUC)
--------------------------------------------------
$fp = fopen($file_path, "r");
while (!feof($fp)) {
// テキストファイルがShift-JISなのでEUC-JPに変換
$row = mb_convert_encoding(fgets($fp), "EUC-JP", "Shift-JIS");
// 全角スペースは半角スペース2に変換
$line = str_replace(" ", " ", $row);
$d['name'] = trim(mb_substr($line, 0, 20));
$d['kana'] = trim(mb_substr($line, 20, 20));
$d['address'] = trim(mb_substr($line, 40, 40));
$d['tel'] = trim(mb_substr($line, 80, 20));
:
:
$d['flag'] = trim(mb_substr($line, 1300, 1));
}
よろしくお願いいたします。
No.2ベストアンサー
- 回答日時:
mb_substr(テキスト,開始位置,文字長)
の文字長は、バイトではありません。文字数ですので、
名前部分を取り出す時、元のデータでカナの前までという意味で文字数を指定する場合は20ではなく、10です。
(全角文字も半角文字も1文字と数える)
また、この処理をする前に、全角スペースを半角スペースにしていますが、全角スペースが含まれる数によって全体の文字長が変わってしまって固定長ではなくなってしまうので、
まず、切り分けてから、変換した方がよろしいでしょう。
No.1
- 回答日時:
個人的感想ですが、mb_substrは動きが怪しげです。
この手は正規表現の方がいいんじゃないんですか?
$pat = "^(.+)\s(.+)\s+([ァ-ヶ]+)\s([ァ-ヶ]+)\s+(.+)\s+([0-9])";
$lines = file($file);//一行ずつ配列で一気に読込み
$i = 0;
foreach($lines as $line){
$row = mb_convert_encoding($line,"EUC-JP", "Shift-JIS");
$row = mb_convert_kana($row,"s");//全角スペースを半角スペースに変換
if(mb_ereg($pat,$row,$reg)){
$sei[$i] = $reg[1];//姓
$mei[$i] = $reg[2];//名
$sei_k[$i] = $reg[3];//姓(カナ
$mei_k[$i] = $reg[4];
$address[$i] = $reg[5];
$tel[$i] = $reg[6];
}else{
echo "\n<br />{$row} はマッチしませんでした";
$err[$i] = 1;
}
$i++;
}
検証してませんが、こんなイメージでどうでしょう(笑。
この回答への補足
taketan_mydns_jpさん ご回答ありがとうございます。
テキストファイルの一行は、項目のバイト数が決まっているので
mb_substr() を使っています。
mb_substr() や mb_strcut() を使って出来ないでしょうか?
よろしくお願いいたします。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Access(アクセス) Accessのテキストボックスの入力文字制限 1 2023/01/18 20:43
- Visual Basic(VBA) 特定の文字を簡単な操作で半角スペースに変換するか削除したい 2 2022/11/01 10:35
- Excel(エクセル) 【マクロ】フォルダを2つのモニターの定位置に並べたい 2 2022/09/02 01:14
- Excel(エクセル) 【マクロ】フォルダを3つ、POモニター上に、決まった並べ方をしたい 4 2022/08/31 11:05
- その他(Microsoft Office) 英数字のみ全角から半角に変換 4 2023/07/28 14:48
- その他(Microsoft Office) WordやExcelで英数字のみ半角または全角にしたい 6 2022/08/03 08:18
- Access(アクセス) Access で半角スペースと全角スペースの区別について 3 2022/11/05 23:54
- Visual Basic(VBA) 指定列最終行までのスペースを改行するVBAについて 2 2022/06/01 19:50
- Excel(エクセル) 【VBA】ファイルパスに半角スペースが入ると、VBAが動かない 5 2022/08/04 20:52
- PHP Postgresの特定のカラムからスペースを取る方法 1 2023/02/22 13:18
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
文字の入力で横バー上段、中断...
-
メッセージボックスで1025文字...
-
Excel関数「COUNTIF」で”文字”...
-
半角記号、全角記号を含む正規...
-
全角半角変換 C++/CLI
-
半角文字と全角文字の判別の仕方
-
全角カタカナの正規表現
-
ショートメールの文字数
-
半角英数文字を全角英数文字に...
-
空白に を使うべきでしょ...
-
XMLのタグ名の禁則文字
-
ASC(2)
-
PPT ファイルの文字カウント=...
-
正規表現でIパスワードの作成内...
-
正規表現 文中空白可能
-
パワーポイントの""(ダブルク...
-
Excel2002 一桁数字だけ全角に置換
-
校正 改行 全角など
-
rawurlencodeとurlencodeの違い...
-
VBAで英数字入力チェックしたい。
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
文字の入力で横バー上段、中断...
-
メッセージボックスで1025文字...
-
Excel関数「COUNTIF」で”文字”...
-
全角括弧と全角読点の間隔を狭...
-
半角記号、全角記号を含む正規...
-
エクセルのCOUNTIFが正しくカウ...
-
XMLのタグ名の禁則文字
-
文字列中の両丸括弧を取り除くV...
-
VBScriptである文字列に半角文...
-
全角英数文字が嫌われる理由を...
-
記号は半角と全角どちらがよい...
-
Excel2002 一桁数字だけ全角に置換
-
エクセルでの漢字、カタカナ、...
-
特定の文字を簡単な操作で半角...
-
Replace関数は文字数の制限ある...
-
VBAで英数字入力チェックしたい。
-
IT企業の技術屋にとって全角英...
-
2つ以上の連続する空白文字を除去
-
全角半角変換 C++/CLI
-
Accessの文字数を調べたい
おすすめ情報