ファイルから読み込み

解決済

質問者：wonder_dct
質問日時：2006/07/14 16:25
回答数：2件

お世話になっております。

テキストファイルを読み込んで、データベースに格納をしたいと思っております。
全角と半角、全角スペースや半角スペースなどが混在しているため
意図した通りに読み込めません。

test.txt
--------------------------------------------------
山田　太郎　　　　　ヤマダ　タロウ　　　神奈川県○○○区１－２－３　　　　　　　0312345678 ・・・1\n\r
高橋　花子　　　　　タカハシ　ハナコ　　東京都○○○○区４－５－６　　　　　　　0312345678 ・・・1\n\r
（カタカナは半角カタカナです。半角カタカナの後ろのスペースは半角スペースです。）

sample.php（EUC）
--------------------------------------------------
$fp = fopen($file_path, "r");
while (!feof($fp)) {
　// テキストファイルがShift-JISなのでEUC-JPに変換
　$row = mb_convert_encoding(fgets($fp), "EUC-JP", "Shift-JIS");
　// 全角スペースは半角スペース2に変換
　$line = str_replace("　", " ", $row);

　$d['name'] = trim(mb_substr($line, 0, 20));
　$d['kana'] = trim(mb_substr($line, 20, 20));
　$d['address'] = trim(mb_substr($line, 40, 40));
　$d['tel'] = trim(mb_substr($line, 80, 20));
　　　：
　　　：
　$d['flag'] = trim(mb_substr($line, 1300, 1));
}

よろしくお願いいたします。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (2件)

ベストアンサー優先
最新から表示
回答順に表示

No.2ベストアンサー

回答者： BLUEPIXY
回答日時：2006/07/15 03:31

mb_substr(テキスト,開始位置,文字長)

の文字長は、バイトではありません。文字数ですので、
名前部分を取り出す時、元のデータでカナの前までという意味で文字数を指定する場合は２０ではなく、１０です。
（全角文字も半角文字も１文字と数える）
また、この処理をする前に、全角スペースを半角スペースにしていますが、全角スペースが含まれる数によって全体の文字長が変わってしまって固定長ではなくなってしまうので、
まず、切り分けてから、変換した方がよろしいでしょう。

- 0
- 件

通報する

No.1

回答者： taketan_mydns_jp
回答日時：2006/07/14 17:22

個人的感想ですが、mb_substrは動きが怪しげです。

この手は正規表現の方がいいんじゃないんですか？

$pat = "^(.+)\s(.+)\s+([ァ-ヶ]+)\s([ァ-ヶ]+)\s+(.+)\s+([0-9])";
$lines = file($file);//一行ずつ配列で一気に読込み
$i = 0;
foreach($lines as $line){
　$row = mb_convert_encoding($line,"EUC-JP", "Shift-JIS");
$row = mb_convert_kana($row,"s");//全角スペースを半角スペースに変換
if(mb_ereg($pat,$row,$reg)){
$sei[$i] = $reg[1];//姓
$mei[$i] = $reg[2];//名
$sei_k[$i] = $reg[3];//姓（カナ
$mei_k[$i] = $reg[4];
$address[$i] = $reg[5];
$tel[$i] = $reg[6];
}else{
echo "\n<br />{$row} はマッチしませんでした";
$err[$i] = 1;
}
$i++;
}

検証してませんが、こんなイメージでどうでしょう（笑。