日本語(EUCJP)を含むタブ区切りテキストのインポートに失敗しており、
行き詰ってしまいました。考えられる原因等お気付きありましたら、
ご指摘頂ければ助かります。
尚、my.cnfで[mysql], [mysqld], [mysqlimport], [mysqldump]は、
default-character-set=ujis
で設定しています。
mysql> select version();
+---------------------+
| version() |
+---------------------+
| 5.0.27-standard-log |
+---------------------+
1 row in set (0.00 sec)
mysql> LOAD DATA INFILE "/hoge/hoge.csv" INTO TABLE test;
Query OK, 5 rows affected, 15 warnings (0.00 sec)
Records: 5 Deleted: 0 Skipped: 0 Warnings: 15
mysql> show warnings;
+---------+------+-----------------------------------------------+
| Level | Code | Message |
+---------+------+-----------------------------------------------+
| Warning | 1265 | Data truncated for column 'mycolumn1' at row 1|
| Warning | 1265 | Data truncated for column 'mycolumn2' at row 1|
| Warning | 1265 | Data truncated for column 'mycolumn3' at row 1|
| Warning | 1265 | Data truncated for column 'mycolumn1' at row 2|
| Warning | 1265 | Data truncated for column 'mycolumn2' at row 2|
| Warning | 1265 | Data truncated for column 'mycolumn3' at row 2|
| Warning | 1265 | Data truncated for column 'mycolumn1' at row 3|
| Warning | 1265 | Data truncated for column 'mycolumn2' at row 3|
| Warning | 1265 | Data truncated for column 'mycolumn3' at row 3|
| Warning | 1265 | Data truncated for column 'mycolumn1' at row 4|
| Warning | 1265 | Data truncated for column 'mycolumn2' at row 4|
| Warning | 1265 | Data truncated for column 'mycolumn3' at row 4|
| Warning | 1265 | Data truncated for column 'mycolumn1' at row 5|
| Warning | 1265 | Data truncated for column 'mycolumn2' at row 5|
| Warning | 1265 | Data truncated for column 'mycolumn3' at row 5|
+---------+------+-----------------------------------------------+
15 rows in set (0.01 sec)
こんな状態です。ちなみに、mycolumn1,2,3のカラムは、
日本語を格納する為のカラムで、varchar(255), text型です。
他のカラムには英数字データが入るのですが、そちらは成功しています。
上記Warning文を見た限りでは、MySQLによりデータが加工されている
ようですが。。。。
この問題を解決する為に、他に設定するべきことや、
必要なコマンドがありますでしょうか?
またコマンドラインからの、mysqlimportも同様に失敗しました。
日本語テキストのインポートによるテーブルデータ格納は
MySQLの仕様的に可能かと思われますが、上記問題がおきてしまいました。
お気付きありましたら、ご指摘いただけたら助かります。
A 回答 (2件)
- 最新から表示
- 回答順に表示
No.2
- 回答日時:
truncated =「切りつめた」なので、文字数オーバーなのでは?
eucでは、全角一文字につき2バイトだから、全て全角で入力されているとして
(255byte )/2 ≒ 127文字までかな?
そして、最後の128文字目は、半分にされてしまうので、文字としてきちんと表示できなくなります。
http://dev.mysql.com/doc/refman/4.1/ja/storage-r …
全部text型にしてみたら?
max 2^16 ≒ 6万バイトまで可能
hrm_mmm様
ご回答、誠にありがとうございました。
ですよね、、、しかし、日本語で7文字のデータが、
text型なのに、なぜかトランケートされてしまうのです。。。
Warning (Code 1265): Data truncated for column 'hoge' at row 1
むー、なぞですね。
多分自分のやり方に、どこかDoubtがある気がしますが。
ただInsert into ~でTerminalからコピペすると、問題なく格納されるのです。。。
改めて調査してみます。
参考になりました、ありがとうございました。
No.1
- 回答日時:
各行の日本語データを「”」で囲こみ、「ENCLOSED BY '"'」オプションを加えたLOAD DATA INFILEコマンド発行を試してみてください。
私も毎日、日本語データを含むLOAD DATA INFILEコマンドを使用していますが、まったく問題が起きません。
mooboogie様
ご回答、誠にありがとうございました。
ENCLOSED BYをつけてやってみました。
しかし。。。
全ての文字列格納箇所を、text型にし、
mysql> LOAD DATA INFILE "/var/www/data/hoge.csv" INTO TABLE hoge_table FIELDS TERMINATED BY '\t' ENCLOSED BY '"';
してみたのですが、やはり、EUCJPの日本語のカラムだけ、失敗して
しまいます。。。尚日本語は”で括りました。
テキストファイルは次の内容です。
haitta<tab>"あいう"<tab>"かきく"<tab>"さしす"<tab>1
クエリ結果:
Query OK, 1 row affected, 3 warnings (0.01 sec)
Records: 1 Deleted: 0 Skipped: 0 Warnings: 3
※hoge1, hoge2, hoge3は、各々text型。
Warning (Code 1265): Data truncated for column 'hoge1' at row 1
Warning (Code 1265): Data truncated for column 'hoge2' at row 1
Warning (Code 1265): Data truncated for column 'hoge3' at row 1
mysql> select * from hoge_table;
+-----------+-------+----------+--------+------+
| id | hoge1 | hoge2 | hoge3 | no |
+-----------+-------+----------+--------+------+
| haitta | | | | 1 |
+-----------+-------+----------+--------+------+
1 row in set (0.00 sec)
改めて調査してみます。
いずれにせよ、参考になるご回答ありがとうございました。
御礼申し上げます。
(多分自分のやり方に、自分で気付いていない何か問題があるはずなのですが。。ちなみにMySQLはapt-get installでインストールしており、
変えたところは、/etc/my.cnfを配置して、default-charsetいじったぐらいだったかと思うのですが。。。)
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
MySQLカラム名は日本語と英数字...
-
接続ができません
-
like句を使って日本語を検索す...
-
postgreSQLのデータ型
-
DB内の日本語データがPHPで取得...
-
経過時間(hhmmdd)をDATE型には...
-
ポート3306へつながらず、MySQL...
-
ハングル文字が入らない。
-
SQLのVARCHARとVARCHAR2の違い
-
ODP.NETのバージョン確認
-
Float型の時の計算結果がおかしい
-
シングルクォーテーションとダ...
-
MAMPでMySQLのパスが通らない
-
INT型は金額の型に使用するべき...
-
VBAで変数内に保持された二次配...
-
phpで複数のDBを使用した場合の...
-
my.iniで設定するパスワードの...
-
MySQL Version4 のダウンロード先
-
プライマリーキーの昇順でソー...
-
[SQLserver]長文に適したデータ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
MySQLカラム名は日本語と英数字...
-
文字コードMS932(Windows-31J...
-
MySQLの日本語LIKE検索について
-
SQL Server のキャラクターセッ...
-
存在しているファイルがロード...
-
SQLで日本語データを入力したい...
-
my.iniとSET NAMES
-
MYSQL 4.0.x から 5.X系への移行
-
PHP経由でMYSQLに全角文字を格...
-
MySQLでのデータの検索
-
MSSQL2005からMySQL5.1への移行
-
MySQL 日本語表示 日本語入力...
-
MySQL 文字化けについて
-
日本語TSVファイルのLOAD DATA ...
-
接続ができません
-
ODP.NETのバージョン確認
-
副問合せにLIKE文を使う方法は...
-
SQLのVARCHARとVARCHAR2の違い
-
like句を使って日本語を検索す...
-
プライマリーキーの昇順でソー...
おすすめ情報