ファイルから読み込んだデータを構造体に格納できますか？

Question

１レコード１9バイトのファイルを読み込む処理を行っています。地区名10バイト県名8バイト改行１バイトこのデータをdouken（構造体）に格納したいのですが＞while (fgets(dou,19,fp) != NULL){ で、エラーになってしまいます。どのようにしたらファイルから読み込んだデータを構造体に格納できますか？ #include #include struct douken { char tiku[10]; char ken[8]; } main(void){ FILE *fp; struct douken dou[100]; int i; fp = fopen("ex3.fil","rb"); if ( fp == 0 ){ printf("can't open "); exit(1); } while (fgets(dou,19,fp) != NULL){ ・・・

shirousa01 · Accepted Answer

>>while (fgets(buffer,20,fp) != NULL){

>と、するということですか？
>その場合、
>ここのサイズは必ず４の倍数になるということですよね？
構造体を直接扱うと、アーキテクスチャやコンパイラ依存してしまいます。
32bit機なら4byteですし、16bit機なら2byte。64bit機なら8byteです。
また、コンパイラの設定によってもどのように確保されるかまったく分からないのです。
一度バッファに蓄えてからmemcpyでコピーする方が安全ですし、可搬性があります。
C言語では\0を文字列の終端文字として使用しているので、10文字格納したいなら11byte確保する必要もあります。
簡単に修正してみました。

#include <stdio.h>
#include <stdlib.h>
#include <memory.h>

typedef struct douken_ {
char tiku[11];
char ken[9];
} douken;

int main(void){
FILE *fp;
douken dou [100];
char buff [18 /* douken */ + 1 /* LF(\n) */ + 1 /* \0 */];
int i;
i = 0;

fp = fopen("ex3.fil","rb");

if ( fp == 0 ){
printf("can't open\n");
exit(1);
}

// douを\0で埋める
memset (dou , '\0' , sizeof dou);

// 一度バッファに格納
while (fgets(buff,sizeof buff,fp) != NULL){
// memcpy関数でコピー
memcpy(&dou[i],buff,10);
memcpy(&dou[i],buff+10,8);

// 構造体配列より大きなファイルを開いたときの配慮
if (i == 99) break;
i++;
}

return 0;
}

R32C · Answer

#7です
--------------------------------------
douP = dou;
while ((fgets((char*)douP++,sizeof(struct douken),fp)) != NULL)
{}
---------------------------
i=0;
while ((fgets((char*)dou[i++],sizeof(struct douken),fp)) != NULL)
{}
---------------------------
でも、同じです。ポインタか配列かの違いだけです。
コンパイラの性能等にもよりますが、上記のポインタを使ったほうが
若干早いか、コードが小さくなる場合が多いです。

nofutureforyou · Answer

構造体を fgets で読もうとしてるのがたぶん変。
(構造体のサイズは、sizeof で分かるんだけど。)
そもそもファイルはテキストでしょうかバイナリでしょうか。テキストなら、構造体の要素 tiku や ken をそれぞれ読んでそれを構造体に入れるといいのでは。

R32C · Answer

[admin@opteron99] ~/gcctext

$ less ex3.fil
１２３４５abcdefgh^M一二三四五ＡＢＣＤ^M1234567890IJKLMNOP

[admin@opteron99] ~/gcctext
$ cat test5.c
#include<stdio.h>
#include <stdlib.h>
#define NofLine 3
#define SizeofLineEnd 1
#if MSVCC
#pragma pack(push,1)
struct douken {
char tiku[10];
char ken[8];
char crlfNULL[SizeofLineEnd+1];
} ;
#pragma pack(pop)
#endif
#if GNUGCC
struct douken {
char tiku[10];
char ken[8];
char crlfNull[SizeofLineEnd+1];
} __attribute__((packed));
#endif

int main(void){

FILE *fp;
int i;
struct douken dou[NofLine];
struct douken *douP;
printf("struct douken SIZE = %d\n",sizeof(struct douken));
printf("dou SIZE = %d\n",sizeof(dou));

fp = fopen("ex3.fil","rb");

if ( fp == 0 ){
printf("can't open\n");
exit(1);
}
douP = dou;
while ((fgets((char*)douP++,sizeof(struct douken),fp)) != NULL)
{}
douP = dou;
for(i=0;i<NofLine;i++)
{
printf("Line%d:=",i+1);
printf("tiku:%10.10s:",douP->tiku);
printf("ken:%8.8s\n",douP->ken);
douP++;
}
printf("end\n");
exit(0);
}

[admin@opteron99] ~/gcctext
$ cc -DGNUGCC -g -Wall test5.c

[admin@opteron99] ~/gcctext
$ ./a.exe
struct douken SIZE = 20
dou SIZE = 60
Line1:=tiku:１２３４５:ken:abcdefgh
Line2:=tiku:一二三四五:ken:ＡＢＣＤ
Line3:=tiku:1234567890:ken:IJKLMNOP
end

[admin@opteron99] ~/gcctext
$
-----------------------------------------------------------------------------
Cygwin ShitJIS 改行文字は、CRのみとしています。
直接構造体にとる方法は、独自プロトコルのデータのやり取り等で
比較的よく使われると思っています。(使っていました。)
CPUやコンパイラの仕様によりアライメントに注意は必要ですが、
きっちりコンパイラに指定すれば、できないなんてことはないでしょう。

指摘事項について、ご確認されていないようですので回答しますと
fgetsは、第２引数sizeよりも１バイト少ないデータをストリーム
から読んで、第１引数のアドレスに書く、ただし、EOFまたは改行で
終わる。最後にNULLを書く。
ということなので、fgetsのwhileで取得するには、
tikuが10バイト、kenの8バイト、改行1文字（貴殿の指定により１文字としました。
Windowsなら2バイトですね)、NULL1バイトの計20バイトの領域が必要になります。
ですので、18を指定していたことと、領域の定義が不足していたことが貴殿のプログラム
の問題のポイントだと思います。また他にもdouを100個の配列にしていますが
まったくケアされていないこともバグのひとつですね。
上記プログラムもその２点とキャストをいれたぐらいです。
それからアライメントの指定を追加しているだけです。

それから、
改行およびNULLは飛ばして構造体に入れたいのであれば、fgetsでは２０バイトのバッファ
に取得し、１８バイトを構造体にコピーするほうが、無駄なメモリを取らないので
いい方法ですね。

その場合は、doukenから、crlfNullのメンバーを削除し、buffを定義(20byte)、
データ取得の部分を以下に置き換えるといいでしょう。
while ((fgets(buff,sizeof(buff),fp)) != NULL)
{
memcpy(douP++,buff,sizeof(struct douken));
}

shirousa01 · Answer

1.どのような利点があるか
構造体を定義すると
struct douken型
という型が定義されますが、好みの問題ですがstructを何度も書くのは面倒な為、構造体の名前を
struct douken_型
として、それをtypedefで
douken型
と再定義しています。
この定義の仕方はよく使われている方法です。

2.douを\0で埋めるんですか？
宣言しただけでは、構造体の中にゴミが詰まっています。
普段は意識しなくても問題ありませんが、ファイルを扱う場合や、構造体の場合、そのデータがバグにつながる可能性があるため、\0で初期化した方がバグが発生しにくいので、\0で初期化しています。

3.確認したところ、いくつか間違いがありました。

char buff [18 /* douken */ + 2 /* CrLf(
) */ + 1 /* \0 */];


memset (dou , '\0' , sizeof dou);
memset (buff, '\0' , sizeof buff);

while (fgets(buff,sizeof buff,fp) != NULL){
memcpy(&dou[i].tiku ,buff,10);
memcpy(&dou[i].ken ,buff+10,8);

if (i == 99) break;
i++;

memset (buff, '\0' , sizeof buff);

}

データは漢字でも問題ありませんが、1文字2バイトになります。
また、encodingの問題がある場合もあります。
私がテストしたところ問題なく動作しました。

Trick--o-- · Answer

> 32bit機というのは、どういうことですか？
現在主流のPCのことです。

>> tiku：4バイト + 4バイト + 2バイト + 2バイト(ゴミ)
> どうして地区１０バイトが
> このようになるのでしょうか？
データを収納する「箱」が4バイトの大きさだから、です。
tikuに"1234567890"というデータが入っているとすると
実際には
[1234][5678][90??]
という4*3=12バイトの領域を使うことになります。
??の部分が「ゴミ」です。

shirousa01 · Answer

構造体ポインタをキャラクタポインタに型キャストすれば可能かとおもいますが、構造体を直接ファイルから扱うのはバグにつながりますよ？

まず、おそらく上記の構造体のサイズは18バイトにならない可能性が高いです。
32bit機の場合、4バイト単位で数値を扱う為
tiku：4バイト + 4バイト + 2バイト + 2バイト(ゴミ)
ken：4バイト + 4バイト
の20バイトになっていると思います。

R32C · Answer

fgetsの仕様をよく確認ください。18+(改行文字数)1+(\0の終端データ)1要求する必要があると思います。

デバッガにたよるのもあまりよくありませんが、デバッグされてはいかがでしょうか？
以下、そのままgdbを動作させた場合のログの一部です。

(gdb) run

Breakpoint 1, main () at test4.c:24
(gdb) p dou
$1 = {{tiku = "1234567890", ken = "abcdefgh"}, {tiku = "\000G, ken = "<\000\000\000\004\000\000"}, {tiku = "\004\000\000\000P, ken = "\021\000}, {tiku = ", {tiku = "\000\000, ken = "Uy
(gdb) next
(gdb) next

Breakpoint 1, main () at test4.c:24
(gdb) p dou
$2 = {{tiku = "
\00034567890", ken = "abcdefgh"}, {tiku = "\000G, ken = "<\000\000\000\004\000\000"}, {tiku = "\004\000\000\000P, ken = "\000\000
(gdb) 

ex3.filは
234567890abcdefgh
1234567890ABCDEFGH
1234567890IJKLMNOP
にしています。

環境は、linux で、gcc4.1.1です。

Tacosan · Answer

fgets の使い方を見れば「どうしてエラーになるのか」はほとんど明らかだと思うんだけど,
１．fgets は第1引数に char * を要求するけど struct douken * は char * に変換できない
というのが原因だよね. ただ, これは「コンパイラが文句を言ってくれる＊たちのよい＊エラー」であって, 実際には
２．struct douken は 18バイトかもしれないけど fgets で 19バイト読み込んでいる
という「コンパイラがきっと文句を言わない＊質の悪い＊エラー」もまぎれこんでいるので注意.

ファイルから読み込んだデータを構造体に格納できますか？

>>while (fgets(buffer,20,fp) != NULL){

この回答への補足

#7です

構造体を fgets で読もうとしてるのがたぶん変。

この回答への補足

[admin@opteron99] ~/gcctext

この回答への補足

1.どのような利点があるか

この回答への補足

> 32bit機というのは、どういうことですか？

この回答への補足

構造体ポインタをキャラクタポインタに型キャストすれば可能かとおもいますが、構造体を直接ファイルから扱うのはバグにつながりますよ？

この回答への補足

fgetsの仕様をよく確認ください。

fgets の使い方を見れば「どうしてエラーになるのか」はほとんど明らかだと思うんだけど,

この回答への補足

似たような質問が見つかりました

このQ&Aを見た人はこんなQ&Aも見ています

関連するカテゴリからQ&Aを探す

このQ&Aを見た人がよく見るQ&A

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング