タイトルの通りです.
現在カンマで区切られた6個の項目が並んでいる,120万行ほどあるデータの処理をしています.
そのうち1つのデータの数値をソートして別ファイルにする作業をしたいのですが,
具体的には,全文を読みながらデータ値域が0~80の数値項目をif文で5刻みに(0-5,5-10,...)検索し,該当する行番号を抽出し,別ファイルに抽出した行番号の行内容だけを出力します.
その際に,1行に含まれる該当データは普通に読み込めるのですが,項目の中の1つにIDがあり,通し番号になっているのですが,IDが1から999までは読めるのですが,1000から1,000のように区切りが入っており,そこで分断されてしまいます.
Excelで区切り位置でデータを修正してから再度プログラムにかけられればいいのですが,120万行ありExcelは100万行ちょっとしか処理できないため,質問しております.
画像にデータの冒頭部分を載せております.ソートしたいのはgrid_codeと書いてある値です.
画像中ではID,FIDと書いてある2項目が数値によってはカンマが入っています.
それから,' " 'が含まれる数値は読み込めますか?
ID,FIDの文字数が固定ならカンマ込みで読み込んであとからその文字数分で結合すれば問題ないのですが,
1,000の次に1,000,000もあるのでお手上げ状態です(笑
No.2ベストアンサー
- 回答日時:
とりあえず FID_keisha を整数として求められれば、後は自力で何とかなるんだろ?
それほど難しい問題ではない。
自由書式で読めば、CSVデータの読み取りはできる。引用符でくくられている部分は文字列として読み込める。このとき、読み取ったデータから引用符は落ちる。次にコンマを抜き去るのだが、これは配列に対するPACK関数でフィルタリングすればよい。だが、そのためにはまず文字列を1文字ごとの文字配列に変換するする必要がある。これはTRANSFER関数で出来る。なおフィルタリングした後、文字配列を文字列に戻しておく。最後に文字列を整数に変換するのだが、これは内部ファイルを使うのが定石。文字列を入力ファイルのようにみなして、整数変数に書式付で読み込む。
参考プログラムを書いておく。
program goo
implicit none
integer, parameter :: nmax = 10**1
integer :: i, m, io, id(nmax), point_id(nmax), fid_keisha(nmax)
real(kind = 8) :: grid_code(nmax)
character(len = 1) :: fkind(nmax)
character(len = 20) :: cid_1976(nmax), cid_keisha(nmax), buf
character :: tmp(20)
!
read(10, *)
do i = 1, nmax
read(10, *, iostat = io) id(i), cid_1976(i), fkind(i), cid_keisha(i), point_id(i), grid_code(i)
if (io == -1) exit
end do
m = i - 1
do i = 1, m
tmp = transfer(cid_keisha(i), ' ', size = 20) ! string to character array
buf = transfer(pack(tmp, tmp /= ','), buf) ! filter out comma then cha-array to string
read(buf, '(i20)') fid_keisha(i) ! read from internal file (string)
end do
print *, fid_keisha(:m)
end program goo
出力例
sh-4.3$ main
1211043 1211036 1211037
データファイル fort.10
FIDm,FID_1976,�y�n���p��,FID_keisha,POINTID,GRID_CODE
0,"835,007",F,"1,211,043",0,0.182313430000000
1,"835,004",F,"1,211,036",0,5.945347790000000
2,"835,005",E,"1,211,037",0,5.004501340000000
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・【大喜利】【投稿~11/12】 急に朝起こしてきた母親に言われた一言とは?
- ・好きな和訳タイトルを教えてください
- ・うちのカレーにはこれが入ってる!って食材ありますか?
- ・好きな「お肉」は?
- ・あなたは何にトキメキますか?
- ・おすすめのモーニング・朝食メニューを教えて!
- ・「覚え間違い」を教えてください!
- ・とっておきの手土産を教えて
- ・「平成」を感じるもの
- ・秘密基地、どこに作った?
- ・【お題】NEW演歌
- ・カンパ〜イ!←最初の1杯目、なに頼む?
- ・一回も披露したことのない豆知識
- ・これ何て呼びますか
- ・チョコミントアイス
- ・初めて自分の家と他人の家が違う、と意識した時
- ・「これはヤバかったな」という遅刻エピソード
- ・これ何て呼びますか Part2
- ・許せない心理テスト
- ・この人頭いいなと思ったエピソード
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・あなたの習慣について教えてください!!
- ・ハマっている「お菓子」を教えて!
- ・高校三年生の合唱祭で何を歌いましたか?
- ・【大喜利】【投稿~11/1】 存在しそうで存在しないモノマネ芸人の名前を教えてください
- ・好きなおでんの具材ドラフト会議しましょう
- ・餃子を食べるとき、何をつけますか?
- ・あなたの「必」の書き順を教えてください
- ・ギリギリ行けるお一人様のライン
- ・10代と話して驚いたこと
- ・家の中でのこだわりスペースはどこですか?
- ・つい集めてしまうものはなんですか?
- ・自分のセンスや笑いの好みに影響を受けた作品を教えて
- ・【お題】引っかけ問題(締め切り10月27日(日)23時)
- ・大人になっても苦手な食べ物、ありますか?
- ・14歳の自分に衝撃の事実を告げてください
- ・架空の映画のネタバレレビュー
- ・「お昼の放送」の思い出
- ・昨日見た夢を教えて下さい
- ・ちょっと先の未来クイズ第4問
- ・【大喜利】【投稿~10/21(月)】買ったばかりの自転車を分解してひと言
- ・メモのコツを教えてください!
- ・CDの保有枚数を教えてください
- ・ホテルを選ぶとき、これだけは譲れない条件TOP3は?
- ・家・車以外で、人生で一番奮発した買い物
- ・人生最悪の忘れ物
- ・【コナン30周年】嘘でしょ!?と思った○○周年を教えて【ハルヒ20周年】
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
教えて下さい
-
配列でデータが入っている要素...
-
メモ帳(テキストデータ)をExc...
-
ACCESSからEXCELに出力する際、...
-
【エクセル】測定時間がバラバ...
-
EXCELVBAでSQLserverからデータ...
-
プログラミング python pandas ...
-
カンマからスラッシュに
-
シリアル通信でのデータ受信
-
ACCESS VBA インデックスが有効...
-
ハミング窓関数とFFT(高速フー...
-
ページ数を求めたい
-
シーケンサにパソコンからアク...
-
ExcelデータをVB.netで検索する...
-
C# ソケット通信でデータ受信時...
-
0が含まれる幾何平均が「#NUM!」
-
VBA 空白セルを削除ではない方...
-
VBA 円グラフ 特定条件に一致し...
-
特定のデータの抽出方法を教え...
-
ユーザーフォームのテキストボ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
教えて下さい
-
【エクセル】測定時間がバラバ...
-
配列でデータが入っている要素...
-
メモ帳(テキストデータ)をExc...
-
VBA 空白セルを削除ではない方...
-
カンマからスラッシュに
-
VBA 円グラフ 特定条件に一致し...
-
EXCELVBAでSQLserverからデータ...
-
特定のデータの抽出方法を教え...
-
CString型の文字列連結について
-
[C言語] コメント文字列を無視...
-
エクセルで2つの時系列のデー...
-
多量のSUMIF式を軽くしたい
-
この行は既に別のテーブルに属...
-
ACCESSからEXCELに出力する際、...
-
Accessで該当データにフラグを...
-
ユーザーフォームのテキストボ...
-
モジュラス103の算出方法について
-
S9タイプからXタイプにデータ...
-
ブレーカー落ちで壊れたりしな...
おすすめ情報