
初心者です。
2つのファイル(.log)を比較し、条件が満たしているレコード(行)を抽出する方法を教えてください。
例
Aファイル
11.111.111
22.222.222
33.333.333
44.444.444
Bファイル
11.111.111.1111 [01/Jun/2007:00:00:00 +0000] "GET / test.html 200
22.333.444.1111 [01/Jun/2007:00:00:00 +0000] "GET / test.html 200
22.222.222.1111 [01/Jun/2007:00:00:00 +0000] "GET / test.html 200
33.333.355.1111 [01/Jun/2007:00:00:00 +0000] "GET / test.html 200
33.333.555.1111 [01/Jun/2007:00:00:00 +0000] "GET / test.html 200
44.444.444.1111 [01/Jun/2007:00:00:00 +0000] "GET / test.html 200
↓
Cファイル
11.111.111.1111 [01/Jun/2007:00:00:00 +0000] "GET / test.html 200
22.222.222.1111 [01/Jun/2007:00:00:00 +0000] "GET / test.html 200
44.444.444.1111 [01/Jun/2007:00:00:00 +0000] "GET / test.html 200
このように、AファイルとBファイルを比較し、結果をCファイルに抽出したいです。
エクセルでVlookupの関数を使う方法もありますが、Bファイルは容量が重いのでエクセルデータでは全部読み
取ることができません。
よって、UNIXコマンドでなんとか作業をしたいものです。
commを使う作業もありますが、手作業で不要な部分を削除していくのも大変なのでできれば自動化が希望です。
パソコンのOSはWin2000です。
どなたかご知恵をお借りください。
よろしくお願いします。
No.1
- 回答日時:
> UNIXコマンドでなんとか作業をしたいものです。
Windowsに何かその種のコマンドをインストールしてよい
ということであれば、PerlでもRubyでも、awk(gawk)でも
できると思いますが何か条件は他にありますか?
それからBファイルが大きいというのはわかりましたが、
Aファイルはどのくらいでしょうか?
この回答への補足
説明不足ですいません。
当方は初心者でawk(gawk)、sort、grep、wc、comm、catは使ったことがなく知りません。(ちなみにこのパソコンは会社のパソコンで、最初からインストールしていると思います。cygwinからインストールするのは存知じています。)
Aファイルは軽い方です。
よろしくお願いします。
ごめんなさい。文章を誤りました。
(補足の訂正ができないらしいので、回答へコメントを加えます)
誤:当方は初心者でawk(gawk)、sort、grep、wc、comm、catは使ったことがなく知りません。
↓
正:当方は初心者でawk(gawk)、sort、grep、wc、comm、catしか使ったことがなく他は使い方を知りません。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
プログラミングについて
-
画像生成AIのプロンプトの作り...
-
プログラム言語
-
vba クリップボードクリアにつ...
-
Python... 環境設定 初心者です...
-
CSVファイルの複数行削除
-
OS入ってる機器のソフト・アプ...
-
Python 3.12.2 か一番最新のパ...
-
google Colabでmatplotlibの描...
-
Geminiフォーム 画像生成で 人...
-
パイソンのソースコードをChatG...
-
自作scratch アニメの商用利用
-
数学、プログラミング、物理、...
-
pip --versionがエラーになる
-
IT業で開発をされてる方々に質...
-
VBAでパワーシェルを実行したい...
-
Google ColaboでGUI作成
-
REGZAに接続できない(パソコン)
-
pythonの実行に関する質問
-
AIがプログラムする時代のプロ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
vba クリップボードクリアにつ...
-
画像生成AIのプロンプトの作り...
-
Geminiフォーム 画像生成で 人...
-
CSVファイルの複数行削除
-
数学、プログラミング、物理、...
-
pip --versionがエラーになる
-
Python... 環境設定 初心者です...
-
pythonの実行に関する質問
-
Python 3.12.2 か一番最新のパ...
-
OS入ってる機器のソフト・アプ...
-
パイソンのソースコードをChatG...
-
Google ColaboでGUI作成
-
VBAでパワーシェルを実行したい...
-
HTMLソースが表示のページのも...
-
ネットワークフォルダの中身を...
-
Pythonのエラーメッセージをコ...
-
Webサイト内に埋め込んだmp4動...
-
google Colabでmatplotlibの描...
-
初心者powershellのPS1ファイル...
-
Pythonについて。
おすすめ情報