プロが教える店舗&オフィスのセキュリティ対策術

悩み1:
Power Queryに読み込んだ外部CSVが104万件を超えているのでExcelのシートに読み込めません。
そのままCSVとして書き出す方法は無いでしょうか?
B列とC列を結合したものを新規D列として格納して、D列の空白行を除外して減らした結果が104万行を超えているのです。

悩み2:
「悩み1」で書きだしたCSVの中にあるD列をLower(ASC(D列))で半角小文字に統一してから重複チェックを行う必要があります。(アルファベット大文字小文字や全角カタカナを含んでいるため)
しかし重複削除するのではなく、重複してないものを除き、重複データはそのまま残したいです。
今重い通方法はPowerQueryにCSVを読み込んだ後、
 列の保持→重複の保持 をすればよいと思ってます。
すると50万件以下に減るのが分かっているのでシートに読み込んで、それぞれの重複数を集計できます。

一番の悩みは、PowerQuery上で英数カタカナを半角化等出来ない事にあります。
それをクリアする方法があれば悩み1でのCSV保存は不要になるかと思います。
お知恵をお貸しください。

A 回答 (1件)

> PowerQuery上で英数カタカナを半角化等出来ない事にあります。


やり方は色々ですがとりあえずカスタム関数を作ってやれば変換で
きます。

Power Query で 全角数字 から 半角数字 に変換するには
https://qiita.com/PowerBIxyz/items/e128e874fe479 …
「英数字や記号も含めて関数に」を参考に。

> それぞれの重複数を集計できます。
それってグループ化で個数集計すればいいだけでは?
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!