
No.5ベストアンサー
- 回答日時:
たぶんあなたの求めているものは「Shift_JIS以外の文字」です。
(より正確に言うならShift_JISでなくMS932・CP932・Windows-31Jなどと呼ばれるもの)PerlやPythonで書くならファイル名を取得してMS932に変換してみてエラーが出るかどうかで判断できます。
簡易的には、dirコマンドでファイル名を出力して半角疑問符に化けていれば確実にMS932外です。ただしこの方法はäやßなど一部の文字を取り逃します。
chcp 65001でコードページをUTF-8に変更してからdirでファイルに出力し、chcp 932で戻してからdirでファイル出力したものをwinmergeなどのソフトで比較するという手段が思いつきます。
この回答へのお礼
お礼日時:2020/01/24 09:28
ありがとうございます!
OSがWindowsですのでCP932のようです。最近はUTF8ばかり無意識に使っており言われて気づきました!ファイル名取得から変換でのエラーで見つけたいと思います。
ただ、Windowsで膨大なファイル数を扱いエラーが出て困っている人もいるでしょうから、ベクターなどのフリーソフトで対応しているものがあればと思いましたが意外と無いものですね。
No.4
- 回答日時:
まずは念の為。
「日本語と英語」という「言語」ではなく「日本語で使われている文字と英語で使われている文字」
PerlにもPythonにも、ファイル名一覧を取得する方法が用意されているので、
ファイル名取得→文字種を調べて、日本語の文字、英語の文字以外が使われていないことを確認
とできなくはありません。
ただ。
「日本語と英語」という認識は多分間違っていています。
こういう場合の主な原因は、「1文字=2バイト(以上)となっている日本語の文字を、全て1文字=1バイトで処理してしまう」ことです。
アプリ中で文字化けが発生しているような状態です。
有名なのでは、Shift_JISの「ダメ文字」があります。
これは、ファイル名だけではなく、フォルダ名も関係することがあります。
特に、「設定ファイルをユーザーフォルダ (C:\Users\ユーザー名)に保存する」という仕様だと、この「ユーザー名」に日本語があることで、設定ファイルに正常にアクセスできない、ということも起り得ます。
無難なのは
・関係するフォルダ、ファイル、ユーザー名は 「ASCIIの範囲の文字(いわゆる半角英数記号)」だけにする
ことです。
No.3
- 回答日時:
そもそも綴りのみから言語を判断するのは無理だと思うんだけど. 有名なところだと, tornado は英語, フランス語, ドイツ語
, イタリア語で全く同じ綴りになるわけだし.No.2
- 回答日時:
なんだろう。
根本的なところを理解していない気がするのは自分だけだろうか。
(´・ω・`) どうせユーザー名に漢字などの2バイト文字を使ってしまってフォルダ名が漢字になっているってだけだと思う。
ならばエクスプローラーで「User」フォルダを覗いてみればいい。
漢字表記があるか目視で判断できる。
ぶっちゃけ有名なトラブルだよ。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
DXFをAutoCADで開くと文字位置...
-
word の文字入力 文字が青色に...
-
AUTO-CADで文字の太さを太くす...
-
Word で項目番号 ○の21 から...
-
【WinSCP】フォルダ名が「能ソ...
-
「~が言うには」の違う言い方
-
Thunderbirdの添付ファイル名に...
-
イラストレーターで文字が半角...
-
なぜ昔の英語は "S" が "F" に?
-
漢字を出したい!
-
1分間に何文字打てるか
-
PDFソフト
-
至急お願いします!! Wordで、...
-
ファイル名で最後に認識される文字
-
8ポイントより小さい文字が打ち...
-
エクセルの「IF」の結果の文...
-
ノーツ送信する際の多言語mine...
-
PDFまたはTIFFファイルに文字を...
-
CASE MARKの表記方法について
-
記号をどうやってだすのかわか...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
word の文字入力 文字が青色に...
-
AUTO-CADで文字の太さを太くす...
-
漢字を出したい!
-
至急お願いします!! Wordで、...
-
DXFをAutoCADで開くと文字位置...
-
“髙”という字の出し方教えてく...
-
Word で項目番号 ○の21 から...
-
Thunderbirdの添付ファイル名に...
-
Shift_JISで表示できて、UTF-8...
-
PDFまたはTIFFファイルに文字を...
-
PDF elementで白文字?というか...
-
エクセルの「IF」の結果の文...
-
ノーツ送信する際の多言語mine...
-
CASE MARKの表記方法について
-
「~が言うには」の違う言い方
-
AutoCAD 複数の文字を1つの文字...
-
『unicode形式の文字を含んでい...
-
アルファベットの「o」にスラ...
-
teraterm の文字色の変更について
-
Word文書に、チェックマーク(...
おすすめ情報