全角文字列から英数字のみ抜き出す方法は？

解決済

質問者：abiru
質問日時：2005/12/28 10:52
回答数：2件

Perl 文字コード sjis

以下のように、全角文字列の中から、全角英数字のみを抜き出したいのですが、良い方法はありますでしょうか。

あア亜ＡＢＣ－１２３
↓
ＡＢＣ－１２３

宜しくお願い致します。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (2件)

ベストアンサー優先
最新から表示
回答順に表示

No.1ベストアンサー

回答者： twinkleluz
回答日時：2005/12/28 11:57

いったんUTF-8に変換して、s///g置換で英文字以外を削除する方法が一番楽だと思います。

日本語処理するときは、いったんUTF-8に変換すると便利な場合が多々あります。

UTF-8の扱いについては、参考URLをどうぞ。

--------------------------------------------------
use Encode;

# 検索対象の文字列をUTF-8に変換
my $str = 'あア亜ＡＢＣ－１２３';
my $utf_str = Encode::decode('shift-jis', $str);

# 置換に使う条件文字列をUTF-8に変換
$trstr = '０-９Ａ-Ｚａ-ｚ－'; # ここは自由に変更してください
my $utf_trstr = Encode::decode('shift-jis', $trstr);

# UTF-8同士ならそのまま置換できる。
# $utf_trstrの中身以外の文字を削除
$utf_str =~ s/[^$utf_trstr]//g;

# 出力するときにshift-jisに戻す
print Encode::encode('shift-jis',$utf_str);

参考URL：http://www.pure.ne.jp/~learner/program/Perl_unic …