アプリでもっと教えて！goo

いちばん失敗した人決定戦

Perl 正規表現に関して

解決済

質問者：meltykiss#2
質問日時：2009/06/30 03:35
回答数：4件

現在Perlにて正規表現を用い，アクセス者のログが納めてあるlog.datからデータを検索し集計するといったアルゴリズムです．
ところが正規表現を用いたのは良いものの，アルファベット以外をパターンとして使用したとき，データを呼び出すどころか表示されない状況に陥ってしまいました．

elsif($referer =~ /abcd/i) {
$word2 = "abcd";
}

上記のコードは，パターンがアルファベットで構成されているため，正常にシステムが動作します．

elsif($referer =~ /あいうえ/i) {
$word2 = "あいうえ";
}

しかし，上記のコードはパターンが平仮名で構成されているため，冒頭で記している問題が発生してしまいます．

そこで
(1)パターンにアルファベット以外のものは使えるのか．
(2)パターンにアルファベット以外のものを使いたいときはどうすればいいのか．
についてお教えください．

また正規表現のほかに，文字列を検索し，頻度をカウントすることに長けているコードがございましたらお教え願います．

以上の内容で不明な点等ございましたら随時対応致します．
宜しくお願いします．

この質問への回答は締め切られました。

質問の本文を隠す

回答 (4件)

ベストアンサー優先
最新から表示
回答順に表示

No.1ベストアンサー

回答者： steel_gray
回答日時：2009/06/30 09:07

正規表現で日本語を扱う場合、Perlでは特別な処理をしてくれないので文字（の組み合わせ）によってはなんらかのメタ文字として認識される場合があるのでそのままでは使えません。

・正規表現によるマッチングを避ける。
http://digit.que.ne.jp/work/wiki.cgi?Perl%E3%83% …

・メタ文字を無効にする。（正規表現の先頭に\Qを入れる - \Eが含まれるケースを除外しておかないと危ない）
http://www.rfs.jp/sb/perl/02/09.html#%E3%83%86%E …

※頻度によるカウントってのがよくわからないのですが。

この回答への補足

回答ありがとうございます．
ご提示なされたURLを参考にしてみます．

>※頻度によるカウントってのがよくわからないのですが。
文字列を指定し，与えられたハッシュにどれだけ存在するかを割り出し，それをカウントして値にするといったものを考えております．

補足日時：2009/06/30 14:24

- 0
- 件

No.4

回答者： Suzi
回答日時：2009/06/30 14:53

$str = '　あいうえabcoaお ▲3+';

if( $str =~ /お/ ){
print "マッチ";
}else{
print "マッチしない";
}

としたらマッチしたので、アルファベット以外のでもマッチすると思いますが。

- 0
- 件

この回答へのお礼

回答ありがとうございます．
文字コードをいじったらマッチするようになりました．

お礼日時：2009/06/30 17:15

No.3

回答者： Tacosan
回答日時：2009/06/30 12:06

文字コードにさえ気をつければアルファベットだろうとひらがなだろうと漢字だろうとヒエログリフだろうとマッチできる. そして, あなたが文字コードに気をつけているかどうかはこの文面からは分からない.

「頻度をカウントする」のは, 普通はハッシュでしょうね.

この回答への補足

回答ありがとうございます．
質問文足らずですみません．文字コードはEUCとなっております．

補足日時：2009/06/30 14:28

- 0
- 件

No.2

回答者： Suzi
回答日時：2009/06/30 09:50

まずは、euc-jp に変えてみてはどうでしょうか。

この回答への補足

回答ありがとうございます．
文字コードはEUC，またlog.datに蓄積されているデータもEUCとなっております．

補足日時：2009/06/30 14:22

- 0
- 件

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう！

質問する（無料）

似たような質問が見つかりました

Access（アクセス） AccessVBAで任意の複数リンクテーブルをAccessVBAを動かす際に削除したいと考えておりま 1 2022/11/17 15:45
政治私の発明した「二階建て漢字」は使えるでしょうか？ 3 2023/02/08 16:40
オープンソース csvデータのダブルクォーテーションで囲まれた文字内にあるカンマを削除したい 3 2022/09/02 15:17
Access（アクセス） capeofdragonと申します。 Access2016を使っております。あるフォームがあり、テ 2 2022/09/09 13:18
Access（アクセス） AccessVBAで降順にするテーブル作成クエリを使用して作成したテーブルを削除し同一のテーブル作成 1 2023/01/06 11:17
ドライブ・ストレージ SSDを追加したら昔のHDDがおかしくなった 4 2023/03/23 13:25
Excel（エクセル） VBA : スクレイピングできない 4 2023/05/12 22:26
その他（プログラミング・Web制作） google formsを使ったタスク依頼フォーム作成におけるご相談 1 2023/06/22 15:55
Visual Basic（VBA）ファイル全てを .xlsm に変更したところ、プログラムが途中で落ちてしまっています 17 2022/12/07 12:03
CPU・メモリ・マザーボードメモリの増設について 6 2022/12/28 06:41

関連するカテゴリからQ&Aを探す

ページトップ

おすすめ情報

質問する（無料）

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

おすすめ情報