チャットのログにある特定の文字にリンクを貼りたいと思っています。
たとえば『マイクロソフト』『アップルコンピュータ』『IBM』というキーワードを前もってデータファイルにURLと共に登録しておいて、ログにそれらのキーワードが出てきたらそれらのサイトへのリンクタグをつけます。
で、以下のようなプログラムで置換を行うと決まって『ー』という文字の含まれるキーワード(たとえばアップルコンピュータ)を置換するときにエラーになります。
\のエスケープ文字をつければいいと言うものでもなく、正規表現の問題というだけでどうすればいいのか全く分かりません。また、他の文字でも起こり得ることなのかも分かっていません。アドバイスよろしくお願いします。
Apacheのエラーログ
[Tue Oct 23 16:16:54 2001] [error] [client 127.0.0.1] Unmatched [ before HERE mark in regex m/アップルコンピュー << HERE タ/ at d:\PROGRA~1\APACHE~1\APACHE\CGI-BIN\CHAT\CHATPOST.CGI line 216.
***置換部分の一行***
$CHAT{Message} =~ s/$FILE{Keyword}/$FILE{Keyword}\<a href="http:\/\/$FILE{Link}" target="_blank"><font size=1>*<\/font><\/a>/g;
No.2ベストアンサー
- 回答日時:
sjis -> euc -> sjis としているわけですね。
確かに大丈夫だとは思います。
wind 系で apache を使用していらっしゃるようですが、エディタで編集するのが便利ということであれば、「秀丸」などのエディタであれば、sjis, euc などを扱えるので特に困ることもないかと。
「便利」というだけで、sjis -> euc -> sjis とすることもないかな?というのが私の考えですが、いかがでしょう。
もし、sjis ということであれば、JPerl を使用したほうがよいのではないでしょうか。
5.005_03 ベースでよいのであれば、バイナリも存在しますし。
私は Unix 系ですが、JPerl を使用して不具合無くサイトを構築した経験もありますし。ただ、jcode.pl の挙動が怪しいという話は聞いたことがあります。
# 最近 perl はご無沙汰なのですが、5.6 からマルチバイト対応になったと
# 聞いています。
# ただ、どの程度対応なのかは確認していませんが。。。
いろいろありがとうございました。
http://homepage1.nifty.com/nomenclator/perl/shif …
を見たところShift_JISは多くの問題を抱えていることが分かりました。
私の知っていた問題点はその一部に過ぎなかったようです。
ほかのスクリプトのデータがかなり膨大なので、
いまさらデータをEUCへ変換することができません。
(サイトはレンタルサーバーを利用していてそこはActivePerlを使って
いるのでJPerlに変更できません。不具合はローカルで実験した時に発生したものです。)
その場しのぎの策でなんとかしたいと思います。
本当にありがとうございました。
No.1
- 回答日時:
ひょっとして、データを Sjift_JIS で記述していませんか?
ならば、「ー」だけでなく「表」などもアウトだと思うのですが。(いわゆる、二バイト目があたるという問題です。)
JPerl など、日本語対応の perl 以外なら、EUC で保存するほうがよいかもしれません。
文字化けが心配なら、
Content-type: text/html; charset=EUC-JP
とすれば、「まず」文字化けはしないと思います。
この回答への補足
ありがとうございます。
たしかにShift_JISでデータに記入しています。
たしかに下のような対策を講じるとエラーは起きなくなりました。
Shift_JISだとエディタで編集するのに便利だったので、
他のスクリプトの全てのデータがShift_JISで保存しています。
Shift_JISだとパターンマッチは不可能ということなのでしょうか?
今のところ下の対策で凌いでいますが、
もし対策があれば教えてください。よろしくお願いいたします。
&jcode::sjis2euc(\$FILE{Keyword});
&jcode::sjis2euc(\$CHAT{Message});
$CHAT{Message} =~ s/$FILE{Keyword}/$FILE{Keyword}<a href="http:\/\/$FILE{Link}">*<\/a>/g;
&jcode::euc2sjis(\$CHAT{Message});
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
- ・ゆるやかでぃべーと タイムマシンを破壊すべきか。
- ・歩いた自慢大会
- ・許せない心理テスト
- ・字面がカッコいい英単語
- ・これ何て呼びますか Part2
- ・人生で一番思い出に残ってる靴
- ・ゆるやかでぃべーと すべての高校生はアルバイトをするべきだ。
- ・初めて自分の家と他人の家が違う、と意識した時
- ・単二電池
- ・チョコミントアイス
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
EXCEL VBA でCTRL+Fのダイア...
-
csvデータ ダブルクォーテ...
-
スペースで区切られた氏名から...
-
word オートシェイプ内も一括変換
-
○文字目に文字挿入
-
VBA 置換文字がみつからない時
-
C#で空白行を削除する方法
-
秀丸マクロで列ごとに一括置換...
-
秀丸 置換について
-
procmailで本文の文字列置換
-
フォントの色を保持したままセ...
-
ExcelVBA バッチファイル編集
-
3回以上の改行を2回にする正...
-
EXCEL警告「置換対象のデータが...
-
Eclipse 改行後のタブ
-
\\(円)記号を置換したい
-
秀丸マクロで、あらかじめ選択...
-
秀丸エディタで<a href=
-
# の置換はどうすればいいです...
-
マクロ超初心者です。
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
VBA 置換文字がみつからない時
-
各項目がダブルクォーテーショ...
-
正規表現で、特定の文字列を含...
-
csvデータ ダブルクォーテ...
-
スペースで区切られた氏名から...
-
正規表現 特定の文字列を含む行...
-
○文字目に文字挿入
-
C#で空白行を削除する方法
-
EXCEL警告「置換対象のデータが...
-
Excel・ユーザーフォームの情報...
-
ハングルを日本語に置換
-
秀丸エディタで、「-」や「ー」...
-
EXCEL VBA でCTRL+Fのダイア...
-
xmlファイル内の文字列置換
-
csvデータのダブルクォーテーシ...
-
C言語でテキストファイルの内容...
-
テキストボックスの文字列を置...
-
Eclipse 改行後のタブ
-
特定の列のみ置換を行いたい
-
パワーポイントの一括置換:複...
おすすめ情報