メールサーバ(dovecot-1.0.7)にてIMAPでsubject検索すると
一致しているワードが含まれているにもかかわらずヒットしない場合があります。
SUBJECTはISO-2022-JPでエンコードされているようですが
件名が長いと分割されます。
しかし分割されている場合、個別にしか検索してくれないようです。
(なので単語がバラバラになったら検索にヒットしない)
(例)
Subject:
=?iso-2022-jp?B?UmU6IBskQkNtMFUhJzojN24kTjtENmIkLBsoQjIwMTMxMTEx?=
=?iso-2022-jp?B?MDAbJEIxXyRHJDkhIxsoQg==?=
↓
Re: 注意:今月の残金が20131111
00円です。
メールのSUBJECTを分割させない、もしくは分割も検索対象に含める場合はどうすれば
よいでしょうか。
たとえば以下のようなSUBJECTだとすると・・
(1通目) Re: 注意:今月の残金が2013111100円です。
(2通目) 2013111100円が今月の残金です。
検索ワード”2013111100” では(2)しかヒットしなかったり・・。
日本語、英数字、両方で起こります。なので文字化けではなさそう。
No.1ベストアンサー
- 回答日時:
>SUBJECTはISO-2022-JPでエンコードされているようですが
いえ、本来は、BASE64エンコードされているはずです。時々iso-2022jpのものなども見かけますが、MUAで受信するとSubject:が文字化けしているものもあります。
iso2022jpに変換したのち、下記の仕様にしたがって
⇒( http://www.akanko.net/marimo/data/rfc/rfc2045-jp … )
変換されたものであるはずです。
本来は、1so-2022jpなりにエンコードした後で、ascii以外(厳密には違う)の文字をbase64エンコードします。
→ UmU6IOazqOaEj++8muS7iuaciOOBruaui+mHkeOBjDIwMTMxMTExMDDlhobjgafjgZnjgII=
本来は、
→ =?ISO-2022-JP?B?GyRCQ20wVSEnOiM3biROO0Q2YiQsGyhCMjAxMzExMTEw?=
=?ISO-2022-JP?B?MBskQjFfJEckOSEjGyhC?=
出なければならない。2行に分かれていますね。これは、「encoded-word は 75バイト以内でなければならない.」というルールによるものです。
様々なMUA、特にメールフォームなどで送信されてくるメールヘッダには、正式なルールに従っていないものがあります。
★対策:一旦iso2022jpにデコードしてから検索する。
この時に、改行コードは削除されて一行に戻るはずです。
Perlでしたら、
⇒Base64エンコード・デコードする( http://www.din.or.jp/~ohzaki/perl.htm#JP_Base64 )
を参考にしてください。
確かにBASE64でエンコードされていますね。この辺の知識がおぼろげだったので
認識改めました。
使用しているMUAは改行コードが削除される前に検索をしていたようです。
IMAPのsearchを使っているようで、ここに問題がありそうでした。
ありがとうございます。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- PHP phpの imap_search で漢字コード 1 2022/09/06 17:32
- Visual Basic(VBA) VBA 検索と入力 Excel ブック ぶぶぶ シート ししし 列V 検索対象の列です 最終行は、お 6 2023/05/17 01:40
- フランス語 フランス語 de, desの使い方について 5 2022/12/11 15:10
- SEO 検索エンジン反映遅い 1 2022/06/04 07:35
- 英語 English can be very challenging at times 1 2023/05/28 11:15
- その他(IT・Webサービス) ホンダ発電機EC550 オイルフィラーキャップの検索方法 1 2022/05/19 02:31
- Firefox(ファイヤーフォックス) Firefoxでグーグルの検索画面が変です 2 2022/09/20 19:25
- 英語 英語のレポートとして、世界遺産についてまとめることになり、イギリスのウェストミンスター宮殿の歴史と現 2 2022/11/05 22:35
- SEO 関係ないページを検索エンジンが拾ってしまう 1 2022/05/14 11:16
- SEO 意図しないページが検索ヒットする問題 2 2022/05/19 14:35
このQ&Aを見た人はこんなQ&Aも見ています
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
pythonエラー
-
quoted-printableのアルゴリズム
-
IMAP4でsubjectが検索ヒットしない
-
MIMEでエンコードされたMailのS...
-
1つのサイトで文字コードが混在...
-
CSVファイルの中で、「 , 」カ...
-
EXCELからCSVにすると余計なカ...
-
Excel VBAでPDFファイルをMicro...
-
英数字のみ全角から半角に変換
-
GoogleAppsScript文字列置換の...
-
エクセルにMicrosoft Barcode C...
-
全角/半角キーをSendkeys関数で...
-
IEからEdgeへの移行に伴うIMEの...
-
改行を含んだ文字列を正規表現...
-
VBA 文字に半角が含まれて...
-
VBA 置換文字がみつからない時
-
「何とかで始まり、何とかで終...
-
perl でエラー:Wide character...
-
パイソンエラーについて
-
UWSC教えて
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
pythonエラー
-
BASP21によるbase64のデコード...
-
Perl:ファイル名だけ文字化けする
-
「繝・せ繝・」となる文字化け
-
MIMEでエンコードされたMailのS...
-
jcode.pmでconvertできない
-
1つのサイトで文字コードが混在...
-
Encode.pmで文字コードの判別
-
メール(iso-2022-jp-2)のデコ...
-
jisコードで16進数の『3c』か...
-
URLエンコードされたデータを戻...
-
文字コードについて
-
perlの日本語文字コードはどう...
-
CASLIIの数値データ入出力
-
CGIでメールを送る際に文字...
-
CSVファイルの中で、「 , 」カ...
-
英数字のみ全角から半角に変換
-
エクセルで数値を全角文字(カ...
-
EXCELからCSVにすると余計なカ...
-
住宅にカナを入力する際に丁目...
おすすめ情報