アプリ版:「スタンプのみでお礼する」機能のリリースについて

今、迷惑メールフィルタリングを作成しているのですがメールの本文だけを取り出す方法がわかりません。

本文の前には
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-2022-JP
Content-Transfer-Encoding: 7bit
X-UIDL: B1("!E-U"!Lj<"!Se_"!
などが書かれているのですが、これらに規則性がなく文字列処理で取り出すのに苦戦しているところです。
添付ファイルのないメールだと大体X-UIDLで終わっているのですが、
添付ファイルが付いているとメーラーごとに違うのか
--Multipart=とあったり--Apple-Mail-5-234401926と書いてあったりします。

メーラーを作成している人ならきっと詳しいと思うのですが、誰か教えていただけませんでしょうか。

A 回答 (1件)

ヘッダと本文の境目は空行です。



なお、RFC2822的には、添付ファイルも「本文」の一部にすぎません。
人間にとっての本文(添付ファイル以外の文章)は、本文の
MIMEマルチパート構造を解釈して分解するひつようがあるのでは
ないでしょうか。
    • good
    • 0
この回答へのお礼

MIMEについての説明をよんでみました。
本文(添付ファイル含む)は確かに改行がありました。

添付ファイルが含まれているときに(人間にとっての)本文の前に付いてくる--Apple-Mail-5-23440192や--Multipartも後に必ず「Content-Type:」が出現するので、その後の改行を読み取った後を(人間にとっての)本文だとすれば解決できそうです。

(人間にとっての)本文の終わりと添付ファイルに関する情報が書かれている部分との境目は必ずしも空行があるとは限らないようですが、本文の前後に--Apple-Mail-5-23440192などまったく同一のものが出現するようなので、この特徴を使って本文だけを取り出そうと思います。

すばやい解答ありがとうございました。

お礼日時:2006/10/18 15:44

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!