perl初心者です。
rssを取得して簡易ブログパーツをつくりたいのですが文字コードでうまいこといかず悪戦しています。
以下がコードです。(きたなくてすいません…)
#!/usr/bin/perl
use LWP::Simple;
use XML::RSS;
use utf8;
use open ":utf8";
$logfile="./syoukai.log";
open(DAT, "$logfile");
@log=<DAT>;
close(DAT);
my $rss = new XML::RSS;
@list = ();
foreach(@log){
($nom,$name,$prof,$xml,$btitle,$ktitle,$klink)=split(/<>/);
eval { $rss->parse( LWP::Simple::get($xml) ); };
if($@) {
next;
}
$btitle = $rss->{'channel'}->{'title'};
$prof = $rss->{'channel'}->{'link'};
$item = $rss->{'items'};
$line = @{$item}[0];
$ktitle = $line->{'title'};
$klink = $line->{'link'};
$date = $line->{'pubDate'};
push(@list, "$date<>$name<>$prof<>$xml<>$btitle<>$ktitle<>$klink<>\n");
}
open(IN,">$logfile");
print IN @list;
close(IN);
exit;
syoukai.logを呼び出して
そこに書かれたxmlを順番に読み込んで
ファイルを更新したいのですが
これだと何もいじっていない$nameは大丈夫なんですが
$btitleや$ktitleが文字化けしてファイルに書かれてしまいます…。
use utf8;ではなく
use encoding 'UTF-8', STDOUT => 'cp932';としたら
今度は$nameだけ文字化けしてしまいます。
別々の文字コードを一緒にしてしまってるからだと思うのですが
どれがどの文字コードなのかがわからないでいます。
文字コードを統一する方法などがあれば教えてくださいm(__)m
説明&記述ヘタですいません…。
宜しくお願いします。
A 回答 (1件)
- 最新から表示
- 回答順に表示
No.1
- 回答日時:
一旦、フラグ付き utf8 にして、ファイルなどに出力するときエンコードを変換します。
表示がくずれるので、空白2文字を全角空白1文字にしていることに注意
#!/usr/bin/perl
use strict;
use warnings;
use autodie;
use HTTP::Request;
use LWP;
use XML::RSS;
use constant OUTPUT_FILE => 'foo.log';
my @url_list = qw(
http://weather.livedoor.com/forecast/rss/earthqu …
http://weather.livedoor.com/forecast/rss/tsunami …
my $rss = XML::RSS->new( encoding => 'UTF-8' );
my $ua = LWP::UserAgent->new;
$ua->agent('Mozilla');
$ua->timeout(10);
open my $fh, '>', OUTPUT_FILE;
binmode $fh, ":encoding(CP932)";
for my $url (@url_list) {
my $req = HTTP::Request->new( GET => $url );
my $res = $ua->request($req);
if ( $res->is_success ) {
$rss->parse( $res->content ) or die "$url";
my $title = convert_flagged_utf8( $rss->{'channel'}->{'title'} );
my $link = convert_flagged_utf8( $rss->{'channel'}->{'link'} );
my $item0 = $rss->{'items'}->[0];
my $item_title = convert_flagged_utf8( $item0->{'title'} );
my $item_link = convert_flagged_utf8( $item0->{'link'} );
my $date = convert_flagged_utf8( $item0->{'pubDate'} );
print {$fh}
"$date<>hoge<>$link<>$url<>$title<>$item_title<>$item_link<>\n";
}
else {
print $res->error_as_HTML, "\n";
}
}
close $fh;
sub convert_flagged_utf8 {
my $str = shift;
my $flagged_utf8
= Encode::is_utf8($str) ? $str : Encode::decode_utf8($str);
return $flagged_utf8;
}
ありがとうございます。
すこしづつ理解してきました。
なんとか思うようにいきそうです!
大変助かりましたm(__)m
教えていただいたスクリプトを参考にもう少し勉強していこうと思います。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・【大喜利】【投稿~11/12】 急に朝起こしてきた母親に言われた一言とは?
- ・好きな和訳タイトルを教えてください
- ・うちのカレーにはこれが入ってる!って食材ありますか?
- ・好きな「お肉」は?
- ・あなたは何にトキメキますか?
- ・おすすめのモーニング・朝食メニューを教えて!
- ・「覚え間違い」を教えてください!
- ・とっておきの手土産を教えて
- ・「平成」を感じるもの
- ・秘密基地、どこに作った?
- ・【お題】NEW演歌
- ・カンパ〜イ!←最初の1杯目、なに頼む?
- ・一回も披露したことのない豆知識
- ・これ何て呼びますか
- ・チョコミントアイス
- ・初めて自分の家と他人の家が違う、と意識した時
- ・「これはヤバかったな」という遅刻エピソード
- ・これ何て呼びますか Part2
- ・許せない心理テスト
- ・この人頭いいなと思ったエピソード
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・あなたの習慣について教えてください!!
- ・ハマっている「お菓子」を教えて!
- ・高校三年生の合唱祭で何を歌いましたか?
- ・【大喜利】【投稿~11/1】 存在しそうで存在しないモノマネ芸人の名前を教えてください
- ・好きなおでんの具材ドラフト会議しましょう
- ・餃子を食べるとき、何をつけますか?
- ・あなたの「必」の書き順を教えてください
- ・ギリギリ行けるお一人様のライン
- ・10代と話して驚いたこと
- ・家の中でのこだわりスペースはどこですか?
- ・つい集めてしまうものはなんですか?
- ・自分のセンスや笑いの好みに影響を受けた作品を教えて
- ・【お題】引っかけ問題(締め切り10月27日(日)23時)
- ・大人になっても苦手な食べ物、ありますか?
- ・14歳の自分に衝撃の事実を告げてください
- ・架空の映画のネタバレレビュー
- ・「お昼の放送」の思い出
- ・昨日見た夢を教えて下さい
- ・ちょっと先の未来クイズ第4問
- ・【大喜利】【投稿~10/21(月)】買ったばかりの自転車を分解してひと言
- ・メモのコツを教えてください!
- ・CDの保有枚数を教えてください
- ・ホテルを選ぶとき、これだけは譲れない条件TOP3は?
- ・家・車以外で、人生で一番奮発した買い物
- ・人生最悪の忘れ物
- ・【コナン30周年】嘘でしょ!?と思った○○周年を教えて【ハルヒ20周年】
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
INDIRECT 横に再度抽出したい
-
テキストファイルで提出とは?
-
perlをバージョンアップしたら...
-
Perlのエラーについてご教授く...
-
arduino の割り込み処理について
-
Perl の外部モジュールの利用方法
-
Perlでファイルの末尾から指定...
-
openした後、closeしないでプロ...
-
ファイルアイコンの左下に緑の□...
-
Perl 特定のフォルダ以外削除
-
Perl言語について。
-
ファイルをディレクトリ分配の...
-
アルファベットに付いて質問し...
-
#!/usr/bin/perlで書きだしたCG...
-
perlのflock関数でロックをかけ...
-
AI sisterとは、偽物の人ですか?
-
bashスクリプト
-
perlプログラミング 空白行削除
-
perlでリテラル値はメモリにど...
-
perlで2次元配列をサブルーチ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
does not map to shiftjis は解...
-
Perl cgiの文字化けを直したい ...
-
utf8使用時のフォーム入力文字...
-
perlをwindows環境でshift-jis...
-
Data::Dumper;でダンプ後表示し...
-
HTTP::Request::Common qw(POST...
-
Perl UTF8で出力
-
ファイル出力をUTF8Nではなくて...
-
(Perl)UTF-8で別ファイルに書き...
-
perlで新規ファイルを作成でき...
-
Perl 正規表現について
-
utf-8のCSVをshift_jisに変換し...
-
【エラー】Unrecognized character
-
消費税の計算で 税込価格から...
-
perl5.8.3のunicode環境で日本...
-
Perl utf8上でshiftjisをデコード
-
VBAでCSVファイルを途中行まで...
-
VBAでCSVファイルの特定行を書...
-
ExcelをCSV書き出す場合のシー...
-
batファイルでrenameができませ...
おすすめ情報