
perl初心者です。
rssを取得して簡易ブログパーツをつくりたいのですが文字コードでうまいこといかず悪戦しています。
以下がコードです。(きたなくてすいません…)
#!/usr/bin/perl
use LWP::Simple;
use XML::RSS;
use utf8;
use open ":utf8";
$logfile="./syoukai.log";
open(DAT, "$logfile");
@log=<DAT>;
close(DAT);
my $rss = new XML::RSS;
@list = ();
foreach(@log){
($nom,$name,$prof,$xml,$btitle,$ktitle,$klink)=split(/<>/);
eval { $rss->parse( LWP::Simple::get($xml) ); };
if($@) {
next;
}
$btitle = $rss->{'channel'}->{'title'};
$prof = $rss->{'channel'}->{'link'};
$item = $rss->{'items'};
$line = @{$item}[0];
$ktitle = $line->{'title'};
$klink = $line->{'link'};
$date = $line->{'pubDate'};
push(@list, "$date<>$name<>$prof<>$xml<>$btitle<>$ktitle<>$klink<>\n");
}
open(IN,">$logfile");
print IN @list;
close(IN);
exit;
syoukai.logを呼び出して
そこに書かれたxmlを順番に読み込んで
ファイルを更新したいのですが
これだと何もいじっていない$nameは大丈夫なんですが
$btitleや$ktitleが文字化けしてファイルに書かれてしまいます…。
use utf8;ではなく
use encoding 'UTF-8', STDOUT => 'cp932';としたら
今度は$nameだけ文字化けしてしまいます。
別々の文字コードを一緒にしてしまってるからだと思うのですが
どれがどの文字コードなのかがわからないでいます。
文字コードを統一する方法などがあれば教えてくださいm(__)m
説明&記述ヘタですいません…。
宜しくお願いします。
A 回答 (1件)
- 最新から表示
- 回答順に表示
No.1
- 回答日時:
一旦、フラグ付き utf8 にして、ファイルなどに出力するときエンコードを変換します。
表示がくずれるので、空白2文字を全角空白1文字にしていることに注意
#!/usr/bin/perl
use strict;
use warnings;
use autodie;
use HTTP::Request;
use LWP;
use XML::RSS;
use constant OUTPUT_FILE => 'foo.log';
my @url_list = qw(
http://weather.livedoor.com/forecast/rss/earthqu …
http://weather.livedoor.com/forecast/rss/tsunami …
my $rss = XML::RSS->new( encoding => 'UTF-8' );
my $ua = LWP::UserAgent->new;
$ua->agent('Mozilla');
$ua->timeout(10);
open my $fh, '>', OUTPUT_FILE;
binmode $fh, ":encoding(CP932)";
for my $url (@url_list) {
my $req = HTTP::Request->new( GET => $url );
my $res = $ua->request($req);
if ( $res->is_success ) {
$rss->parse( $res->content ) or die "$url";
my $title = convert_flagged_utf8( $rss->{'channel'}->{'title'} );
my $link = convert_flagged_utf8( $rss->{'channel'}->{'link'} );
my $item0 = $rss->{'items'}->[0];
my $item_title = convert_flagged_utf8( $item0->{'title'} );
my $item_link = convert_flagged_utf8( $item0->{'link'} );
my $date = convert_flagged_utf8( $item0->{'pubDate'} );
print {$fh}
"$date<>hoge<>$link<>$url<>$title<>$item_title<>$item_link<>\n";
}
else {
print $res->error_as_HTML, "\n";
}
}
close $fh;
sub convert_flagged_utf8 {
my $str = shift;
my $flagged_utf8
= Encode::is_utf8($str) ? $str : Encode::decode_utf8($str);
return $flagged_utf8;
}
ありがとうございます。
すこしづつ理解してきました。
なんとか思うようにいきそうです!
大変助かりましたm(__)m
教えていただいたスクリプトを参考にもう少し勉強していこうと思います。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Perl RSSにdiv,ul classを付けたいのですがどのようにつけるのかわからないです 2 2022/03/28 01:53
- CGI perlで書いたcgiでsqliteの使い方を教えてください 2 2023/05/08 21:29
- Excel(エクセル) Excelにて、フォルダ内のTextファイルをマクロで統合すると文字化けしてしまう時の解消コード 4 2023/01/01 07:32
- JavaScript jqueryを使ったスムーススクロールのコードを書いたのですが、HTMLコード内にある、a butt 2 2022/04/14 10:59
- Excel(エクセル) PHPプログラムをエクセルに張り付けると検索ボックスがでてくる! 3 2022/05/08 07:10
- PHP SQLとPHPの連結方法がわからないのでアドバイスお願い致します 1 2022/07/12 12:16
- PHP PHPの構文で間違えが分からない 5 2022/07/11 16:38
- PHP php エラー 2 2022/10/23 16:43
- JavaScript フォームが空欄の時にフォームの外をクリックすると、エラーが出るコードを調べています。 1 2023/06/25 11:51
- Excel(エクセル) エクセルのVBAについて とあるサイトのコードを参考に、CSVの文字化けを直すVBAを作成しているの 7 2022/11/04 14:15
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
INDIRECT 横に再度抽出したい
-
テキストファイルで提出とは?
-
perlプログラミング 空白行削除
-
Perlのエラーについてご教授く...
-
perlをバージョンアップしたら...
-
Wallpaper Engineでおすすめの...
-
P.Cのシングルチューナーとダブ...
-
#!/usr/bin/perlで書きだしたCG...
-
perlのflock関数でロックをかけ...
-
AI sisterとは、偽物の人ですか?
-
bashスクリプト
-
ファイルアイコンの左下に緑の□...
-
perlについての質問
-
perlについての質問
-
Perlで特定文字列から特定文字...
-
openした後、closeしないでプロ...
-
perl の open について教えてく...
-
Perl言語について。
-
ファイルをディレクトリ分配の...
-
アルファベットに付いて質問し...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Perl cgiの文字化けを直したい ...
-
【エラー】Unrecognized character
-
Perl UTF8で出力
-
perlでuse utf8でsjisのファイ...
-
perlの自作ライブラリについて
-
Perl:Unicodeプロパティ作れない
-
perlのmysqlで文字化けをする、...
-
does not map to shiftjis は解...
-
sedの動作
-
Perlを用いて、XMLファイルの中...
-
消費税の計算で 税込価格から...
-
Perl utf8上でshiftjisをデコード
-
perlのLWP::Simpleでgrepの値が...
-
perlで新規ファイルを作成でき...
-
utf-8のCSVをshift_jisに変換し...
-
Perlでのファイル出力における...
-
HTTP::Request::Common qw(POST...
-
[Perl]Shift-JISのXMLを解析する場
-
[perl5.8] utf8で文字出力する...
-
ファイル出力をUTF8Nではなくて...
おすすめ情報