![](http://oshiete.xgoo.jp/images/v2/pc/qa/question_title.png?e8efa67)
perl初心者です。
rssを取得して簡易ブログパーツをつくりたいのですが文字コードでうまいこといかず悪戦しています。
以下がコードです。(きたなくてすいません…)
#!/usr/bin/perl
use LWP::Simple;
use XML::RSS;
use utf8;
use open ":utf8";
$logfile="./syoukai.log";
open(DAT, "$logfile");
@log=<DAT>;
close(DAT);
my $rss = new XML::RSS;
@list = ();
foreach(@log){
($nom,$name,$prof,$xml,$btitle,$ktitle,$klink)=split(/<>/);
eval { $rss->parse( LWP::Simple::get($xml) ); };
if($@) {
next;
}
$btitle = $rss->{'channel'}->{'title'};
$prof = $rss->{'channel'}->{'link'};
$item = $rss->{'items'};
$line = @{$item}[0];
$ktitle = $line->{'title'};
$klink = $line->{'link'};
$date = $line->{'pubDate'};
push(@list, "$date<>$name<>$prof<>$xml<>$btitle<>$ktitle<>$klink<>\n");
}
open(IN,">$logfile");
print IN @list;
close(IN);
exit;
syoukai.logを呼び出して
そこに書かれたxmlを順番に読み込んで
ファイルを更新したいのですが
これだと何もいじっていない$nameは大丈夫なんですが
$btitleや$ktitleが文字化けしてファイルに書かれてしまいます…。
use utf8;ではなく
use encoding 'UTF-8', STDOUT => 'cp932';としたら
今度は$nameだけ文字化けしてしまいます。
別々の文字コードを一緒にしてしまってるからだと思うのですが
どれがどの文字コードなのかがわからないでいます。
文字コードを統一する方法などがあれば教えてくださいm(__)m
説明&記述ヘタですいません…。
宜しくお願いします。
A 回答 (1件)
- 最新から表示
- 回答順に表示
No.1
- 回答日時:
一旦、フラグ付き utf8 にして、ファイルなどに出力するときエンコードを変換します。
表示がくずれるので、空白2文字を全角空白1文字にしていることに注意
#!/usr/bin/perl
use strict;
use warnings;
use autodie;
use HTTP::Request;
use LWP;
use XML::RSS;
use constant OUTPUT_FILE => 'foo.log';
my @url_list = qw(
http://weather.livedoor.com/forecast/rss/earthqu …
http://weather.livedoor.com/forecast/rss/tsunami …
my $rss = XML::RSS->new( encoding => 'UTF-8' );
my $ua = LWP::UserAgent->new;
$ua->agent('Mozilla');
$ua->timeout(10);
open my $fh, '>', OUTPUT_FILE;
binmode $fh, ":encoding(CP932)";
for my $url (@url_list) {
my $req = HTTP::Request->new( GET => $url );
my $res = $ua->request($req);
if ( $res->is_success ) {
$rss->parse( $res->content ) or die "$url";
my $title = convert_flagged_utf8( $rss->{'channel'}->{'title'} );
my $link = convert_flagged_utf8( $rss->{'channel'}->{'link'} );
my $item0 = $rss->{'items'}->[0];
my $item_title = convert_flagged_utf8( $item0->{'title'} );
my $item_link = convert_flagged_utf8( $item0->{'link'} );
my $date = convert_flagged_utf8( $item0->{'pubDate'} );
print {$fh}
"$date<>hoge<>$link<>$url<>$title<>$item_title<>$item_link<>\n";
}
else {
print $res->error_as_HTML, "\n";
}
}
close $fh;
sub convert_flagged_utf8 {
my $str = shift;
my $flagged_utf8
= Encode::is_utf8($str) ? $str : Encode::decode_utf8($str);
return $flagged_utf8;
}
ありがとうございます。
すこしづつ理解してきました。
なんとか思うようにいきそうです!
大変助かりましたm(__)m
教えていただいたスクリプトを参考にもう少し勉強していこうと思います。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Perl RSSにdiv,ul classを付けたいのですがどのようにつけるのかわからないです 2 2022/03/28 01:53
- CGI perlで書いたcgiでsqliteの使い方を教えてください 2 2023/05/08 21:29
- Excel(エクセル) Excelにて、フォルダ内のTextファイルをマクロで統合すると文字化けしてしまう時の解消コード 4 2023/01/01 07:32
- JavaScript jqueryを使ったスムーススクロールのコードを書いたのですが、HTMLコード内にある、a butt 2 2022/04/14 10:59
- Excel(エクセル) PHPプログラムをエクセルに張り付けると検索ボックスがでてくる! 3 2022/05/08 07:10
- PHP SQLとPHPの連結方法がわからないのでアドバイスお願い致します 1 2022/07/12 12:16
- PHP PHPの構文で間違えが分からない 5 2022/07/11 16:38
- PHP php エラー 2 2022/10/23 16:43
- JavaScript フォームが空欄の時にフォームの外をクリックすると、エラーが出るコードを調べています。 1 2023/06/25 11:51
- Excel(エクセル) エクセルのVBAについて とあるサイトのコードを参考に、CSVの文字化けを直すVBAを作成しているの 7 2022/11/04 14:15
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
Perl cgiの文字化けを直したい ...
-
window.open でのファイル指定方法
-
VBAでCSVファイルの特定行を書...
-
ReadLineでの読み出し行を指定する
-
awkスクリプトでダブルクォーテ...
-
VBAで巨大なファイルの途中から...
-
ExcelをCSV書き出す場合のシー...
-
VBAでCSVファイルを途中行まで...
-
htaccessで特定のディレクトリ...
-
fopenでディレクトリ内の全ファ...
-
ファイル出力の改行コードをLFに
-
エクセルVBAで素数だけを出力す...
-
fgets で値が取得できない
-
エクセルVBA コードが同じでも...
-
配列の中に重複文字列があるか...
-
DOSコマンドで、標準出力を出力...
-
MATLABのm-fileについて
-
openした後、closeしないでプロ...
-
Perlで特定行から特定行までを...
-
WindowsでPerlをする際,1行目の...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
perlをwindows環境でshift-jis...
-
Perl cgiの文字化けを直したい ...
-
perlでuse utf8でsjisのファイ...
-
HTTP::Request::Common qw(POST...
-
does not map to shiftjis は解...
-
Perl:Unicodeプロパティ作れない
-
消費税の計算で 税込価格から...
-
Perlでのファイル出力における...
-
Perl utf8上でshiftjisをデコード
-
Data::Dumper;でダンプ後表示し...
-
複数種類の括弧でくくられてな...
-
ファイル出力をUTF8Nではなくて...
-
[Perl]Shift-JISのXMLを解析する場
-
utf-8での日本語正規表現の書き方
-
perlでのtext読み込み
-
perl5.8.3のunicode環境で日本...
-
[perl5.8] SJISから読み込んだ~と
-
perlで新規ファイルを作成でき...
-
Perl 正規表現について
-
じゃらんのAPIでRESTで取得した...
おすすめ情報