ワードのファイルをPDFに変換することに成功したのですが、ワードをHTMLに変換することが出来ません。
誰かHTMLに変換するモジュールや方法などをご存知の方は降りますでしょうか?

このQ&Aに関連する最新のQ&A

A 回答 (6件)

補足です。


Win32::OLEの各種サンプルを組み合わせて、試したところ、とりあえず自前のWin環境で動きました。
# 日本語処理してないので、一部文字化けします。

---

#!/usr/bin/perl

use strict;
#use warnings;
use Win32::OLE;
use Win32::OLE::Const 'Microsoft Word';
use Win32::Clipboard;

my ( $word_file, $Word, $document, $paragraphs, $paragraph, $enumerate, $text );

$word_file = 'c:\test.doc';

$Word = Win32::OLE->new('Word.Application', 'Quit');
$Word->{'Visible'} = 1;
$document = $Word->Documents->Open($word_file) || die("Unable to open document");
$Word->{Language} = 1041;
$Word->{WdOpenFormat} = 5;
$Word->{WdSaveFormat} = 7;
$paragraphs = $document->Paragraphs() ;
$enumerate = new Win32::OLE::Enum($paragraphs);

while( defined( $paragraph = $enumerate->Next() ) ) {
$paragraph->{Range}->{LanguageID} = 1041 ;
$paragraph->{Range}->{LanguageIDFarEast} = 1041 ;
$text = $paragraph->{Range}->{Text} ;
print "$text\n" ;
}

$Word->ActiveDocument->Close ;
$Word->Quit;
    • good
    • 0

serverがwindowsなら、ダウンロードしたファイルをMS Filterにかける、という手もありますが…



http://office.microsoft.com/japan/downloads/2000 …

商用ベースでそういう商品が存在しているのは知ってますが、個人ベースで変換する方法があったら私も知りたいです。

Word->PDFはどのような方法で実現されているのでしょうか?

参考URL:http://www.antenna.co.jp/ohf/
    • good
    • 0

Win32::OLEしか無いんじゃないですかね?



参考URL:http://www.geocities.co.jp/SiliconValley-Oakland …
    • good
    • 0

Perlで、ワードのファイルをPDFに変換することに成功したんですか?


であれば同じ方法で行なえばいいと思います。

私はワードファイルの中身を見れないのでなんともいえませんが…
    • good
    • 0

名前をつけて保存→ファイルの種類 Webページ でHTML形式にできます。

この回答への補足

言葉不足で申し訳ないです。
perlのプログラムで処理させた時を前提としています。

つまりperlでCGIをつくり、入力フォームなどでワードファイルを指定します。そして変換というような「ボタン」をクリックするとワードファイルがHTMLに変換されて指定されたサーバーに保存されるようなイメージを示しています。

補足日時:2004/08/04 18:33
    • good
    • 0

保存のとき、「ファイルの種類」でHTMLを指定できると思いますが。


こういうことではないのかな

この回答への補足

上記内容と同文です。

補足日時:2004/08/04 18:36
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aと関連する良く見られている質問

Q全モジュールのPODをHTMLに変換する機能を探しています

C:\perl\libとC:\perl\site\lib内にある全PODファイル(pmにインプラントされているPODも含め)を
自動で検索し、C:\perl\html配下にツリーをつくりHTMLを一斉に生成するツールはないですか?

Aベストアンサー

AcitvePerlですよね?
であれば、コマンドプロンプトで

perl -MActivePerl::DocTools -e "UpdateHTML('wait')"

を実行してみてください。
多分自分でインストールしたものも取り込んでくれます。

QHTML形式からPDFに変換する方法教えて下さい!!

HTML形式からPDFに変換する際に、画像もPDFに貼り付けて
変換したいのですが、どうもうまくいきません。
変換後、画像の部分は<IMAGE>とテキスト(文字)で表示
されています。
perlのプログラムで考えているのですが、教えて下さい。

print "Content-Type: application/pdf\n";

これだけでは、画像も一緒に変換できないのでしょうか?
画像は、サーバー内にある画像データから表示しています。
JPG画像になります。

Aベストアンサー

どこがよくわからないのか、
こちらにはわからないので、
お答えの使用がありませんが、
PDFlibは既存ファイルのPDF化は
できなかったかも。
新規にPDFをつくる場合には有効ですが。

QJcodeモジュールとEncodeモジュール

以下、Perl5.8でJcodeモジュールを使った場合とEncodeモジュールを使った場合の違いについて、知りたいです。
※そもそもこのモジュールは同時に使ったらだめなのでしょうか?

use strict;
use utf8;
use Jcode;
use Encode;

my $dat1 = "あイ卯(1)Iⅰ";
Jcode::convert(\$dat1, "utf8");

my $dat2 = "あイ卯(1)Iⅰ";
$dat2 = Encode::encode("utf8", $dat2);

文字コード変換の正しい使い方が知りたいです。

Aベストアンサー

Jcode.pmの2.0以降では、Encodeがある環境(つまり本体のバージョンが
5.8以降)の場合には Jcode は Encodeのラッパーとしてインストールされます。
つまり変換そのものはEncodeがやっていることになります。

ということで基本的に違いはありません。
混在しても悪影響はありません。

ただし、
> $dat2 = Encode::encode("utf8", $dat2);
Encode の encode/decode は単なるコード変換だけではないので、
コード変換のみが目的なら from_to を使ったほうが良いです。

> 文字コード変換の正しい使い方が知りたいです。
正しいとか間違っているとかはないと思いますが、使えるPerl本体の
バージョンが5.8以降ならばEncode.pmは標準で入っているはずなので、
Encodeを使っておけばよいでしょう。
そうではなくて、、5.6とかさらにそれより前のものがある環境でも使う
ようなスクリプトなら、Jcode.pmを使わざるを得ないと思います。

Jcode.pmの2.0以降では、Encodeがある環境(つまり本体のバージョンが
5.8以降)の場合には Jcode は Encodeのラッパーとしてインストールされます。
つまり変換そのものはEncodeがやっていることになります。

ということで基本的に違いはありません。
混在しても悪影響はありません。

ただし、
> $dat2 = Encode::encode("utf8", $dat2);
Encode の encode/decode は単なるコード変換だけではないので、
コード変換のみが目的なら from_to を使ったほうが良いです。

> 文字コード変換の正しい使い方...続きを読む

QテキストをHTMLに変換するソース

掲示板を作成しております。
テキストをHTMLに変換するソースサンプルを教えてください。

たとえば、こちらのサイトみたいにURLを入力すると
リンクとして表示されるサイトです。

http://yahoo.co.jp

↑のようにリンクとして表示させられればOKです。

Aベストアンサー

他の掲示板やWikiなどのスクリプトを参考にしてください...だと
不親切なので、取り敢えず簡単な方法を。

$msg = <<'HTML';
掲示板を作成しております。
テキストをHTMLに変換するソースサンプルを教えてください。

たとえば、こちらのサイトみたいにURLを入力すると
リンクとして表示されるサイトです。

http://yahoo.co.jp

↑のようにリンクとして表示させられればOKです。
HTML

$msg =~ s/([^=^\"]|^)(http\:[\w\.\~\-\/\?\&\+\=\:\@\%\;\#\%]+)/$1<a href=\"$2\" target=\"_blank\">$2<\/a>/g;

print $msg;
exit;

WebPatioからパクってみました。
Child Tree では正規表現の部分は以下のようになっていますね。

s/([^=^\"]|^)((http|ftp|https)\:[\w\.\~\-\/\?\&\+\=\:\@\%\;\#\,\|]+)/$1<a href=$2 target=$TGT>$2<\/a>/g;

より正確なURLのリンク変換は非常に難しいです。

http://www.din.or.jp/~ohzaki/perl.htm#URI
http://www.din.or.jp/~ohzaki/perl.htm#httpURL

参考URL:http://www.din.or.jp/~ohzaki/perl.htm#URI,http://www.din.or.jp/~ohzaki/perl.htm#httpURL

他の掲示板やWikiなどのスクリプトを参考にしてください...だと
不親切なので、取り敢えず簡単な方法を。

$msg = <<'HTML';
掲示板を作成しております。
テキストをHTMLに変換するソースサンプルを教えてください。

たとえば、こちらのサイトみたいにURLを入力すると
リンクとして表示されるサイトです。

http://yahoo.co.jp

↑のようにリンクとして表示させられればOKです。
HTML

$msg =~ s/([^=^\"]|^)(http\:[\w\.\~\-\/\?\&\+\=\:\@\%\;\#\%]+)/$1<a href=\"$2\" target=\"_blank\">$2<\/a...続きを読む

Qhtmlをperl用書式に自動変換するフリーツール

以前、ネットワーク上で、普通に書かれたHTMLをPERLスクリプト内に埋めこむための書式に自動的に変換してくれるツール(フリーウェア)を見つけてDLしたことがあるのですが、うっかり消してしまったか何かでそれを失ってしまいました。
 もういちど取得しようと思うのですが、何せ偶然みつけてその場でDLしたもので、どこで配布していたのか全く記憶がありません。
 ご存知の方いらっしゃいましたら、是非教えてください。

Aベストアンサー

別にツールは必要ありませんよ。
(↑ツールがわからないのでこんなこと言っちゃってます^^; )

print <<_HTML;
~HTMLのタグ~
_HTML

という風にするだけです。"_HTML"の部分は別になんでもいいです。
良く使われてるのは"_HTML"と"_EOF"みたいですが。

[例]
#!/usr/bin/perl

print "Content-type: text/html\n\n";
print <<_HTML;
<HTML>
<HEAD>
<TITLE>Sample</TITLE>
</HEAD>
<BODY>
<DIV align="center">This is Sample Page.</DIV>
</BODY>
</HTML>
_HTML


あと、1行とか書くときは、
print "<IMG src=\"image.gif\" width=\"10\" height=\"10\" alt=\"image\">"
というように、"(ダブルクォート)は\"としてください。

別にツールは必要ありませんよ。
(↑ツールがわからないのでこんなこと言っちゃってます^^; )

print <<_HTML;
~HTMLのタグ~
_HTML

という風にするだけです。"_HTML"の部分は別になんでもいいです。
良く使われてるのは"_HTML"と"_EOF"みたいですが。

[例]
#!/usr/bin/perl

print "Content-type: text/html\n\n";
print <<_HTML;
<HTML>
<HEAD>
<TITLE>Sample</TITLE>
</HEAD>
<BODY>
<DIV align="center">This is Sample Page.</DIV>
</BODY>
</HTML>
_HTML


あと、1行とか書くと...続きを読む


このカテゴリの人気Q&Aランキング

おすすめ情報