質問

ワードのファイルをPDFに変換することに成功したのですが、ワードをHTMLに変換することが出来ません。
誰かHTMLに変換するモジュールや方法などをご存知の方は降りますでしょうか?

通報する

回答 (6件)

補足です。
Win32::OLEの各種サンプルを組み合わせて、試したところ、とりあえず自前のWin環境で動きました。
# 日本語処理してないので、一部文字化けします。

---

#!/usr/bin/perl

use strict;
#use warnings;
use Win32::OLE;
use Win32::OLE::Const 'Microsoft Word';
use Win32::Clipboard;

my ( $word_file, $Word, $document, $paragraphs, $paragraph, $enumerate, $text );

$word_file = 'c:\test.doc';

$Word = Win32::OLE->new('Word.Application', 'Quit');
$Word->{'Visible'} = 1;
$document = $Word->Documents->Open($word_file) || die("Unable to open document");
$Word->{Language} = 1041;
$Word->{WdOpenFormat} = 5;
$Word->{WdSaveFormat} = 7;
$paragraphs = $document->Paragraphs() ;
$enumerate = new Win32::OLE::Enum($paragraphs);

while( defined( $paragraph = $enumerate->Next() ) ) {
$paragraph->{Range}->{LanguageID} = 1041 ;
$paragraph->{Range}->{LanguageIDFarEast} = 1041 ;
$text = $paragraph->{Range}->{Text} ;
print "$text\n" ;
}

$Word->ActiveDocument->Close ;
$Word->Quit;

serverがwindowsなら、ダウンロードしたファイルをMS Filterにかける、という手もありますが…

http://office.microsoft.com/japan/downloads/2000 …

商用ベースでそういう商品が存在しているのは知ってますが、個人ベースで変換する方法があったら私も知りたいです。

Word->PDFはどのような方法で実現されているのでしょうか?

Win32::OLEしか無いんじゃないですかね?

Perlで、ワードのファイルをPDFに変換することに成功したんですか?
であれば同じ方法で行なえばいいと思います。

私はワードファイルの中身を見れないのでなんともいえませんが…

名前をつけて保存→ファイルの種類 Webページ でHTML形式にできます。

この回答への補足

言葉不足で申し訳ないです。
perlのプログラムで処理させた時を前提としています。

つまりperlでCGIをつくり、入力フォームなどでワードファイルを指定します。そして変換というような「ボタン」をクリックするとワードファイルがHTMLに変換されて指定されたサーバーに保存されるようなイメージを示しています。

保存のとき、「ファイルの種類」でHTMLを指定できると思いますが。
こういうことではないのかな

この回答への補足

上記内容と同文です。

このQ&Aは役に立ちましたか?3 件

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

新しく質問する

注目の記事

おしトピにAndroid版アプリが登場

話題のトピックにさくっとコメントできる「おしトピ」に Android版アプリが登場! もっと身近に使いやすくなりました。
今ならダウンロードで話題の掃除ロボットや全天球カメラが 当たるプレゼントキャンペーンも実施中。


新しく質問する

毎日見よう!教えて!gooトゥディ

べんりQ&A特集