dポイントプレゼントキャンペーン実施中!

いつもお世話になっております。
標題の件で、わからないことがあり、質問させて頂きました。
印刷会社なのですが、受け取った書籍をpdf化し、そのデータを
売るという事業を展開しております。
今回、売ったpdfの加工ができればと思い、いろいろとみていたところ、
下記のサイトを見つけました。
http://www.scapon.jp/tuning.html
受け取ったpdfの中からpdfを選択し、チューニングというボタンから、余白の除去、文字くっきり、黄ばみ除去等、いろいろなオプションを指定し、生成することができるみたいです。
これはphp等のサーバーサイドのプログラミングで
できることなのでしょうか。
かなり難しい技術だとは思うのですが、
検索をしても、なかなかいい情報が出てこず、完全に詰まってしまいました。
どういうものを使用して、実現しているかおわかりになる方がおりましたら、ご教示いただけませんでしょうか。
宜しくお願い致します。

A 回答 (1件)

PDFの加工は分かりませんが、チューニングの内容については画像処理の知識とOpenCVやHALCONのような画像処理パッケージがあれば実現可能でしょう。



「余白除去」は処理の内容が、Webページに少し書いてありますね。あらかじめメディアン・フィルタなどでノイズを除去しておいて、後からトリミングしていると思います。

「文字くっきり」は、何らかのエッジ保存平滑化フィルタを使っているのでしょう。バイラテラルフィルタを何度かくり返し適用するか、Kuwahara filterのような絵画調の効果が得られる処理を使っているのではないかと。

「黄ばみ除去」は、モノクロの文書ならグレー変換した後に大津の二値化を適用するなり、K平均法などで白黒に二値化するなど色々と考えられます。濃淡のある文書では、黄ばみをセグメンテーションするような、もっと凝った方法が必要でしょう。

恐らく「裏写り・地色除去」も「黄ばみ除去」と似たような手段をとっていると思います。あくまで全て想像ですが。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!