重要なお知らせ

「教えて! goo」は2025年9月17日(水)をもちまして、サービスを終了いたします。詳細はこちら>

電子書籍の厳選無料作品が豊富!

大学の研究で参考文献として大量のPDFを保存していますが,これらの文献を効率的に管理したいと思っています.
要件は

・研究室内複数人で情報を共有したいため,研究室内用サーバ機にインストールしてブラウザ上で閲覧できる等の機能.ただし部外秘の資料もあるのでLAN内のみの公開を前提とする
・論文はPDF形式で保存する
・著者や発行年数等のデータはPDFから自動で抜き出してくれるとありがたいが,これは手入力でも可
・タイトル,著者,キーワード等で検索できる.全文検索もできるとなお良い.
・TeXを使用するので論文データがBibTexキーとして抽出できる

といったところです.
サーバ機はWin,Linuxが用意できます.
またHTML/javascript/PHP/MySQLは扱えますのでPukiWikiのようなソフトを少し改変・プラグイン追加で対応する程度のことならできます.身内での運用が前提なのでEvernoteなどのインターネット上で使うソフトの使用はあまり考えていないのですが,それでもEvernoteが便利!というのであればご意見下さい.よろしくお願いします.

A 回答 (2件)

pogoplug なら、データセンターなどのように外部にデータを預けることなく、大学の研究室にデータを置きながら、インターネット上で許可ユーザーだけが使える状態になりますよ。

ユーザー名とパスワードだけでは不正侵入の危険性があるので、データフォルダを暗号化するなど複数の安全措置を講じておけば安心できますね。
許可ユーザーは、pogoplug に接続したHDDから自分のハードディスクにデータファイルをダウンロード、pogoplugに接続したハードディスクにアップロードすることができます。
webサーバー、データベースサーバー、アプリケーションサーバーなどの構築をせずに、データファイルを共有するだけなので、初期投資が少なく、維持管理の負担も軽いですね。
バックアップ処理等のデータファイル消失に対する備えは必要だし、データファイルの取り扱いについて、各ユーザーに説明しておく必要はありますが、システム管理者の負担が軽く、消費電力が少ないこともメリットでしょう。スマートフォンからの利用が可能な点も魅力ですね。

http://www.pogoplug.com/home-ja.html

PDFファイルからテキストを抽出するツールがありますから、PDFファイル作成前のデータがなくてもある程度は文字を打ち直さずに済みます。
全文検索については、データベースで管理すると処理が重くなり、データ量が多いと検索時間が長くなってしまいます。ファイル名とテキストを関連付けたテキストファイルを用意して、grepで検索対象文字列を含む行を出力させる処理にすれば、大量のデータから短時間で求めるファイル名を検索できると思います。
データベースにすると、ユーザー管理が必要となり、システム管理者の負担を誰が引き受けるかということが問題になります。テキストファイルとシェルスクリプトで済むなら、pogoplug に接続したハードディスクに対するアクセス権設定とパーミッションで済んでしまいます。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。

ご紹介下さった製品はとても有用そうですので検討しましたが、今回はTeXとの連携の要望が強かったため結局自分たちでソフトを作ることになりました。全文検索の方法については参考にさせて頂きました。ありがとうございます。

お礼日時:2011/04/17 22:45

富士通のスキャナーに付いてるソフトでこんなものがありますよ


http://www.pfu.fujitsu.com/raku2library/personal/
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。
ご紹介下さったソフトはとても便利そうですので今後の参考にさせて頂きます。

お礼日時:2011/04/17 22:39

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!