【最大10000ポイント】当たる!!質問投稿キャンペーン!

ある方の御依頼で、多くの文書を「知子の情報」で管理(文字検索やファイルの並べ替えらしいのですが・・・)をするためと言うことで、文書をスキャナで読み取り、電子化しています。
ワードで、編集し(整った文書としてプリントアウトする)その後、テキステトファイルにしています。
しかし、テキストファイルもプリントアウトした時に、文書としての形式を保つようにと言われ、決った文字数のところで改行マークをいれたり、表などは単語を短く切り、上下に並べたりしなくてはなりません。
その後に、「知子の情報」に移す。と言う手順です。わたし自身、「知子の情報」と言うソフトを理解していませんが、これでは、文字検索が上手くできないのではないかと思っております。
無駄なことをしているような気がしてなりません。
これは、合理的な方法なのでしょうか?

このQ&Aに関連する最新のQ&A

A 回答 (6件)

知子の情報は初めて意識したもので、以下は的外れかもしれませんが、所感を述べます。

ジャストシステムかと思ったら開発元はテグレット技術開発というところらしい。
ーー
データベースのように計数情報を主に整理するのでなく(これらはファイル形式という凝った記録様式が使われています。最近のワードのようなワープロも同じ。文字とスタイルを別ファイルにしたり大変)余りファイル形式を持ち込まない、テキストベースで文書などのファイルを持ち、語句(文章)の検索を高速で行うソフトでしょう。文字数や記録文書数が膨大でも、耐えうる処理時間で検索結果を返せるが売りでしょう。
アルゴリズムの教科書には大量の文字文書から語句を検索するアルゴリズムが載ってますが、開発会社独自で工夫を加えて高速化を図っていると思われます。ただ世界的にXXX法と認められるほどのアルゴリズムが発明されたかどうかは否定的かも。
ーー
またこのソフトが、検索を早めるために、語句のシソーラスや、索引などを作って用いているのかは門外漢にはわからないが。
ーー
営業の説明資料などと違い、世の中は文字情報だけで、十分用が足りるケースがまだまだ多いし、弁護士などはそれでまだ用が足りるので、こういう旧いコンセプト(機能)のソフトで十分なのでしょう。
しかしGoogleなどの話を聞くと、いまや世の中は画像・音声も含めた
データの検索に技術のしのぎを削っているようです。
このソフトの愛好家の偏愛(昔、いいと思い込んだら他が見えない)とか仲間の評判で安心して使っているのでしょう。
ーー
>文書をスキャナで読み取り、電子化しています。
当然、まだまだ世の中で、ワードなどの文書(電子媒体)で得られるものは、極く少ないです。
たとえワード形式で判例などが提供されていても、購入金額が高くて、紙ベースの資料をスキャナで電子イメージにするのが安価で、スキャナ利用が今現在の通例でしょう。
ーーー
ここでスキャナでイメージ(画像的データ)として取り込んだものを文字コード化するOCRソフトの利用のことを質問者は全く触れてないが、どうなのでしょう。
その場合ワードを通す必要は無いのでは。読み取り誤りの文字や体裁修正は1割程度はあるかもしれないが、文字認識技術も進歩している。ソフトも安価になっている。
ーー
>ワードで、編集し
はなぜ必要なのでしょうか。
テキストファイルは文字の色やフォント、そのサイズなどは指定できませんが、元の文書には色など付いておれば、それをワードで再現するのでしょうか。
懲りすぎなような気がします。
ーー
テキストファイルといっても、CSVファイル系とPRNファイル系とあり
後者はTABやスペース(多分こちら)で印刷したらそれなりに、中身の文字情報は見れるように作成者が整える。
後者を作れば良いので、ワードはなぜ必要なのか、質問からは良くわからない。
ーー
>その後、テキステトファイルにしています。
ワードをテキストファイルで保存したとき、そんなに見るに耐えない
状況になるのでしょうか。信じられない。
>これでは、文字検索が上手くできないのではないかと
ここの脈絡が良くわからない。テキスト形式(文字コードで文書をファイルに持つ)のファイルなら文字検索に障害は無いのでは。どういう心配をしているのかな。
ーー
また流れが説明不足では
文書
スキャナで読み取り
画像ファイルとして保存
???画像ーー>ワード文書へ変換のOCRソフト(現実に存在する)を使っているのか???
(使っているとして)ワードの文書化
ワードで修正
テキストファイルで保存
知子の情報に蓄積
なのか?
ーー
ワード文書へ変換のOCRソフトよりも
画像ーー>テキスト文書へ変換のソフトの方が安く信頼性が良いのでは。もちろん表罫線などは捨てられる。1ステップ省略せぢそう。
====
結論として
>これでは、文字検索が上手くできないのではないかと
(1)これではとは何か
(2)なぜ(どういう面から)検索がうまく行かないと思うのか。
==
他に良いシステムがあるとしても、おいそれとは載ってこないと思う

切り替えのソフト料金
過去の蓄積データのコンバート
使い勝手にほれているのを変えられるのを嫌がる
例えば弁護士ならそうだと思う。
==
質問者が、会社が受注して質問者が、毎日作業するという、ましてもし派遣のような立場だと現実は提案のすべも無いのでは。
意に沿わない膨大な作業をやらされるのも辛いが、システムで解決といっても原データ作成処理の部分は妙案は少ないと思う。
    • good
    • 0
この回答へのお礼

御丁寧な御回答、ありがとうございました。

正直、私には、理解不能のところもありますので、おっしゃることを理解できるように努力したいと思います。

情報は、ほとんど文字情報です。写真はありませんが図などがあります。
「読んでココ」で読み込み、ワードで誤認識を修正し、表を整え、図を貼り付けております。見た目が元の文書と同じ形のファイルが欲しいということでワードの文書を作っております。それをテキストファイルにし、またここで、ワードに近い形(図は張り付きませんが)にしなければなりません。
>懲りすぎなような気がします
私もそう思っております。
「知子の情報」を使っておられて、こちらが同じ手間と時間をかけるなら、そのソフトを充分生かせるためのファイルの形にしたほうが。。。と思っております。
そのためには、テキストファイルに手を加えない方が良いのではないかと・・・・。
しかし、テキストファイルで整えておかなければ、「知子の情報」で、プリントアウトした時に元の文書のようにならないから・・・と言うのが、クライアントのご意見だそうで。。。
ワード文書があるのに・・・というと、検索してすぐにプリントアウトしたいから・・・とか。(ワードの文書を探すのは面倒?)
「知子の情報」はこのように使うものなのでしょうか?
それに、ファイルの並べ替えをしたい・・・と言う要望があるそうです。
どのように並べ替えたい?時系列しかないのでは?と言うのが私の疑問です。
それなら、ファイル名のつけ方で、並べ替えられるように出来る・・・と思うのですが・・・これは的外れですか?

>文字検索に障害は無いのでは。どういう心配をしているのかな。
テキストファイルを表のようにするには、文章、単語まで、ブツブツと切ってしまわなければなりません。
例えば、1行40文字で、4段落の表にするには、9文字くらいに文章を切って、縦に並べるのです。
これって、無駄骨ではありませんか?

もっと勉強しないといけませんね。

お礼日時:2008/03/09 20:39

NO5です。



>膨大なファイルがある場合には、知子の情報でテキストファイルを検索し、プリントアウトなどは、ワードやPDFでなさっているのでしょうか?

知子の情報は全文テキスト検索ソフトです。ですから、表や図は入力できません。縦書きもだめです(混在できません)。
私の場合テキストを知子の情報ソフトに入れ、文書だけの場合はそこから印刷しています。(ほとんど原稿のようなものですが)
このソフトは莫大な文書の情報を入れ、瞬時に検索し、文書(改行、段落もOK)だけならそれを印刷するという具合です。

一方図や表があるものやワードで作ったものなどは、ワードとPDFに変換しています。形スタイルはそのままにしたいからです。
PDFは検索に重宝しますが、なんせ検索速度が遅い。
またそれらはワードやエクセルで印刷しています。
    • good
    • 0
この回答へのお礼

皆様のおかげで少しずつ見えてきました。

10ポイントでA4にはいるように、改行し、(これは問題ないのですね)
もちろんテキストファイルには、図も表も貼り付けられませんので、図は無視してよいのですが、表を罫線なしでそれらしく見えるようにとの指示で、一定の文字数で、区切り、マスに入っているかのようにします。縦書き部分は縦書きに見えるように、縦に1文字ずつ、並べています。
罫線は-や|で入れるように指示されたこともあります。
これでは、テキストファイルの意味がない・・・とぼやいていました。

ありがとうございました。

お礼日時:2008/03/10 12:16

私は毎週「知子の情報」検索ソフトを使っています。

かれこれ10年はたちますが、あまり変化していないソフトです。。
このソフトはテキスト・全文検索ソフトで、このソフトに入力、コピーしたものは一瞬して開いてくれるありがたいソフトです。例え何万部あっても。
ワードで作ったものはこのソフトにコピーするとテキストに自然に変換してくれます。

たぶん、ある方は、印刷も検索もしたいのでしょう。
長文の文書でなければ、PDF,ワードなどで保存して検索をかければいいと思います。
スキャナで文書をPDF→ワードで変換するのはどうでしょうか。
それで事足りると思うのですが。

知子の情報にインデックス保存をするのなら、コピーすれば簡単です。
    • good
    • 0
この回答へのお礼

>このソフトに入力、コピーしたものは一瞬にして開いてくれる
それなんですね!だから、そのまま、印刷したい。同じファイル名のワードを開くのは手間をかけたくない、テキストファイルがワードと同じような文書の形であってほしい。と言うのが先様のお考えなのでしょう。
しかし、改行をシ、表(様)の作成のため、半分に切られた語句、ひどいときには、縦書き(様)に1字ずつ縦に並べるなどしていますので、検索に引っかからないと思うのが私の心配です。
わざわざ使いにくくするために時間を割いているような気がします。
でも、先様がそれでいいとおっしゃれば仕方ないですね・・・・。

sinosihen様は、膨大なファイルがある場合には、知子の情報でテキストファイルを検索し、プリントアウトなどは、ワードやPDFでなさっているのでしょうか?

ご親切にありがとうございました。

お礼日時:2008/03/10 10:50

>「知子の情報」についてのサイトです。


http://homepage3.nifty.com/Noah/tomoko.htm
http://web.teglet.co.jp/hjbase/
http://www.teglet.jp/soft/tompro2/
参考に。
    • good
    • 0
この回答へのお礼

ありがとうございます。
このあばさんが理解できるところまで、少し勉強してみます。

お礼日時:2008/03/09 20:44

ANo.1 です。


業務であれば業務と割り切って淡々とこなすか、あるいは先にも書きましたが、きちんとソフトを理解してクライアントに建設的な提案をするかどちらかでしょう。
きちんと理解できれば現状の作業がクライアントにとって無益な作業か、有益な作業かわかるはずです。
   
少し辛めの回答ですが・・・・
現状はソフトを理解しようともせずただ機械的な作業に嫌気がさして、ぼやいているだけなのではないですか。
もう少し前向きに仕事をされてはいかがでしょうか?
    • good
    • 0
この回答へのお礼

ぼやいている・・・と言うのは事実ですね。
何度も担当者にこの作業は意味がないのでは。。。と訴えてきましたが、
「契約がそうなっている。」ということで。
その契約をする前の打ち合わせに口を出せる立場にないので。。。
「知子の情報」について調べようとしたのですが、情報が見つかりませんでしたので、基礎的な情報だけでも欲しかったのですが。
ありがとうございました。

お礼日時:2008/03/09 17:25

失礼ですがあなたのポジションがわかりません。


> ある方の御依頼で、多くの文書を「知子の情報」で管理
これは業務として引き受けたのでしょうか?
業務として引き受けたのであれば
> わたし自身、「知子の情報」と言うソフトを理解していません
まずこのソフトを理解することが必要でしょう。
入手してきちんと理解できれば、どうするのがクライアントの希望に沿ったものになるのかわかってくるはずです。
ソフト自体検索で簡単に引っ掛かりますよ。

この回答への補足

業務として引き受けました。正確に言うと、担当者が業務として引き受け、作業をのみしていると言ったほうが正確かもしれません。
「電子化」だけの業務ではありませんが、電子化はその一部です。
しかし、この作業をしていることに、むなしさを感じています。

補足日時:2008/03/09 16:52
    • good
    • 0
この回答へのお礼

ありがとうございました。
情報処理の会社ではありませんので、クライアントがこのようにして欲しいとい言われれば、そのようにするしかない、と言うのが今の状況なのかもしれませんが・・・。

お礼日時:2008/03/09 16:59

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q文書型データベース構築

いままで使っていた、文書型のデータベースの会社が、
開発をやめているので、将来的にマイクロソフトのアクセスで文書型のデータベースをつくりたいと思いますが、
参考となるサイトなど情報がありましたらよろしくお願いします。
また、数万件の、1つ1つが長さの異なる文書の集まりを、全体のファイルを小さくする場合の注意点、方法などがありましたら、よろしくお願いします。
しばらくは、現在のT社の、文書型のデータベースに情報を蓄積していくつもりです。

Aベストアンサー

参考になれば:
XMLのファイルコントロールに可能性を見つけて、数社のソフトを試してみましたが起動に時間が掛かるという難儀に遭い中断しました。
将来性があるかどうかは解りませんが、基本的にこの「教えて!goo」の1質問ファイル容量を無制限にして、T社製品(現在使用中)の追加分として、自分は次のような組合せを試行しています。
Apache+PHP+MySQLで同型のものを構築しました。(参考書による)
これをBBSとか掲示板システムというらしいです。
これでイントラネット内で閲覧可能にして、自分専用部分を変更プログラムで同じデータベース内を共有しています。一般閲覧に対して痕跡が残るのが現在の悩みの種ですが。
操作手順はT社製に比べるとデータベース系はかなり余計な操作手順が必要になっていてこまめに使用するには難儀しているのが現状です。
画像も一応扱えるようにしていますのでこの部分は納得しています。
自分で構築出来ればそれなりに手順を省く設計が出来るでしょうが、ベンダーに頼むとなるとかなりの金額になるでしょう。


人気Q&Aランキング