これ何て呼びますか Part2

もしかしたらカテゴリ違いかもしれませんがご容赦ください。

形態素解析とgoogleを組み合わせ、人工無能が会話中「気になった」キーワードを
裏で自動的にgoogleを使い一斉検索しその結果リストアップされたページを
ダウンロードしてはそのキーワードの出る近辺を解析・学習させ、
また気になったキーワードを…とねずみ算式に学習させていく人工無能を
作ろうとしているのですが、一つだけ引っかかったところがあります。

タイトルのとおりなのですが、この手法で得た自動学習データは著作権的に
大丈夫なのでしょうか?例えば人工無能がとあるサイトに掲載されている
オリジナル小説の登場キャラのセリフを突然口にしだした場合とか。
google自体はそのサイトへのリンクがあるので引用って形を取れるかもしれませんが
出展をその都度表示していたら人工無能とのチャットが成り立たなくなりますし。

以前ゆいちゃっととか設置したところ話しかける人がほとんどいないので
「相手の発言から学習」のみでは少々厳しいかと思い上記のような手を
思いついたのですが、もしもまずいとしたらこうすれば問題が回避できそうだ、
とか他にこんな案が使えるんじゃないか、とかありますでしょうか?

A 回答 (1件)

法律の専門家ではないので「著作権的」に良いか悪いかはわかりませんが、チャットシステムのどこかに、「google で学習してます」のような表示をいれておけばいいのではないかと思う。



googleで自動学習が出来ればいいですね。学習させるにはいろいろな問題がありますが。
・google で検索した情報の信頼度は?
・google で検索した情報の抽出はどのようにするか?
・キーワードの近辺だけで学習させるのに必要な情報がどれだけあるか?
・検索した結果が検索したい情報の確率は?
・日本語として正しいものがどれだけあるか?
・他言語の場合はどうするか?
・情報の種類は?HTML,TEXT,gif,動画?音声?
などなど、研究して良いものが出来たらFree でながしてくださいな。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


おすすめ情報