アプリ版:「スタンプのみでお礼する」機能のリリースについて

グーグルの検索クローラーについての質問です。

ブログなどで他者のブログをコピペすると、
グーグルさんは該当記事を別のHPからコピペ(同一文章)した記事として
「検索表示順位は上位にはならない」と、

どこかのHPで確認しました。

例えばオリジナル記事の

すべての助詞「を」→「は」に修正しただけ、
すべての接続詞「しかし」→「ただし」に修正しただけ、
すべての読点「、」を無くしただけ、

このようにした場合、オリジナル記事とコピー記事は同一と判断されるんでしょうか?

また双方の記事が同一と判断される場合は、
記事の類似率の問題だと思うのですが、何パーセント以上が同一記事だと判断されると思いますか?

勝手なお願いなのですが、以下から選んでその理由もお伺いできれば、大変嬉しいです。
推測で構いませんので、個人的なご意見を伺いたいです。

1.助詞、接続詞、読点などをすべて変更すれば、オリジナル記事とは同一だと判断されない。
その理由は?

2.助詞、接続詞、読点などをすべて変更しても、その程度では同一記事と判断される。
その理由は?

3.そもそも記事をコピーしようがしまいが、クローラ―はそんな判別はしない。

4.その他

よろしくお願いします。

A 回答 (3件)

WEBサイトを作られているのでしたら、普段からこちらに目を通して


おいたらいかがでしょうか。非常にタメになります。

http://productforums.google.com/forum/#!categori …

さて、ご質問の件ですが、助詞や前置詞を置換しただけではクローラーを
欺くことはできないと思います。理由は、上記サイトによります。
 →同じ質問を見た記憶はないのですが

Googlebotを甘く見てはいけません。
    • good
    • 0
この回答へのお礼

回答ありがとうございます。

非常に役に立つサイトを教えて下さり、
ありがとうございました。
今後活用させてもらいたいと思います。

やっぱりそんな単純じゃないですよねw

お礼日時:2013/08/26 21:00

個人的な推測意見などを求めても意味ありません。



パーサーという考え方を知りましょう。

これはシンプルな話です。
「桃太郎は犬、猿と雉を家来にして鬼退治に出かけました」
「桃太郎が犬、猿および雉を家来と考え鬼退治を目的としました」
「桃太郎は犬を憎み、猿を殺し雉を串焼きにして鬼退治を考えながら家来を募集しました」
は同じものだとみなされます。

この文の中にある、おそらく名詞と思われるものは
桃太郎、犬、猿、雉、家来、鬼退治
です。この組み合わせがあったら、文脈がどうあれ、同じ文章とみなします。
この6語の組み合わせぴったりは、他の文章ではありえません。

「ジュリーはエリーを友達と思っていたが、思わぬことで失望を味わった」
「レーガンはブレジネフを敵と考えたのだが、思わぬことで友情を感じた」

これは文法的にはものすごく似ているのですが、別の文章です。
単語がぜんぜん違います。類似とはみなしません。

意味ではなく、単語、名詞(特に固有名詞)に着目してください。
似ているページの意味が分かります。
    • good
    • 0
この回答へのお礼

パーサーなんて知りませんでした。
・・・なるほど、勉強になります。

文章全体の類似率なんて関係ないんですね。
単語かぁ~。

意味や文章構成が全く違って、同一の単語を使用する事って少なくないですよ。
うーーーん・・・それを考えて文章を作成って難しいですね。
逆に言うと、

漢字→平仮名またはカタカナ、
カタカナ→平仮名
平仮名→カタカナまたは漢字

と、返還した方が良い・・・そう言う事ですね。
・・・果てしなく読み辛い文章になりそうですが(笑

ありがとうございます。

お礼日時:2013/08/26 21:14

> 漢字→平仮名またはカタカナ、


> カタカナ→平仮名
> 平仮名→カタカナまたは漢字

> と、返還した方が良い・・・そう言う事ですね

これは明らかに違います。Googleはこれらの類似性を把握しています。
具体的に言えば、ミスタイプした語句も推測します。

たとえば、google map または グーグル地図で以下のような検索を
行っても、ある程度考慮して似たような結果を返します。

google msp
google mapa
google lmap
gogle map
google tizu
googloe map
googlr map
google間p
ぐーぐるちず
グーぐる地図
グ0-グルマップ
グーグル・マップ
グーグルンマップ
グ グーグル マップ

他者を真似した同様の内容の場合、どっちがオリジナルと判断するのかは
わかりませんが、姑息な手段でサイトを上位にもっていくことはできないと
考えて下さい。

PS
単なる好学のための質問だったのであれば、ごめんさない。
    • good
    • 0
この回答へのお礼

なるほど、大変勉強になります。
ありがとうございます。

実は純粋に後学の為・・・と言うわけではないのですが、
どの様な文章を書けば、
他の文章と違う意味のある文章と認識してもらえるか・・・
それを考えると、その違いをしっかり考慮していないと、
より正しい文章が書けない為、伺いました。

コピペは当然ダメ
ただ書くだけでもダメ
考えて書かないといけませんので。

ありがとうございます。
大変勉強になりました

お礼日時:2013/08/28 02:56

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!