グーグルの検索クローラーについての質問です。
ブログなどで他者のブログをコピペすると、
グーグルさんは該当記事を別のHPからコピペ(同一文章)した記事として
「検索表示順位は上位にはならない」と、
どこかのHPで確認しました。
例えばオリジナル記事の
すべての助詞「を」→「は」に修正しただけ、
すべての接続詞「しかし」→「ただし」に修正しただけ、
すべての読点「、」を無くしただけ、
このようにした場合、オリジナル記事とコピー記事は同一と判断されるんでしょうか?
また双方の記事が同一と判断される場合は、
記事の類似率の問題だと思うのですが、何パーセント以上が同一記事だと判断されると思いますか?
勝手なお願いなのですが、以下から選んでその理由もお伺いできれば、大変嬉しいです。
推測で構いませんので、個人的なご意見を伺いたいです。
1.助詞、接続詞、読点などをすべて変更すれば、オリジナル記事とは同一だと判断されない。
その理由は?
2.助詞、接続詞、読点などをすべて変更しても、その程度では同一記事と判断される。
その理由は?
3.そもそも記事をコピーしようがしまいが、クローラ―はそんな判別はしない。
4.その他
よろしくお願いします。
A 回答 (3件)
- 最新から表示
- 回答順に表示
No.1
- 回答日時:
WEBサイトを作られているのでしたら、普段からこちらに目を通して
おいたらいかがでしょうか。非常にタメになります。
http://productforums.google.com/forum/#!categori …
さて、ご質問の件ですが、助詞や前置詞を置換しただけではクローラーを
欺くことはできないと思います。理由は、上記サイトによります。
→同じ質問を見た記憶はないのですが
Googlebotを甘く見てはいけません。
回答ありがとうございます。
非常に役に立つサイトを教えて下さり、
ありがとうございました。
今後活用させてもらいたいと思います。
やっぱりそんな単純じゃないですよねw
No.2
- 回答日時:
個人的な推測意見などを求めても意味ありません。
パーサーという考え方を知りましょう。
これはシンプルな話です。
「桃太郎は犬、猿と雉を家来にして鬼退治に出かけました」
「桃太郎が犬、猿および雉を家来と考え鬼退治を目的としました」
「桃太郎は犬を憎み、猿を殺し雉を串焼きにして鬼退治を考えながら家来を募集しました」
は同じものだとみなされます。
この文の中にある、おそらく名詞と思われるものは
桃太郎、犬、猿、雉、家来、鬼退治
です。この組み合わせがあったら、文脈がどうあれ、同じ文章とみなします。
この6語の組み合わせぴったりは、他の文章ではありえません。
「ジュリーはエリーを友達と思っていたが、思わぬことで失望を味わった」
「レーガンはブレジネフを敵と考えたのだが、思わぬことで友情を感じた」
これは文法的にはものすごく似ているのですが、別の文章です。
単語がぜんぜん違います。類似とはみなしません。
意味ではなく、単語、名詞(特に固有名詞)に着目してください。
似ているページの意味が分かります。
パーサーなんて知りませんでした。
・・・なるほど、勉強になります。
文章全体の類似率なんて関係ないんですね。
単語かぁ~。
意味や文章構成が全く違って、同一の単語を使用する事って少なくないですよ。
うーーーん・・・それを考えて文章を作成って難しいですね。
逆に言うと、
漢字→平仮名またはカタカナ、
カタカナ→平仮名
平仮名→カタカナまたは漢字
と、返還した方が良い・・・そう言う事ですね。
・・・果てしなく読み辛い文章になりそうですが(笑
ありがとうございます。
No.3
- 回答日時:
> 漢字→平仮名またはカタカナ、
> カタカナ→平仮名
> 平仮名→カタカナまたは漢字
> と、返還した方が良い・・・そう言う事ですね
これは明らかに違います。Googleはこれらの類似性を把握しています。
具体的に言えば、ミスタイプした語句も推測します。
たとえば、google map または グーグル地図で以下のような検索を
行っても、ある程度考慮して似たような結果を返します。
google msp
google mapa
google lmap
gogle map
google tizu
googloe map
googlr map
google間p
ぐーぐるちず
グーぐる地図
グ0-グルマップ
グーグル・マップ
グーグルンマップ
グ グーグル マップ
他者を真似した同様の内容の場合、どっちがオリジナルと判断するのかは
わかりませんが、姑息な手段でサイトを上位にもっていくことはできないと
考えて下さい。
PS
単なる好学のための質問だったのであれば、ごめんさない。
なるほど、大変勉強になります。
ありがとうございます。
実は純粋に後学の為・・・と言うわけではないのですが、
どの様な文章を書けば、
他の文章と違う意味のある文章と認識してもらえるか・・・
それを考えると、その違いをしっかり考慮していないと、
より正しい文章が書けない為、伺いました。
コピペは当然ダメ
ただ書くだけでもダメ
考えて書かないといけませんので。
ありがとうございます。
大変勉強になりました
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 日本語 「判断文」は「は」、「現象文」は「が」 6 2022/11/19 19:03
- 英語 「名詞+形容詞/現在分詞/過去分詞+to不定詞の副詞的用法」の語順について 7 2022/09/22 05:27
- 英語 総称的意味の「the+過去分詞」が無冠詞複数形で置き換えることができない理由について 5 2022/08/04 10:14
- 英語 提示文の文の構造について 4 2023/01/14 12:52
- 英語 仮主語の「to be+名詞」の和訳について 4 2022/05/07 14:49
- 英語 先行詞の限定詞が所有格の可否と可能な場合の定冠詞との使い分けについて 1 2022/11/30 15:03
- 英語 数量+前置詞/接続詞の解釈について 3 2023/01/10 11:20
- 日本語 <補助形容詞>「ない」という誤りについて 4 2023/06/12 20:39
- 英語 口頭での"the following..."の可否等について 6 2022/08/19 01:01
- 英語 以下の英文法の四択問題について質問です。 The Internet service provider 1 2023/02/01 19:50
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
10億ウォンって日本円でいくら...
-
痴女ってどうゆう意味ですか? ...
-
太宰府天滿宮 求解籤詩
-
「ヘーゼル」ってどんな色の目...
-
アメブロのアクセス分析につい...
-
阪和道に、Nシステムわ、ありま...
-
画家 荒木こうじさんの情報を教...
-
タランチュラは益虫ですか?
-
6日後私の誕生日です 5日後私の...
-
花の名前教えて下さい。
-
原油を汲み上げるポンプの名前
-
今ってwiiuの充電器ってどこで...
-
検索サービスの…
-
これってエラーコインですけ?
-
この画像の右の中国人?巨乳美...
-
上皿天秤
-
山口のフジグラン宇部 フジグラ...
-
ワタシ タチ ハ グーグル ...
-
METAを無視する検索エンジン?
-
神戸でコインランドリー
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
10億ウォンって日本円でいくら...
-
「ヘーゼル」ってどんな色の目...
-
これオーバーフロー
-
太宰府天滿宮 求解籤詩
-
「goo」と「google」 の違い
-
この画像の右の中国人?巨乳美...
-
影、悪、闇、死、血、死神、悪...
-
gooってグーグルと関係あります...
-
現時点ではこのアカウントで Yo...
-
googleのIPアドレス
-
痴女ってどうゆう意味ですか? ...
-
ダクトのラッキング?
-
Gmailで添付ファイル付きメール...
-
googleへの問い合わせメールか...
-
NslookupでIPアドレスだけ出力,...
-
阪和道に、Nシステムわ、ありま...
-
cu ft.って何リットル?
-
googleフォームの回答内容をあ...
-
6日後私の誕生日です 5日後私の...
-
今ってwiiuの充電器ってどこで...
おすすめ情報