重複コンテンツとオリジナルコンテンツ

重複コンテンツは良くない?起こる問題と対処法について

重複コンテンツとオリジナルコンテンツ

SEO対策を徹底して、自社サイトやブログの検索順位をアップさせたい方も多いのではないでしょうか?

本記事では、重複コンテンツがSEOに与える影響や問題点を解説してきます。実際のところ、重複コンテンツをどのように調べれば良いのかや、重複コンテンツを作らないための方法もご紹介します。

そもそも重複コンテンツが具体的に何を意味するのか分からない方に向けて、例も交えて説明していきますのでぜひ最後まで読んでみてください。

重複コンテンツとは

重複のイメージ

重複コンテンツは、自サイト内または他サイトにある内容が非常に似たコンテンツを指します。

よく問題になる故意の「パクリ記事」に限らず、意図せず重複コンテンツと認識されることがあるということは、あまり知られていません。自サイト内(同一ドメイン)でも重複コンテンツが発生してしまうのはこのためです。

Google Search Consoleでは以下のように記述されています。

一般に、重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。多くの場合、偽装を意図したものではありません。

引用元:重複するコンテンツ – Search Console ヘルプ

重複コンテンツはなにが問題?

重複コンテンツによる問題イメージ

重複コンテンツは良くないと言うけれど、具体的にどのような問題があるのでしょうか?ここでは重複コンテンツがもたらす問題点を4つご紹介します。

著作権侵害になる可能性がある

他サイトのコンテンツをまるごとコピーして自サイトのコンテンツかのように公開している時、重複コンテンツと判断される可能性が非常に高いです。この場合は著作権侵害にあたります。

SEOで評価が下がるのはもちろん、法的措置をとられかねませんので、コピーコンテンツを作るのはやめましょう。

Webサイトに限らず著作権侵害による逮捕者は頻繁に出ています。

参考:著作権侵害事件 _ ACCS

検索結果に表示されなくなる

重複コンテンツが、検索結果に並んで表示されることはほとんどありません。

同じ内容のコンテンツが一緒に検索結果に表示されていると、ユーザーは複数ページを行ったり来たりすることになり、手間がかかります。Googleのアルゴリズムは検索ユーザーの利便性を重要視しているため、利便性を損なう重複コンテンツは検索結果に表示されにくくなります。

被リンク評価の分散によってページの評価が下がる

自サイトに重複コンテンツが存在する場合、SEOに有効とされている被リンクの評価が分散され、ページの評価が下がる場合があります。

内容が同じページが複数あれば、その分被リンクも分散されてしまいます。それらの被リンクが1つのページに集まっていたら、そのページの評価は分散したものより高くなります。

たとえ良質なコンテンツを公開していたとしても、似たものがいくつもあれば、被リンクが散らばってどれも中途半端な被リンク評価しか受けられなくなってしまうので勿体無いです。

特にニッチなテーマに特化したサイトでは、思いがけずコンテンツの内容が似てしまうことがあります。定期的にサイトの記事構成の見直しやリライトを行うことをおすすめします。

サイト全体がペナルティを受ける

他サイトの重複コンテンツばかりで構成されているサイトは、スパムと判断されてサイト全体がペナルティを受ける可能性があります。

どんなWebサイトでも、基本的に引用や参考として他サイトとコンテンツが重複してしまうことはあり得ます。Googleもそのような重複が発生することは考慮してアルゴリズムを組んでいるので、少し引用するだけでペナルティを受けるということはまず無いでしょう。

このサイトはほぼ100%パクリと言われる故意的な重複で無い限り、ペナルティを受ける可能性は低いので、あまり警戒しすぎる必要はありません。あくまでユーザーにとって有益なコンテンツを作成しましょう。

重複コンテンツの例

重複コンテンツの例を箇条書きする

重複コンテンツによって、SEOの面でいくつかデメリットがあることはご理解いただけたかと思います。

続いて、コンテンツが重複するとはどのような状態を表すのか、具体例を4つご紹介します。

ドメイン内「」の有無

サイトのドメイン名に、「www」が付いているものと付いていないもの両方で同じページにアクセス可能な場合、重複コンテンツとして扱われてまいます。

近年のブログやWebメディアの主流はwwwなしです。この場合は「http://○○○.jp」のようなwwwなしのURLを正規化する必要があります。リダイレクトの設定やcanonicalタグの設置などいくつかの方法を使うことで、URLを統一することが可能です。

異なるURLで同一ページが表示される

Webサイトの中には、動的URLによって異なるURLで同じページが表示されている場合があります。この場合も検索エンジンのクローラーが重複コンテンツと判断してしまう可能性が高いです。

特にWordPressを利用してサイト運営をされている方は、URLの末尾に「/?p=〇〇」「/?tag=〇〇」「/?cat=」といった文字が追加されているのを見たことがあるのではないでしょうか?

WordPressは、デフォルト設定でこれらのパラメーターを付与してURLを生成するようになっていますので、パーマリンク設定を変更するのが望ましいです。

同じ文章を複数ページで繰り返し使っている

定型文のような形で同じ文章を複数ページで繰り返し使っている場合も、重複コンテンツと判断されてしまいます。1ページあたりの文字数ばかりを考えて、定型文を使い回すのはやめておきましょう。

PCサイトとスマホサイトでURLが異なる

Webサイトの中には、PC用サイトとスマホ用サイトでURLを別々にしているものがあります。例えばPC用は「http://〇〇.com/pc」スマホ用は「http://〇〇.com/sp」というようなものです。

PC用・スマホ用共にコンテンツの中身が同じであると、この2つのURLも重複コンテンツと判断されかねません。この問題はcanonicalタグとalternateタグの設定や、レスポンシブ対応によって対策できます。

重複コンテンツの確認方法

重複コンテンツを確認する方法は大きく3つあります。

Google Search Consoleを使う

自サイト内に重複コンテンツがないか確認するには、Google Search Consoleが便利です。新しいGoogle Search Consoleでは、「手動による対策」でペナルティのチェックをすることで確認できます。

重複コンテンツチェック_googlesearchconsole

Google Search Consoleは、検索クエリをチェックしたり、インデックス登録するツールという認識がある方が多いかもしれませんが、重複コンテンツの確認やURLの正規化まですることができるツールですので、ブログ・サイト運営者の方は使いこなせるようになって損はないでしょう。

自サイトのオリジナル文章でGoogle検索してみる

オリジナルの文章を一部コピーしてGoogle検索にかけてみるという方法は、他サイトに重複コンテンツがないか探す方法の一つです。

アナログ的ではありますが、検索結果で自サイトよりも上に他サイトの記事が出てきたらコピーコンテンツを疑っても良いでしょう。

もちろんドメインパワーが強い大手サイトや、より有益なサイトが上に表示されることもありますので、全てを疑うのではなくページをチェックしながら怪しいものがないか探してみてください。

sujiko.jp」を使う

sujiko.jpサイトキャプチャ

sujiko.jpには3つの機能があります。

1つ目は「類似ページ判定」です。予め2つの類似ページが分かっている状態でコンテンツの重複度合いを調べることができます。

2つ目は「サイト内類似ページ判定」です。調査したいページとそのサイトのトップページを入力することで、そのサイト内で類似判定されたページとの「タイトル類似度」「HTML類似度」「本文類似度」等を調べることができます。

3つ目は「サイト外類似ページ判定」。次サイトのページURLを入力することで、サイト外にある類似ページを調べることができます。サイト内類似ページ判定と同様にいくつかの項目から総合判定が表示されますので、類似度「高」となっているサイトは要チェックです。

重複コンテンツの対処法

重複コンテンツの対処をする

重複コンテンツが見つかったら何かしらの手を打たなければいけません。重複をなくすためにするべきことを3つご紹介します。この3つは全て行う必要はなく、重複コンテンツの種類によって対処法が異なりますので、あなたのサイトの状況に適した対策を行ってください。

noindex設定をする

htmlに詳しくなくてもブログやWebメディアに携わる方なら、”noindex”という言葉を一度は聞いたことがあるのではないでしょうか。

サイト内に重複コンテンツがある時、ユーザーにとってより有益なページをindexさせて検索結果に表示させるべきですね。したがって、有益性が低いと考えられるページをnoindexに設定し、検索エンジンが認識しないようにしましょう。

canonicalタグを使う

重複コンテンツページにcanonicalタグを設置することで、検索エンジンはタグに記述されたURLが正しいものだと判断します。

後述する301リダイレクトとよく比較されるのですが、canonicalタグは、指定したページにアクセスできなくなるわけではないので、クローラーに評価してほしくはないけれど、ユーザーからのアクセスは可能にしておきたい場合に利用します。

301リダイレクトを使う

301リダイレクトは、指定したURLへアクセスがあった時、自動的に正規のURLへリダイレクトできる機能で、wwwの有無による重複コンテンツ判定の対策でよく使われる方法です。

301リダイレクトを使用すると、クローラーに評価されない上、ユーザーはアクセスできなくなります。この方法は、ドメイン移管を行った際や記事を作り直した場合にも使うことができます。

WordPressでサイト運営をしたいる方は、プラグインを使って簡単に設定することも可能です。

重複コンテンツを増やさないためにできること

SEO対策でできること

重複コンテンツを増やさずサイト運営を続けていくポイントは以下の2つです。

オリジナルコンテンツを作り続ける

Google公式ヘルプには以下のような言葉があります。

高品質のソースからのものであるとしても、無断で複製しただけのコンテンツは、サイトで他の役立つサービスやコンテンツを提供しない限り、ユーザーに付加価値を提供するとはいえません。他のサイトと差別化する独自のコンテンツを作成するために時間を使う方が有意義です。

引用元:無断複製されたコンテンツ – Search Console ヘルプ

つまり、どれだけ良質な情報だとしても、それがコピーコンテンツだとすれば、ユーザーに付加価値を提供しているとは言えないということです。既存のサイトよりも有益性が高いオリジナルコンテンツを作り続けましょう!

他サイトからの引用を必要以上に使わない

他サイトのコンテンツを引用するのは程々にしておきましょう。Webサイト上にある情報全てが一次情報であることはあり得ないので、部分的に重複コンテンツが発生することは仕方がないことです。

Googleもこれらをむやみにスパム認定することはないと話しています。

参照:「重複コンテンツはスパムでGoogleにペナルティを受ける」は、なぜ間違いなのか _ 海外SEO情報ブログ

ただし、重複コンテンツが多いと検索エンジンの評価が下がることは事実です。故意ではない重複コンテンツにも対処しながら、できるだけ重複コンテンツを少なくしてサイトの評価を最大化しましょう。

おわりに

今回は、重複コンテンツの例や起こる問題、解決策についてご紹介しました。

いわゆるパクリコンテンツを意味するだけでなく、ドメイン(wwwの有無)やパラメーター等によるURLの問題で、重複コンテンツと判断される可能性があることをご理解いただけたかと思います。

自サイト内で解決できる重複コンテンツ問題は、タグの設置で対処できるケースがほとんどです。SEOを強化してアクセス数を増やしていきたいという方は、重複コンテンツにもしっかり向き合って対応していきましょう。

WEBでのお問い合わせはこちら