SEOコンサルティングを見る

重複コンテンツとは?割合や基準・避ける方法やチェックツールも紹介

自社のサイトの流入数・問い合わせ件数を増やすためには、ペナルティを受けない正しいSEO対策の進め方を知っておくことが大切です。サイト運用をする際に多くの方が招きやすいトラブルの一つに、重複コンテンツが挙げられます。

重複コンテンツには、サイトを正常にクロールしてもらえない・被リンクの評価が分散するなど、多くのデメリットが存在します。重複コンテンツを放置し続けると、サイト運用の妨げになることが少なくありません。

この記事では重複コンテンツの概要・Googleによる見解から、重複コンテンツと判断される基準、避ける方法やチェックツールまでを紹介するので、ぜひ参考にしてください。

目次

この記事を書いた人

杉岡玲生

ウェブココル(株)の代表取締役社長。A8.net国内報酬月間ランキング1位を達成後、SEO会社を起業。 机上の空論でない、現場で結果を出し続けるSEOコンサルティングが強み。得意領域は店舗向けの地域KWでの検索順位UPおよびSEOメディア構築。
Twitter:@reonald_seo

重複コンテンツとは?

重複コンテンツとは、他のコンテンツとタイトル名やテキスト文章などの内容がほぼ同じコンテンツのことを指します。別名では「コピーコンテンツ」と呼ばれています。

主に運営期間が長く記事コンテンツを多く生成しているサイトで起こりやすいトラブルです。コンテンツ制作が定型化してくると同じようなコンテンツが増えるため、重複コンテンツにつながりやすくなります。

重複コンテンツが多いサイトでは、SEOに与えるマイナス面が多く、正常にサイト運営ができなくなります。サイト流入数の減少につながるケースも珍しくありません。

この重複コンテンツを防ぐためには、タイトル名をアレンジしたり、テキスト文章の内容を別視点で書いたりするなど、既存コンテンツと重複する箇所を減らすことが大切です。

Google developerページによる重複コンテンツへの見解

重複コンテンツに対する見解は、Google developerページで確認できます。重複コンテンツは、「Googleペナルティになる重複コンテンツ」と「悪意のない重複コンテンツ」の2つが挙げられます。

ここでは、Googleペナルティの原因になる2つを解説するため、サイトに重複コンテンツがあるのかをチェックしたい方は参考にしてください。

Googleペナルティになる重複コンテンツの例

Googleでは、無断複製したコンテンツをペナルティになる重複コンテンツと判断します。下記に該当するコンテンツは、Googleペナルティになる重複コンテンツとして扱われるため、制作しないようにしましょう。

無断複製されたコンテンツの例としては、次のようなものが挙げられます。

・他のサイトのコンテンツをコピーし、独自のコンテンツや付加価値を加えることなく転載しているサイト

・他のサイトのコンテンツをコピーし、(語句を類義語に置き換えたり自動化された手法を使用したりして)若干の修正を加えた上で転載しているサイト

・なんらかの独自の体系付けやユーザーへの利便性を提供することなく他のサイトからのコンテンツ フィードをそのまま掲載しているサイト

・ユーザーに実質的な付加価値を提供することなく、他のサイトの動画、画像、その他のメディアなどのコンテンツを埋め込んだだけのサイト

引用:Google検索セントラル「無断複製されたコンテンツ」

基本的には、他のサイトのコンテンツに独自の付加価値を与えることなく制作したコンテンツは、重複コンテンツに該当します。

他のサイトのコンテンツをそのままコピーして自社のサイトに掲載すると重複コンテンツになるという意味です。重複コンテンツは、記事コンテンツだけでなく動画・画像などのメディアも対象になります。

他にも他サイトのコンテンツをコピーして、語句を置き換えたり語尾を変えたりしただけのコンテンツも重複コンテンツの対象です。

例えば、他のサイトで「人口が増えています。」と書かれていたときに、自社のサイトで「人口が増加している状況です。」と書き換えただけでは、Googleに語句を置き換えたり語尾を変えたりしただけのコンテンツと判断されます。

Googleペナルティになる重複コンテンツは価値を生み出しません。サイトに悪影響を与えるだけになるため制作しないでください。

悪意のない重複コンテンツの例

自社のサイト内および複数のドメインで似たようなコンテンツがある場合は、悪意のない重複コンテンツと判断されるケースがほとんどです。次に該当するコンテンツは、悪意のない重複コンテンツに挙げられます。

多くの場合、偽装を意図したものではありません。悪意のない重複コンテンツの例には、以下のものがあります。

・通常ページとモバイルデバイス用の簡易ページの両方を生成するディスカッションフォーラム

・複数の異なるURLで表示またはリンクされるオンラインショップの商品

・ウェブページの印刷用バージョン

引用:Google検索セントラル「重複コンテンツの作成を避ける」

基本的にはユーザーの利便性を高めるために、簡易ページが生成されたり異なるURLで同じページにアクセスできたりするケースは、悪意のない重複コンテンツとして認識されます。

ただし、悪意のない重複コンテンツが増大するとユーザーの利便性が下がることから、サイトに悪影響を与える恐れがあります。サイト運営者は、重複コンテンツと判断されないための対策を知っておくことが大切です。

重複コンテンツを厳しく取り締まる理由

Google検索セントラルでは、重複コンテンツを厳しく取り締まる理由を次のように述べています。

検索エンジンのランキング操作やトラフィックの増大を意図して、コンテンツが複数ドメインにまたがって複製されていることもあります。この種の偽装行為は、ユーザーが検索結果で実質的に同じコンテンツを何度も見ることになり、利便性の低下につながります。

引用:Google検索セントラル「重複コンテンツの作成を避ける」

重複コンテンツが多い場合、サイト内に訪れたユーザーに同じようなコンテンツを何度も見せることになります。サイトの利便性が大きく低下するため厳しく取り締まりされています。

ウェブサイト数は年々増加しており、2022年時点で約19億もあります。ウェブサイトだけでなく重複コンテンツが増え続けると良質な検索結果を導き出す妨げになることも、重複コンテンツの取り締まりが厳しい理由の一つです。

重複コンテンツによって取り締まりを受けたサイトは、特定のコンテンツがインデックスから削除されたり、検索順位が下がったりする恐れがあります。サイト流入数が減少するため、重複コンテンツが見つかった際には早めに対処しましょう。

重複コンテンツとGoogle検索アルゴリズムアップデートの関係

ウェブサイトや重複コンテンツが増えたことが要因で、2011年2月より英語圏でパンダアップデートが導入されました。日本では、同年7月からパンダアップデートが適用されています。

パンダアップデートとは、重複コンテンツをはじめとした低品質なコンテンツが検索順位の上位に表示されにくくするためのアップデートのことです。

ここからは、重複コンテンツとGoogle検索のアルゴリズムアップデートの関係を解説します。

2010年前後に大量の低品質コンテンツの上位表示化が問題視される

インターネットの普及およびウェブサイトやコンテンツの乱立に伴い、2010年前後に低品質コンテンツが大量に上位表示化される問題が起こりました。

低品質コンテンツが上位表示化されるとユーザーの満足度が著しく低下することから、Googleはアルゴリズムアップデートを英語圏では2011年2月に、日本では同年7月に実施しました。

当時、大量の低品質コンテンツを取り締まるために行われたアップデートがパンダアップデートです。パンダアップデートは当初「ファーマーアップデート」と呼ばれていました。

独自性や専門性の低い記事の順位低下

2011年以降、独自性や専門性の低い記事の検索順位は軒並み低下し始めます。2022年7月時点では、独自性や専門性に欠ける記事が上位表示されることは減少しています。

Googleが低品質だと判断する記事は次のとおりです。

  • 独自の情報が盛り込まれていない記事
  • 広告の占める割合が多い記事
  • 他の既存記事と共通する部分が多い記事
  • 外部から被リンクを受けていない記事
  • 内容が薄くユーザーのクエリを解決できない記事
  • SNSなどで共有されていない記事
  • 他のサイトと内容が被っている記事

基本的には、「ユーザーが有益だと感じられない記事=低品質の記事」だと判断してよいでしょう。記事を制作する際は、ユーザーに満足してもらえる情報を盛り込むことが重要です。

重複コンテンツと判断される基準

重複コンテンツと判断される基準は、Googleから明確な指標が出されているわけではありません。

ただし、URLは異なるものの内容が重複しているページ・語順は異なるだけで同じことを紹介しているページは、重複コンテンツに該当する可能性が高くなります。

一般的には、制作した記事と既存の記事の一致率が50%未満であれば、Googleに重複コンテンツと判断されることが少ない傾向です。

一方で、一致率が50%を超える場合は重複コンテンツに該当する可能性が高くなるため、記事の内容・構成などを見直した上で公開することが大切です。

記事の一致率は「https://ccd.cloud/」などのコピーチェックツールを使うと簡単に調べられます。

重複コンテンツと判断されるデメリット

サイト内の記事が重複コンテンツと判断されるデメリットは次のとおりです。

  • 被リンクが分散してしまい評価が下がる
  • 外部サイトの重複はペナルティもある
  • クロール効率が低下し順位が下がる

重複コンテンツと判断されると、サイト流入数が低下する可能性が高くなります。ここからは、重複コンテンツのデメリットを詳しく紹介します。

被リンクが分散してしまい評価が下がる

自社のサイトに重複コンテンツが複数ある場合は被リンクが分散します。一つのページに対して複数のURLが存在すると、「URL1」を被リンクとして扱うサイトや「URL2」を被リンクとして扱うサイトが出てくるケースが珍しくありません。

結果、一つのURLに被リンクが集約できず本来得られるはずだった評価が複数のURLに分散します。評価が分散すると特定のURLで上位表示を狙うことが難しく、サイト流入数を上げることが困難となるでしょう。

Googleが正しく処理して被リンクが分散せずに済む場合もありますが、必ずしも被リンク評価の分散を防げるとは言い切れません。被リンクが分散すると評価を適切に得られなくなるためサイト運営の妨げにつながります。

外部サイトの重複はペナルティもある

サイト内でコンテンツが重複する場合はペナルティに該当しないことから、サイト全体の評価が下がるケースは稀です。しかし、外部のサイトのコンテンツをコピーして自社のサイトに掲載すると、ガイドライン違反となりペナルティを受けます。

ペナルティを受けると、該当するコンテンツが低品質だとGoogleに評価されるだけではありません。

悪質なサイトだと評価され、「ページがインデックスされなくなる」「上位表示しているコンテンツが圏外に飛ばされる」など、サイト運営に大きな被害をもたらします。

他にも、著作権侵害で訴えられる可能性も出てきます。最悪の場合、コピーしたコンテンツ1つで裁判沙汰になる恐れがあるため外部サイトの重複は絶対に気をつけましょう。

クロール効率が低下し順位が下がる

サイト内のコンテンツが重複コンテンツと判断されると、クロール効率が低下して順位が下がる傾向です。

サイト内に重複コンテンツが増えると各ページで内容が類似することから、特定の情報を持つページが相対的に減ります。各ページで内容が重複し合うと、サイト全体が低品質のページを生成する環境になるためクローラに悪影響を及ぼすでしょう。

クローラーのをクロールする能力には限界があります。重複コンテンツが多いサイトでは、クローラーに評価して欲しいページを見つけてもらえない可能性が高くなります。

本来評価されるべきページがクロールされず、なかなかインデックスされないことが少なくありません。クロール効率を高めるためには、重複コンテンツを減らす努力が必要になります。

重複コンテンツと判断される基準は?

Googleは、「複数の異なるURLから同一のコンテンツにアクセスできるのか」を基準に特定のコンテンツが重複コンテンツなのかを判断します。

Googleが重複コンテンツを見つけた際は、重複URLを一つのグループにします。重複URLの中から最適だと判断したURLを選定する傾向です。なお、Googleはコンテンツ量の多さなどをもとに最適なURLを選定します。

ただし、アルゴリズムによって重複コンテンツのURLを選定しているため、最適な条件で必ず処理されるとは言い切れません。サイト運用をする際は、制作したコンテンツが重複コンテンツと判断されないように対策をとりましょう。

重複コンテンツと判断されないための対策

Googleから重複コンテンツと判断されることを防止するためには、次のような対策をとりましょう。

  • 301リダイレクトかcanonicalタグを使う
  • noindexを設定する
  • URLパラメータ設定でクローラーを制御する
  • レスポンシブデザインにする
  • 外部サイトへ削除申請する

ここからは、5つの対策を詳しく解説します。

301リダイレクトかcanonicalタグを使う

特定のコンテンツを重複コンテンツと判断されたくない場合は、301リダイレクトもしくはcanonicalタグを使う方法が有効です。

301リダイレクトとは、特定のページにたどり着いたユーザーを別のページに遷移させる手法です。一方でcanonicalタグとは、重複しているコンテンツのなかで正規化させたいURLをクローラーに伝えるタグのことを指します。

重複コンテンツは、301リダイレクトとcanonicalタグのどちらを使用しても防げます。しかし、コンテンツの内容によって301リダイレクトとcanonicalタグの使い分けが必要です。

重複コンテンツのなかで明らかに低品質ページだとわかる場合は、高品質ページに飛ばせるように301リダイレクトを活用することがおすすめです。

重複しているもののコンテンツがGoogleから評価を受けている場合は、canonicalタグを使って特定のページに評価を統合して重複コンテンツを解消する方法が適しています。

noindexを設定する

重複コンテンツを防ぎたい場合は、noindexを設定することもおすすめです。noindexとは、特定のコンテンツをインデックスさせたくないときに用いる手法のことを指します。

自社のサイト内で低品質かつ被リンクを得ていない重複コンテンツは、301リダイレクトとcanonicalタグよりもnonindexを設定するほうが適しているでしょう。

低品質かつ被リンクを得ていない重複コンテンツは、検索順位に悪影響を及ぼすだけでサイト内に必要ありません。誰が見ても不要なコンテンツだと判断できるときは、サイトから削除することも重複コンテンツを防ぐ手段の一つです。

URLパラメータ設定でクローラーを制御する

重複コンテンツを解消したい場合、サーチコンソールのURLパラメータ設定を用いることも有効です。URLパラメータ設定では、複数あるURLのなかでどのURLを評価対象にするのかを設定してクローラーの動きを制御できます。

ULRパラメータの設定は、サーチコンソールの「以前のツールとレポート」から「URLバラメータ」を選択して行います。

ただし、設定ミスをすると本来評価して欲しいページをクロールしてもらえなくなる恐れがあるため、ULRパラメータの設定は、サーチコンソールやSEOに関する知識がある方に任せたほうが無難です。

レスポンシブデザインにする

PC用とスマホ用のサイトで異なるURLを使用している場合は、レスポンシブデザインへ変更することが適しています。レスポンシブデザインとは、ユーザーが使用する端末のサイズに応じてサイトの表示を最適化させるデザインのことです。

レスポンシブデザインでサイトを運営する場合、PC用とスマホ用のサイトのどちらも同じURLで管理できるためページの重複を防げます。

PC用とスマホ用のサイトで異なるURLを使用する際は、alternateタグを用いてPC用のURLとスマホ用のURLを紐付けると重複を防止できます。

しかし、Googleの見解では同一のサイトで異なるURLを使用することを推奨していません。特別な事情がない限りはレスポンシブデザインを導入することを検討してみましょう。

外部サイトへ削除申請する

サイト運営をする際は、オリジナルコンテンツを制作することが大前提です。他のサイトからオリジナルコンテンツをコピーされたときは削除の申し立てをしてください。

一般的には、コピーコンテンツを掲載しているサイトの問い合わせフォームから削除の申し立てを行います。もし、外部のサイトがコンテンツの削除に応じない場合は、サーチコンソールからGoogleに直接削除の申し立てを行いましょう。

重複コンテンツのチェック方法を紹介

重複コンテンツの有無をチェックする際は、次のいずれかの方法で行います。

  • チェックツール「CopyContentDetector」にて調査
  • 検索にて重複コンテンツ調査コマンドを使用

ここからは、重複コンテンツをチェックする2つの方法を詳しく解説します。

チェックツール「CopyContentDetector」にて調査

重複コンテンツを調べる際は、チェックツールの一つ「CopyContentDetector」を使用することがおすすめです。

CopyContentDetectorはコピペチェックツールとして広く知られており、入力したコンテンツが他のコンテンツと類似していないのかをチェックできます。

CopyContentDetectorを使用する際は、類似率・一致率ともに50%を下回っていれば重複コンテンツではないと判断できます。

ただし、Googleが「類似率・一致率ともに50%未満のコンテンツは重複コンテンツではない」と言っているわけではありません。類似率・一致率は、あくまでも重複コンテンツなのかを判断する一つの指標として捉えてください。

検索にて重複コンテンツ調査コマンドを使用

重複コンテンツは、検索時にコマンドを使用する方法でも確認できます。重複コンテンツの疑いがあるときは、Google検索結果URLの最後に「&filter=0」を追加して再検索をかけます。

通常の検索では、類似したページや重複したページが表示されないようにフィルタリングされています。「&filter=0」は、類似したページや重複したページを除外するフィルターを解除できるコマンドです。

重複コンテンツを手動で簡単に調べたい方は、「&filter=0」を活用してみましょう。

重複コンテンツに関してお困りの方はウェブココル株式会社へ

重複コンテンツとは、タイトルや文章などが他のコンテンツと酷似しているコンテンツのことを指します。重複コンテンツが多いサイトはGoogleから評価してもらいにくく、上位表示が狙いにくくなる傾向です。

外部のサイトのコンテンツをコピーして自社のサイトに掲載する行為はガイドライン違反に該当します。ガイドラインを違反したサイトはペナルティの対象となり、サイト運営を正常にできなくなります。

重複コンテンツに関してお困りの方は、「ウェブココル株式会社」へご相談ください。ウェブココル株式会社では、重複コンテンツの解決だけでなく、最先端のSEO知識をもとにサイト運用の支援を行います。

現在抱えているサイトの悩みを解決するほか、サイト流入数を増やしてビジネスを拡大させたい方は、ウェブココル株式会社へぜひご連絡ください。

\重複コンテンツならお任せ /

目次
閉じる