Что такое дублированный контент на сайте?

admin55
12 Ноя 2024, 22:10

162

Вероятно, вы довольно часто сталкиваетесь с определением «дублированный контент», но что это? Дублированным называют контент, размещенный в нескольких местах, скажем по URL-адресам. Такой контент может негативно сказаться на ранжировании, и многие говорят, если увлечься его копированием, можно даже схлопотать бан от Google. Однако это не правда. Google не предусматривает наказаний за повторяющийся контент, но при обилии такого контента может снизить его значимость.

Что же такое дублированный контент?

К дублированному контенту относят весь контент, размещенный в нескольких местах на вашем сайте либо за его пределами. Его часто можно найти по другим URL-адресам, а иногда даже на другом домене. По большей части дублирование контента происходит непреднамеренно или является результатом плохой технической реализации. К примеру, ваш сайт доступен как в www, так и в ее аналогах, или же, о ужас! …к нему можно в равной степени получить доступ посредством протоколов HTTP и HTTPS. Или, как вариант, ваша CSM в чрезмерной степени использует динамические параметры URL и тем самым вводит в заблуждение поисковые системы. Даже ваши страницы с AMP, не сошлись на них должным образом, могут рассматриваться в качестве повторяющихся. Дублированный контент он повсюду.

Google дает свое определение дублированному контенту:

Повторяющимся контентом обычно называют большие блоки информации в рамках одного или нескольких доменов, содержание которых либо полностью совпадает, либо почти не отличается. Как правило, в данном случае не преследуется цель ввода пользователя в заблуждение.

Последнее особенно важно. Если вы отыскиваете информацию, копируете ее, а потом выдаете за свою (Google определяет ее, как скопированный контент) с целью ввести в заблуждение поисковую систему и улучшить свое ранжирование, вы ходите по краю.

Google предупреждает, что подобный злой умысел может вызвать ответные действия:

Наличие на сайте повторяющегося контента не является основанием для принятия каких-либо мер по отношению к нему. Такие меры применяются только в том случае, если это сделано с целью ввести пользователей в заблуждение или манипулировать результатами поиска.

Документация Google также является кладезем для работы с дублированным контентом на сайте.

Дублированный, скопированный, или же бедный по содержанию контент. Что лучше?

Тема затрагивающая дублирование контента у многих вызывает замешательство. Основная масса дублированного контента по мнению Google имеет техническую природу, но содержимое поисковик так или иначе проверит. «У меня есть два URL-адреса для одной и той же статьи. Какой мне лучше выбрать?». Сейчас большинство обычных людей вероятно подумают о фрагментах схожей информации местами встречающейся на сайте. «Этот фрагмент текста я разместил в нескольких местах, это так плохо?». Весь контент, о котором идет речь является дублированным, но, чтобы определиться с ранжированием поисковые системы разграничивают дублированный, скопированный и бессодержательный контент.

Дублированный вами контент может быть классифицирован как скопированный в случае, если вы быстро перефразируете уже существующий текст с целью разместить его на своем сайте. И не важно, перекрутите ли вы содержимое или добавите несколько ключевых слов, подобное поведение неприемлемо. Добавьте пару страниц бессодержательного контента (страниц содержимое которых оставляет желать лучшего), и вы окажетесь в опасном положении. На кону качество вашего сайта, и подобная тактика может серьезно ему навредить. Помните алгоритм Panda?

Не блокируйте дублированный контент на своем сайте

Google очень привержено относится к обнаружению и обработке дублированного контента. Поисковая система достаточно умна, чтобы понимать, как стоит поступать с большей частью выявленного ей дублированного контента. Выявив множество вариантов страницы, она отнесет их к наиболее популярной (в большинстве случаев она и будет являться оригинальной статьей/страницей). Однако, для этого понадобится полный доступ к тем URL-адресам, на которых эти страницы находятся. Если вы, используя файл robots.txt, заблокируете Googlebot возможность поиска этих URL адресов, он перестанет воспринимать их, а это может быть чревато тем, что Google станет относится к соответствующим страницам, как к обособленным. Вам следует проделать следующие действия:

Позвольте роботам сканировать эти URL адреса
Пометьте контент, как дублированный с помощью атрибута rel=canonical (узнайте больше об этом далее по тексту)
Используйте принадлежащий Google инструмент URL Parameter Handling для определения параметров, требующих вашего внимания
Используйте 301 редиректы для перенаправления пользователей и поисковых роботов на канонический URL

Для борьбы с дублированным контентом на вашем сайте вы можете сделать больше прочитав статью дублированный контент: причины и решения.

Используйте rel=canonical!

В вашем арсенале для борьбы с дублированным контентом, одним из самых важных инструментов является атрибут rel=”canonical” . Этот фрагмент кода можно использовать для указания того, какой URL адрес является оригинальным для определенного контента, некоего URL адреса, который мы называем каноническим. У нас есть отличное и полное руководство по rel=”canonical”, в котором вы найдете все, что вам нужно об этом знать.

Сфокусируйтесь на оригинальном, свежем и заслуживающем доверия контенте

Еще одним инструментом в вашем боевом арсенале против дублированного, скопированного и неоригинального контента являются ваши навыки письма. Google фокусируется на качестве. Поисковая система всегда пребывает в поиске наилучшего доступного контента, как можно лучше соответствующего ожиданиям пользователей. Ваша цель должна заключатся не в быстром заработке, а в том, чтобы произвести неизгладимое впечатление. Остерегайтесь несодержательного контента и сделайте так, чтобы он стал оригинальным и качественным.

То же самое относится и к похожему контенту вашего сайта. Мы уже обсуждали каннибализм ключевых слов, и это сродни ему. Объединяя несколько сопоставимых постов в один, можно добиться намного лучших результатов как с точки зрения ранжирования, так и в борьбе с дублированным контентом.

Вот что Google думает по поводу схожего контента:

Уменьшите количество похожего контента. Если на вашем сайте много похожих страниц, добавьте на каждую из них уникальный контент или объедините их в одну. Предположим, у вас туристический сайт с отдельными страницами для двух городов, где представлена одна и та же информация. Вы можете вместо них разместить страницу с описанием обоих городов, или добавить на каждую, уникальные материалы.

Дублированный контент повсюду-знайте, что с ним делать

Бывший сотрудник компании Google Мэтт Каттс однажды заявил, что 20% — 30% ресурсов в Интернете представляют собой дублированный контент. Хотя у меня и нет уверенности в том, что эти цифры все еще актуальны, дублированный контент продолжает появляться на каждом сайте. Нет нужды воспринимать эту новость как плохую. Исправьте то, что в ваших силах и не пытайтесь превратить дублированный контент, родственные ему скопированный и бессодержательный контент, в жизнеспособную SEO-стратегию.

Оригинал статьи