Дубли — это страницы с полностью или частично повторяющимся контентом сайта. Они могут быть четкие (явные, полные) и нечеткие (неявные, неполные).
Четкие дубли полностью повторяют контент. Это идентичные страницы, находящиеся по разным адресам. Нечеткие дубли — это частичное повторение контента на нескольких страницах.
Чем опасны дубли? Во-первых, их не любят поисковые системы. За наличие дублей на сайт могут быть наложены санкции. Во-вторых, дубли меняют релевантность страницы в сторону ухудшения. Поисковик может посчитать дубль более релевантным, чем продвигаемая вами страница, что повлияет на выдачу. В-третьих, дубли влияют на уникальность контента в целом.
В-четвертых, наличие дублей влияет на статический вес страниц. Дубли могут оттягивать его на себя от продвигаемой страницы. И в-пятых, наличие дубля замедлит индексирование вашего сайта роботами.
Выявление дублей осуществляется несколькими способами:
- посредством выгрузки всех страниц сайта при помощи программ Page Weight и Netpeak Spider. Netpeak Spider является бесплатной программой, Page Weight — платная. Сопоставляем выгруженные страницы с проиндексированными Яндексом и Google при помощи оператора site:www.site.ru. Подставляя наименование сайта, который вы хотите проверить, вбиваем его поочередно во все поисковые системы, в которых осуществлялась индексация. Сравниваем количество проиндексированных страниц с теми, что есть на сайте, и делаем выводы о наличии или отсутствии дублей
- посмотреть количество проиндексированных страниц можно также в сервисе rookee.ru либо установить и использовать плагин для браузеров RDS Bar.
- можно также проанализировать выдачу вручную, обращая внимание на title страниц, сниппеты и адреса, выявляя повторяющиеся элементы
- не выгружая страницы, можно увидеть дубли в следующих программах: Page Weight, Netpeak Spider и Xenu Link