Сегодня постараюсь ответить на вопрос, который интересует многих начинающих SEO оптимизаторов: может ли украденный контент ранжироваться выше оригинала.
Может ли украденный контент ранжироваться выше оригинала
Один из самых больших страхов маленького блога — это ранжирование контента в результатах поиска Google и Яндекс. Сложно конкурировать с трастовыми мегасайтами, доминирующими в результатах, поэтому идея кражи контента, вызывающая подобные проблемы, по-настоящему разрушительна.
На самом деле здесь есть о чём беспокоиться, ведь поисковики не идеальны и самостоятельно понять где появился контент изначально они не могут, так как все зависит от скорости индексации. Если у сайта который украл контент, она выше, то первоисточником будет считаться он.
Давайте поговорим об этой проблеме, о том, как Google и Яндекс пытаются ее решить, и что вы можете сделать, если это произошло.
Украли контент сайта что делать
На огромное количество блогов малого бизнеса приходится такое же количество блогов со спамом и плохим контентом. Такие сайты создаются десятками для продажи обратных ссылок или участия в схемах построения ссылок, чтобы поднять денежный сайт какого-нибудь черного маркетолога.
По большей части эти схемы идут вразрез с правилами Google и Яндекс, и когда поисковики определяют сайты как часть спам-сети, они, как правило, деиндексирует их.
Поскольку такие сайты (линкопомойки), как правило, недолговечны, нет смысла создавать их с качественным контентом, за который нужно платить или писать его самому. Вместо этого можно использовать свои поисковые запросы и найти контент, опубликованный на 10-й странице поисковой выдачи или дальше, и просто украсть его.
Иногда, если оригинальному владельцу повезло, мошенник реорганизует контент, чтобы сделать его «уникальным», хотя нет гарантии, что Google и Яндекс не поймут этого.
Вы можете прочитать о политике поисковых систем на их сайте. В частности, Google говорит о сайтах, которые:
- Копируют и публикуют контент с других сайтов без добавления какого-либо оригинального контента или ценности.
- Копируют контент с других сайтов, слегка меняют и публикуют его.
- Воспроизводят ленты контента других сайтов без создания какой-либо уникальной организации или ценности для пользователя.
- Встраивают контент, например видео, изображения или другие медиа, из других сайтов без добавления новой ценности.
Все это помогает уточнить, что является и не является кражей контента.
- Если сайт копирует контент или изображения с другого сайта с указанием принадлежности или без, пока нет существенной добавленной ценности, это считается кражей.
- Если сайт копирует контент с другого сайта и реорганизует его, это все равно считается кражей, если контент опознан.
- Если сайт копирует контент с другого сайта, но добавляет правильную канонизацию и принадлежность, это не кража, это синдикация.
- Если сайт копирует контент с другого сайта, но добавляет ценность, это больше похоже на цитату или агрегатор. Например, наш предыдущий список — это дословная цитата части той самой страницы Google; это не кража, потому что я правильно указал принадлежность и ясно дал понять, что это цитата.
Поясним: если вы публикуете гостевой пост в Yahoo и он синдицирован на другой сайт, Google не оштрафует никого независимо от того, опубликовали ли вы контент на своем собственном сайте или нет. Если вы публикуете контент, а затем находите его на какойтоспамсайт.wordpress.com, то Google, скорее всего, деиндексирует спам-блог.
Украденный контент может повредить сайту, но не всегда. Вопреки распространенному мнению, штрафы за дублирование контента к украденному контенту практически неприменимы. Настоящая угроза появляется тогда, когда украденный контент ранжируется выше оригинального.
Когда украденный контент ранжируется выше оригинала, большая часть трафика, который генерирует этот контент, поступает вору. Оригинал теряет трафик, потенциальные конверсии, репутацию, признание и все другие преимущества блога и публикации в нем этого контента. Если это происходит слишком часто, это существенно разрушает ценность маленького блога. Очевидно, что такое никому не понравится.
Методы Google применяемые к воровству контента
У Google есть элементы алгоритма для предотвращения подобного. Существует мнение, что Google отталкивается от даты публикации контента. Если вы опубликовали контент 1 января, а кто-то копирует этот контент 4 апреля, Google отдаст предпочтение более раннему контенту.
Это похоже на правду, но не совсем так. Google не доверяет вашей дате публикации по ряду причин. Во-первых, легко провести контент задним числом, чтобы казалось, что он опубликован раньше оригинала. Если вы просто смотрите по видимым датам публикации, это больше похоже на слепую веру случайному парню на улице, который сказал, что он президент. Может быть, так и есть, но все признаки указывают на ложь.
Также есть контент с обновленной датой публикации. Если мы создадим контент в 2015 году, а затем обновим его в 2018 году, дата публикации изменится на 2018-й, отражая тот факт, что мы его обновили.
Если кто-то украл контент в 2016 году, тогда украденная версия будет «старше» и получится, будто она оригинал. Конечно, если мы существенно изменим контент, это уже не будет иметь значения, поскольку это не прямая копия, но это все равно может стать проблемой.
Если Google не доверяет дате публикации, что он тогда делает?
Секрет в дате индексирования. Google записывает первый раз, когда нашел контент в интернете. Если этот контент будет потом найден где-то еще, он все равно будет доверять тому сайту на котором контент был найден первым.
Конечно, не все так просто. В Google нет ничего простого. Есть и другие факторы. Возможно, Google сначала проиндексировал более активный спам-блог, что тогда? Возможно, исходный контент был распространен в социальных сетях до публикации в спам-блоге.
Если более старая ссылка указывает на контент, который найден вторым, может быть обновлена дата. Конечно, более старая ссылка должна иметь авторитет — не то чтобы спамер отредактировал ее для своих целей.
Итак, в 99% случаев кража контента должным образом отрабатывается алгоритмом Google. Однако это не 100%, и на самом деле Джон Мюллер подтвердил, что есть «крайние случаи», когда украденный контент может превосходить исходный.
Иногда так бывает с нишевыми ключевыми словами, которые никто не использует, иногда это случается из-за цитируемых фрагментов, а иногда и из-за неправильной синдикации. В сочетании с другими крайними случаями, когда контент дублировался случайно, и вы оказываетесь в сложной ситуации.
Что делать если у крали контент с сайта
Итак, что делать, если ваш контент украден и теперь ранжируется выше вашей версии? Что можно с этим сделать? Я представил некоторые варианты и альтернативы.
Прежде всего, нужно определить, имеется ли факт кражи. Если вы уже нашли свой контент на другом сайте, сделайте этот шаг в любом случае: там может оказаться его намного больше. Рекомендую использовать Copyscape.
Это или любое подобное приложение для обнаружения плагиата проведет проверку и поиск копий вашего контента. Просто загрузите фрагмент контента или целиком (или если платите за Copyscape, то весь сайт) и запустите сканирование.
Если вы не хотите использовать сторонний инструмент, можете использовать Google для поиска фрагментов вашего контента. Важно вводить достаточно длинную цитату, хотя бы одно полное предложение, которое едва ли будет цитироваться, будет уникальным и вряд ли будет создано в другом месте.
Если вы используете слишком общий вариант предложения, вы найдете других людей, которые просто написали то же самое. Если найдете домены, которые копируют ваш контент, запишите их и проанализируйте:
Во-вторых, вам нужно убедиться, что вы не виноваты. Нужно все грамотно проанализировать. В некоторых случаях вы можете случайно скопировать чужой контент. Это часто случается с описаниями продуктов: интернет магазины копируют описания от производителей, вызывая дублирование контента.
Также возможно, что вы написали гостевой пост и не получили никакого ответа, поэтому опубликовали его самостоятельно. Оригинальный сайт, возможно, опубликовал его, но позже, и это была простая ошибка коммуникации, которая привела к дублированию. В этом, по крайней мере, довольно легко разобраться.
В других случаях это может быть скрапер или спамер, как указано выше. Это также может быть случаем неправильной синдикации. Если вы публикуете контент в месте, которое разрешает синдикацию, вступает в силу законное право на повторную публикацию этого контента.
Однако площадка сама решает, использовать ли соответствующую канонизацию. Идеальная канонизация будет указывать на ваш контент в качестве оригинала. «Копия» может по-прежнему ранжироваться выше вас, но, по крайней мере, ваш сайт указан как первоисточник.
Другая возможная причина — обычная кража
Фрилансер может сдать текст, просто копируя уже существующий контент. Такое все еще происходит, несмотря на то, что сданный контент легко перепроверить. Вот почему, если вы принимаете работу от автора, которого не знаете или не доверяете полностью, перед публикацией пропустите контент через что-то вроде Copyscape.
Также возможно, что автор опубликовал свою работу в нескольких местах, что приведет к тому же результату.
На этом этапе вы должны начать документировать все, что можете. Скопируйте ссылки на свой и украденный контент, сделайте скриншоты на случай юридического спора, если спамер попытается скрыть доказательства.
Просмотрите информацию в WHOIS, вдруг сможете найти что-нибудь ещё. Некоторые мошенники достаточно глупы, чтобы использовать настоящие имена в незаконных сделках, что облегчает их поиск. Все это может быть использовано против них в разбирательстве с веб-хостингом, с Google или с юристами.
В-третьих, вы можете связаться с владельцем контента и запросить надлежащее перенаправление или канонизацию. Высококачественные сайты, которые, возможно, непреднамеренно опубликовали украденный контент, с большой вероятностью отреагируют согласием.
Как только вы докажете, что являетесь владельцем контента и опубликовали его первым, они могут либо проставить принадлежность и канонизацию, либо удалить контент. В обоих случаях лицо, ответственное за кражу, скорее всего, будет уволено. Возможно, стоит обратиться к другим публикациям этого копирайтера, чтобы исследовать его работу, если вам захочется разрушить «карьеру» спамера и вора.
Однако во многих случаях контентом владеет спамер, и он просто игнорирует вас. В конце концов, если вы откажетесь от претензий, ему не нужно будет ничего делать. Возможно, если игнорировать проблему, она исчезнет. Он не заботится о о своих сайтах, поскольку у них обычно очень короткая «жизнь».
Если контакт с владельцем не установить, вы можете напрямую связаться с хостером. Например, если контент размещен на WordPress.com, свяжитесь с администраторами WordPress.
WordPress и многие другие веб-хостеры не хотят быть отмеченными как прибежище для владельцев теневых сайтов или мошенников — это негативно отражается на их репутации и вредит их бизнесу, поэтому они отключат страницу или сайт после расследования.
Если хостер игнорирует вас или отклоняет ваш запрос, вы можете написать напрямую в Google или Яндекс. Фактически вы должны сделать это сразу же в сочетании с другими вариантами. Google разрешает сообщать о веб-спаме через свою форму, и если вы каким-то образом пострадали от штрафов за дублирование контента, то можете подать запрос на повторную проверку, приложив доказательства кражи контента.
Если все это провалилось, рассмотрите возможность подачи официального судебного иска. Причина, по которой мы не рекомендуем немедленно подавать иск, заключается в том, что многие компании просто пригласят адвоката защищать себя, а не будут предпринимать какие-то действия.
Простое «О, извините, мы это уберем» затянется из-за юридической тяжбы. Тем не менее, если вам необходимо подать иск о защите авторских прав, вы можете сделать это с помощью адвоката по защите авторских прав. Это решит вашу проблему наверняка.
Лучший способ защиты своего контента от воровства:
Вместо заключения
Хотите выйти в ТОП10 Яндекс и долго там оставаться? Продвигайте свои сайты и интернет-магазины исключительно белыми SEO методами! Не умеете? Могу научить! Тем, кто хочет разобраться во всех премудростях SEO, предлагаю посетить мои курсы по SEO обучению, которые я провожу индивидуально, в режиме онлайн по скайпу.
Для тех, у кого нет времени проходить обучение и самостоятельно заниматься продвижением своих интернет-магазинов, предлагаю и в этом вопросе помощь. Я могу взять ваш сайт на SEO продвижение и за несколько месяцев вывести его в ТОП10 Яндекс.
Для того чтобы убедиться в моей экспертности, предлагаю ознакомиться с моими последними SEO кейсами и только после этого заказать у меня SEO продвижение. Ниже на видео один из примеров успешного продвижения строительного сайта в Санкт-Петербурге.