Дублювання контенту: що це таке і як із цим боротися

22.12.2015
Дублювання контенту: що це таке і як із цим боротися
Автор:

Копія — завжди менш цінна, ніж оригінал. З копіями буває купа клопотів, а іноді навіть проблеми з законом! Але сьогодні не будемо про це, а поговоримо про копії контенту в інтернеті. Вияснимо, з яких причин виникає дублювання контенту, до чого воно призводить і як це все вирішувати.

Що таке дублювання контенту?

Цей термін говорить сам за себе. Дублювання контенту — це наявність однакових текстів у різних місцях (за різними URL-адресами) в інтернеті. Контент може збігатися повністю або частково. Пошуковим роботам при цьому доводиться нелегко! Вони повинні розбиратися з ідентичними текстами і вирішувати, яка версія більше заслуговує на те, щоб бути проіндексованою і показаною в результатах пошуку. Ваші сторінки можуть змагатися за увагу Google’а зі сторінками ваших конкурентів, а також з вашими власними. Таким чином, дублювання контенту може призводити до втрати позицій та трафіку. Спокій! Все це може виправити.

Що спричиняє дублювання контенту?

Вирішення будь-якої проблеми починається з визначення причини. Контент може дублюватися з багатьох причин — як технічного характеру, так і пов’язаних з людським фактором. Давайте розглянемо деякі з найбільш розповсюджених причин.

  • Розповсюдження контенту. Ваш контент може розповсюджуватись на інші сайти, якщо ви маєте такі домовленості з ними, або ж навіть без вашої згоди. На жаль, немає гарантії, що пошукові системи віддадуть перевагу оригіналу.
  • ID сесій користувачів. При відвідування вашого сайту користувачі отримують ID сесій, що генерують нові URL-и. Це також означає дублювання контенту.
  • Версії для друку. Якщо у ваших сторінок є спеціальні версії для зручного друку на принтері, вони можуть розглядатися пошуковими системами як продубльовані сторінки.
  • Версії з або без WWW. Якщо у вашого сайту є версія з WWW, а також версія без WWW, і обидві версії доступні без 301 редиректу, це може іноді плутати пошукові системи.
  • Архітектурні помилки. Коли до однієї сторінки ведуть різні шляхи, це також може стати причиною дублювання контенту. Наприклад:
  1. веб-адреси з get-параметрами (http://www.site.com/prod=1&type=6 веде на ту саму сторінку (http://www.site.com/type=6&prod=1);
  2. сторінки пагінації (http://site.com/blog/?page=1, http://site.com/blog/?page=2, http://site.com/blog/?page=3);
  3. веб-адреси в різних регістрах (http://site.com/blog/duplicates, http://site.com/blog/DUBLICATES);
  4. веб-адреси зі слешем чи без нього (http://site.com/blog/duplicates, http://site.com/blog/duplicates/).

Як визначити дублювання контенту?

Використовуючи інструмент CopyScape, ви отримаєте список веб-адрес із ідентичним або схожим контентом. Це включає продубльовані сторінки в межах вашого сайту або на інших сайтах.

Вирішення проблеми дублювання контенту

Тепер давайте перейдемо до найкорисніших способів боротьби з копіями контенту.

  • 301 Redirect. Встановлення 301 редиректу з продубльованої сторінки на правильну, оригінальну сторінку — чудове рішення в багатьох випадках..
  • Теги rel="canonical". Використовуючи елемент лінку rel=canonical, ви оголошуєте пошуковим системам, яка саме версія є “канонізованою”, тобто єдиною, яку потрібно брати до уваги при індексуванні.
  • Файл robot.txt (disallow). Файл robots.txt можна використовувати, щоб заборонити Google’у та іншим пошуковим системам заходити на дубльовані сторінки вашого сайту.
  • Теги noindex/nofollow. Метатеги noindex/nofollow повідомляють пошуковим системам, що текст або його частину не треба індексувати, а за лінками не треба переходити..
  • Вирішення “WWW-питання”. Якщо у ваших сторінок є версія з WWW і версія без WWW, оберіть один варіант, а з іншого варіанту поставте редирект.
  • Обережне поширення контенту. Якщо ви поширюєте контент за власною згодою, ось способи захистити своє “авторство”:
  1. Завжди публікуйтеся на власному сайті як мінімум за тиждень до того, як поширите цей контент далі. Зазвичай це допомагає пошуковим системам визначити, що оригінал — саме у вас. Але якщо інший сайт більш потужний, а також з деяких інших причин, це може не спрацювати. 
  2. Хоча б трохи змінюйте текст перед поширенням, щоб він не був ідентичним.
  3. Використовуйте беклінки на ваш сайт (або наполягайте на їх використанні іншою стороною), щоб показати пошуковикам, звідки цей контент.

Сподіваємось, ці поради будуть корисним! В будь-якому випадку, щоб почистити сайт від дубльованого контенту, ви завжди можете звернутися до сапорт-служби Drudesk, яка займається вдосконаленням сайтів та вирішенням різного роду проблем на них. Бажаємо вам ніколи не дублювати контент — краще подвоюйте свої прибутки! ;)

Голосів: 1 Рейтинг: 5

Також по темі

1

Давайте поговоримо про веб-розробку з любов'ю :) Зустрічайте блог від нашого гостя Даніеля Маттея, в якому він пропонує як мінімум 6 причин любити таку чудову систему керування контентом, як...

3

Існує багато методів і факторів, що використовуються для просування сайтів в Яндексі. Сьогодні ми поговоримо як саме просунути сайт в Яндексі після відміни впливу посиланнь.

4

Нещодавно компанія SearchMetrics провела щорічне дослідження, в ході якого проаналізувала головні фактори ранжування в Google. Результати виявилися досить цікавими.

5

Переоптимізація веб сторінок часто призводить до того, що сайти втрачають свої позиції у видачі. Уникнути цього можна скориставшись нашими порадами.

Subscribe to our blog updates