Копія — завжди менш цінна, ніж оригінал. З копіями буває купа клопотів, а іноді навіть проблеми з законом! Але сьогодні не будемо про це, а поговоримо про копії контенту в інтернеті. Вияснимо, з яких причин виникає дублювання контенту, до чого воно призводить і як це все вирішувати.
Що таке дублювання контенту?
Цей термін говорить сам за себе. Дублювання контенту — це наявність однакових текстів у різних місцях (за різними URL-адресами) в інтернеті. Контент може збігатися повністю або частково. Пошуковим роботам при цьому доводиться нелегко! Вони повинні розбиратися з ідентичними текстами і вирішувати, яка версія більше заслуговує на те, щоб бути проіндексованою і показаною в результатах пошуку. Ваші сторінки можуть змагатися за увагу Google’а зі сторінками ваших конкурентів, а також з вашими власними. Таким чином, дублювання контенту може призводити до втрати позицій та трафіку. Спокій! Все це може виправити.
Що спричиняє дублювання контенту?
Вирішення будь-якої проблеми починається з визначення причини. Контент може дублюватися з багатьох причин — як технічного характеру, так і пов’язаних з людським фактором. Давайте розглянемо деякі з найбільш розповсюджених причин.
- Розповсюдження контенту. Ваш контент може розповсюджуватись на інші сайти, якщо ви маєте такі домовленості з ними, або ж навіть без вашої згоди. На жаль, немає гарантії, що пошукові системи віддадуть перевагу оригіналу.
- ID сесій користувачів. При відвідування вашого сайту користувачі отримують ID сесій, що генерують нові URL-и. Це також означає дублювання контенту.
- Версії для друку. Якщо у ваших сторінок є спеціальні версії для зручного друку на принтері, вони можуть розглядатися пошуковими системами як продубльовані сторінки.
- Версії з або без WWW. Якщо у вашого сайту є версія з WWW, а також версія без WWW, і обидві версії доступні без 301 редиректу, це може іноді плутати пошукові системи.
- Архітектурні помилки. Коли до однієї сторінки ведуть різні шляхи, це також може стати причиною дублювання контенту. Наприклад:
- веб-адреси з get-параметрами (http://www.site.com/prod=1&type=6 веде на ту саму сторінку (http://www.site.com/type=6&prod=1);
- сторінки пагінації (http://site.com/blog/?page=1, http://site.com/blog/?page=2, http://site.com/blog/?page=3);
- веб-адреси в різних регістрах (http://site.com/blog/duplicates, http://site.com/blog/DUBLICATES);
- веб-адреси зі слешем чи без нього (http://site.com/blog/duplicates, http://site.com/blog/duplicates/).
Як визначити дублювання контенту?
Використовуючи інструмент CopyScape, ви отримаєте список веб-адрес із ідентичним або схожим контентом. Це включає продубльовані сторінки в межах вашого сайту або на інших сайтах.
Вирішення проблеми дублювання контенту
Тепер давайте перейдемо до найкорисніших способів боротьби з копіями контенту.
- 301 Redirect. Встановлення 301 редиректу з продубльованої сторінки на правильну, оригінальну сторінку — чудове рішення в багатьох випадках..
- Теги rel="canonical". Використовуючи елемент лінку rel=canonical, ви оголошуєте пошуковим системам, яка саме версія є “канонізованою”, тобто єдиною, яку потрібно брати до уваги при індексуванні.
- Файл robot.txt (disallow). Файл robots.txt можна використовувати, щоб заборонити Google’у та іншим пошуковим системам заходити на дубльовані сторінки вашого сайту.
- Теги noindex/nofollow. Метатеги noindex/nofollow повідомляють пошуковим системам, що текст або його частину не треба індексувати, а за лінками не треба переходити..
- Вирішення “WWW-питання”. Якщо у ваших сторінок є версія з WWW і версія без WWW, оберіть один варіант, а з іншого варіанту поставте редирект.
- Обережне поширення контенту. Якщо ви поширюєте контент за власною згодою, ось способи захистити своє “авторство”:
- Завжди публікуйтеся на власному сайті як мінімум за тиждень до того, як поширите цей контент далі. Зазвичай це допомагає пошуковим системам визначити, що оригінал — саме у вас. Але якщо інший сайт більш потужний, а також з деяких інших причин, це може не спрацювати.
- Хоча б трохи змінюйте текст перед поширенням, щоб він не був ідентичним.
- Використовуйте беклінки на ваш сайт (або наполягайте на їх використанні іншою стороною), щоб показати пошуковикам, звідки цей контент.
Сподіваємось, ці поради будуть корисним! В будь-якому випадку, щоб почистити сайт від дубльованого контенту, ви завжди можете звернутися до сапорт-служби Drudesk, яка займається вдосконаленням сайтів та вирішенням різного роду проблем на них. Бажаємо вам ніколи не дублювати контент — краще подвоюйте свої прибутки! ;)