Решил я закрыть даты публикаций на этом блоге от поисковиков (есть большие основания считать, что публикациям со старыми датами поисковики дают значительно меньше трафика).
Убрали мы их полностью со страниц сайта так, что если искать их по коду странички, то дат нигде нет. Они подгружаются из базы через джаваскрипт. Но не тут то было. Выяснилось, что Гугл продолжает видеть даты:
Я естественно проверил дату переиндексации странички. Страничка переиндексировалась уже после того, как мы скрыли даты. Но факт остается фактом. Гугл продолжает их видеть.
Нами были выдвинуты 3 гипотезы:
Для эксперимента я поменял дату публикации. Была дата "04 сентября 2017", стала "26 октября 2017". Плюс, выяснилось, что дата присутствует в XML-карте сайта (в поле lastmodified). Т.к. публикацию я обновил, то и дата в этом поле тоже изменилась (на "20.09.2019"):
Также, дата обнаружилась рядом со ссылкой на публикацию в html-карте сайта:
Ее мы тоже поменяли на "13 ноября 2018". Хотя если честно, я не думаю, что Гугл берет дату отсюда. Но ради эксперимента можно и эту дату поменять.
По прошествии месяца в Гуге стоит дата: 26 октября 2017. Т.е. подтвердилась версия номер 3.
Это означает, что Google при индексировании сайта выполняет JavaScript-код. А значит, скрыть от него контент таким способ не удастся.
ПС: после данного эксперимента я прочитал множество материалов и других экспериментов на данную тему, и теперь точно понятно, что Гугл рендерит странички сайта во время индексирования. Поэтому гарантированно закрыть что-то от индексации стало достаточно проблематично. Да, есть сложные способы, но даже они не имеют 100%-ной гарантии.
ППС: в кэше Гугла показывается страничка без даты публикации. Это означает, что нельзя однозначно доверять кэшу. Так происходит из-за того, что существует несколько разных индексаторов. Первичный сканирует чистый html, другие рендерят скрипты.
3 642
нет комментов
КАТЕГОРИИ
САМЫЕ
ПОПУЛЯРНЫЕ
СТАТЬИ за 6 мес
КОММЕНТАРИИ