Рассуждения об интересности контента (или что нужно знать про алгоритм Баден-Баден)

Сложность статьи:Среднячкам

Недавно запустился новый алгоритм в Яндексе "Баден-баден". В узких SEO-кругах считается, что алгоритм направлен на борьбу с неинтересными текстами. Официально Яндекс об этом не объявлял (по политическим соображениям, так как, во-первых, алгоритм работает не идеально, а во-вторых, чтобы оптимизаторы не раскрыли метрик, по которым определяется интеререстность текста).

Официально про алгоритм сказано что-то нечленораздельное, типа он борется с переоптимизированными текстами (что-то похожее уже было лет 6 назад: https://webmaster.yandex.ru/blog/11464). Но большое число проведенных недавних наблюдений со стороны оптимизаторского сообщества говорит о том, что переоптимизация лишь отчасти отражает характер нового фильтра. Я видел много постов, где люди приводили примеры, когда характер наложения фильтра на их сайте был не связан с тошнотностью текста. Также, Сливинский в недавнем выступлении тоже очень аккуратно рассказывает про новый алгоритм. И так и говорит, что прямо метрика переспама использоваться не будет. То есть, если в тексте нужно много раз подряд упомянуть какое-либо слово, то ничего страшного не будет. Он говорит только о том, что не нужно писать бессмысленные тексты.

Приведу тут еще один интересный эксперимент от Александра Алаева, где тексты будут вовсе удаляться с пострадавших страниц. Будет интересно посмотреть на результаты эксперимента. Мы сможем еще лучше понять как работает алгоритм Баден-баден.

Но вернемся к понятию интересности текстов.

Недавно коллега Марьян Попович предположил, что только полноценный искусственный интеллект смог бы по настоящему качественно измерить интересность текста на сайте.

Я решил задуматься на эту тему и вот к каким выводам я пришел.

Сперва давайте подумаем, смог бы определить интересность текста не какой-то там мифический искусственный интеллект (который по сути уже есть, ведь нейросети - это ничто иное, как искусственный интеллект), а обычный живой человеческий интеллект асессора.

Тут надо упомянуть, что интересность текста - это понятие не абсолютное. То, что одному человеку интересно, другому - нет. Также, есть такая вещь, как новизна информации. Вчера я читал очень крутую и интересную статью. Но уже сегодня эта статья для меня будет не интересной. Я ее уже читал. Новизну информации можно условно приравнять к уникальности. То есть, в выдаче Яндекса не должно быть одинаковых текстов. Они должны быть разными. Но с уникальностью выдачи поисковики прекрасно справляются уже очень давно. Так что, давайте не будем включать в понятие интересности текста его уникальность и новизну.

Теперь поговорим о разнообразии интересов у людей в принципе. Одни интересуются футболом. Другие сплетнями. Третьи детьми. Четвертые играми. Сможет ли человек, далекий от игр, понять насколько интересен текст про игру? Или юрист понять насколько интересен текст про новое "железо". Или ученый про новости бизнеса?

Люди адекватно могут определить интересность текста только лично для себя и только в тех темах, которые им интересны. Поэтому нет смысла привлекать сюда "искусственный" интеллект. Даже живой человек вряд ли определит что перед ним - очередная красиво оформленная портянка или реально что-то очень интересное.

Но тем не менее, какие-то метрики, по которым можно определить интересность текста все же имеются.

Давайте попробуем их перечислить:

  1. Число лайков материала. Любой асессор по этому признаку может определить интересность материала. И не только асессор. Это очень простая метрика. На ней работают алгоритмы социальных сетей. Именно они определяют что Вам показывать в Вашей ленте. В первую очередь показываются самый лайковые и обсуждаемые материалы.
  2. Количество комментариев у материала. Метрика аналогична предыдущей. Интересные материалы люди обсуждают.
  3. Число ссылок на материал и число репостов. Интересным материалом люди делятся.
  4. Материал посоветовал кто-то из авторитетов. Вы скажете, что интересность материала от этого не зависит. Но будете не правы. Да, материал от этого сам по себе не изменился. Но, люди меняют свое отношение к материалу после рекомендации кого-то из авторитетов. К тому же, если авторитет сослался на материал, то наверное материал и вправду интересный. По крайней мере, как метрику интересности это точно стоит использовать. (Тут вопрос а как понять, что сослался именно авторитет, но это не очень сложно. По сути, лидеры мнения определяются несложными метриками, по тому же числу упоминаемости, трафику на своих страничках, числу  лайков и  т.д.)
  5. Поведенческие метрики материала. Число отказов, время прочтения. Если статья интересная, то ее будут читать и с нее не будут уходить.
  6. Как следствие многих предыдущих пунктов, у интересного материала будет большое количество непоискового трафика. Почему непоискового? Потому что поисковик пытается вычленить интересный материал, и давать трафик как раз на интересные материалы, а не на те материалы, на которые он уже и так дает трафик. В общем, надеюсь понятно объяснил. (Или можно сказать по другому: чтобы не было обратных связей, то есть бонусов за то, за что уже дали бонус, хотя на практике это все равно неизбежно, но не будем этого учитывать).

Как видим, определение интересности во многом схоже с обычным ссылочным ранжированием. По сути, это те же метрики, дополненные сигналами из соц-сетей и метрикой трафика.

Большинство из этих метрик описаны в известной книге психолога Роберта Чалдини "Психология влияния". Там описываются и объясняются ряд экспериментов, показывающие как люди принимают многие решения. На тех же метриках работает и матрикснет.

Эти все метрики очень просты. Поисковики их используют уже достаточно давно.

Но есть одна проблема.

Все эти метрики накопительные и отражают интересность только для тех статей, которые были замечены сообществом. Круто, если Ваш материал имеет кучу трафика и лайков в соц-сетях. Но не каждый интересный материал будет иметь все эти метрики. А что если Вы написали ну очень интересную статью, но никому ее не показали? Просто разместили ее на сайте, который никто не посещает и даже в соц-сетях никому ее не показали. К тому же, Вы очень плохо оформили свою статью. На ней нет картинок, нет подзаголовков, нет красивого форматирования, а также, текст не разделен на абзацы. Но статья при всем при этом может быть реально очень и очень интересной. И если ее красиво оформить и показать людям на посещаемом сайте, то она соберет огромное количество лайков и репостов. В действительности, в интернете огромное количество именно таких материалов.

Судя по всему, именно такие материалы и пытается найти Яндекс с введением алгоритма "Баден-баден".

Вопрос: как спрогнозировать интересность материала без вышеуказанных метрик?

Почти что никак. Но тем не менее, Яндекс пытается это сделать. Это очень сложная задача. Алгоритм неизбежно будет ошибаться.

Но Вам стоит запомнить одно: в настоящее время начинает приобретать огромное значение трафик из соц-сетей. Теперь SEO - это не только SEO. Продвиженцам придется идти обучаться работать с таргетировнной рекламой. Либо, нужно будет с кем-то партнериться.

Также, это снова повышает порог входа проекта на SEO-рынок. Теперь стоит задуматься, брать или нет проект, который еще не продвигается в социальных сетях. А также, теперь еще до запуска проекта в продвижение придется сперва настраивать не только контекстную, но еще и таргетированную рекламу.

Надеюсь, я немного приоткрыл тайну на вопрос о том, как работает новый алгоритм Яндекса "Баден-баден".

5 482

7 комментариев

КОММЕНТАРИИ

  • С т.з. Яндекса «интересность» как раз кардинально отличается от уникальности. Не хочу здесь пересказывать (палить) материалы из закрытой группы.
    По поводу непрямого траффика, это всё ок, но у этих метрик коэффициенты как раз будут маленькие в формуле алго, ведь полнота и точность таких данных для ПС очень невелика. Так что опять упор на противоположное 🙂

    • «С т.з. Яндекса «интересность» как раз кардинально отличается от
      уникальности. Не хочу здесь пересказывать (палить) материалы из закрытой
      группы.» -Да, интересность отличается от уникальности, но неуникальный контент тоже не интересен. Он же не уникален:) И поэтому я и сказал что не будем касаться уникальности для определения интересности для упрощения:)

      «По поводу непрямого траффика, это всё ок, но у этих метрик коэффициенты
      как раз будут маленькие в формуле алго, ведь полнота и точность таких
      данных для ПС очень невелика. Так что опять упор на противоположное :)» — ну, как показывают эксперименты, даже очень маленький трафик может заставить страницу войти в индекс, которая оттуда вылетела. Вот так.

      • войти в индекс, которая оттуда вылетела. Вот так. Это чистой воды догадки. Причин вылета и влёта в индекс назад — может быть множество. Важней именно ранжирование. Социалки всегда периодически рулили, вопрос в том что данный сигнал может быть шумным, но он всё же он более быстрый чем тем же линки, даже форумные. Камменты к статьям, как и отзывы к товарам всегда положительно влияли на ранжирование. Это такие прописные истины. Яндекс применил это подход покластерно, разделив не только ИМ и инфо, ну и по другому. Факторов действительно скорей всего множество, один из них это получение «счастья пользователя». Возможно этот вопрос поднимался в закрытой группе. -))) В любом случае будут рулить котики.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

САМЫЕ
ПОПУЛЯРНЫЕ
СТАТЬИ за 6 мес


НАШИ КЛИЕНТЫ


ОТЗЫВЫ


Спасибо! Вы подписаны на наши обновления

Подписаться на блог