Что такое текстовая релевантность и как ее оптимизировать

Что такое текстовая релевантность и как ее оптимизировать
11.04.2024
8 мин
587
наш канал в ЯНДЕКС.ДЗЕН.

Успех в продвижении сайта зависит от проработки факторов ранжирования для поисковых систем. Если применить принцип Парето («20 % усилий дают 80 % результата»), выделить и выполнять только самые эффективные работы, стоит проработать текстовую релевантность. В статье разберемся, что это такое и зачем про нее знать оптимизаторам.

Что такое текстовая релевантность

Сайт состоит из посадочных страниц. Каждую из них оптимизируют под конкретную группу запросов: тогда на нее будут попадать посетители, которые переходят из поисковой системы по любому запросу из этой группы. Поэтому важно, чтобы содержание посадочной страницы было релевантным поисковым запросам.

Текстовая релевантность — это фактор, который показывает, насколько поисковый запрос соответствует содержимому текста в документе. Под документом понимается вся страница сайта целиком, включая:

  • Контентную область — информацию, которая меняется при переходе между урлами: текст статьи, категорию с товарами и описанием для этой категории, карточки товаров и другое.
  • Сквозные элементы – блоки на странице, которые не меняют своего содержимого при переходе от урла к урлу. Например, шапка и подвал сайта, невидимые блоки и пункты всех меню, включая пункты скрытого мобильного меню.

Текстовая релевантность важна для продвижения в Яндекс и Google.

Из чего складывается текстовая релевантность документа

Можно выделить два важных параметра:

  • Плотность ключевых слов. Подробнее о ней мы писали здесь.
  • Количество тематических релевантных слов (LSI). LSI-слова раскрывают тематику, подчеркивают экспертность текста. Если ключевых слов по отношению к другим словам на странице мало, такая страница считается недооптимизированной, поэтому не получит высокую позицию. А если ключей, наоборот, слишком много, страница или даже весь сайт может попасть под фильтр поисковой системы.
Когда основная часть тематических слов добавлена на страницу, и они органично распределены по документу, поисковик поднимает позиции сайта по всей группе запросов.

Как проверить текстовую релевантность документа

Для анализа и вычисления текстовой релевантности документа применяют два параметра:

Анализ качества текста по закону Ципфа. Закон Ципфа помогает определить частоту распределения слов в документе.

Если взять код веб-страницы, убрать из него HTML-теги и представить оставшиеся слова в виде униграмм (отдельных самостоятельных слов), можно посчитать количество их повторений.

Анализ качества текста по закону Ципфа

То слово, которое чаще всего повторяется, считается основным и по закону Ципфа находится в самом верху гиперболы (скрин chart.jpg – слово 1). Второе по значимости слово в документе, должно повторяться примерно в два раза реже, чем основное слово документа, а третье слово – в 2 раза реже, чем второе и так далее. Такой анализ позволяет понять, какому ключевому слову или фразе соответствует продвигаемая страница.

Чтобы проанализировать текстовую релевантность страницы, можно воспользоваться сервисами:

Оценка важности слов с помощью TF-IDF. Показатель TF-IDF позволяет определить значимость каждого слова на веб-странице по отношению к набору слов в коллекции документов. В SEO коллекцией документов можно считать поисковую выдачу с посадочными страницами сайтов-конкурентов по конкретному запросу.

Расчет показателя TF-IDF позволяет:

  • понять, какие слова нужно выбрать для наполнения страницы;
  • определить количество вхождений этих слов относительно длины документа;
  • выяснить семантический вес (важность слова для продвигаемого направления) каждого выявленного слова, чтобы определить их порядок при распределении на гиперболе Ципфа.

Анализ и вычисления слов на страницах конкурентов могут показать сильные отклонения от нормы в большую или меньшую сторону. Поэтому для расчетов лучше выбирать именно медианные значения.

Показатель TF-IDF и выбор необходимых значимых слов поможет определить сервис MegaIndex.

С помощью вычисления TF-IDF получаем нужные слова и понимаем их значимость относительно объема документа. А как эти слова правильно распределить на странице, высчитываем по закону Ципфа.

Причины плохой текстовой релевантности

Самые частые причины:

  1. Ошибки при планировании структуры сайта.
  2. Меню большой вложенности с большим количеством пунктов и подпунктов (в том числе скрытое меню для мобильной версии, которое дублирует основное меню).
  3. Скрытые текстовые блоки, которые не отображаются на сайте, но присутствуют в HTML-коде веб-страницы.

Пример. Допустим, мы анализируем интернет-магазин по продаже бытовой техники. На сайте есть сквозное мега-меню, и его пункты включают большое количество вхождений конкретного слова. Например, слова «телевизор». Тогда, скорее всего, страница с кофемашинами или другими товарами тоже окажется релевантной именно телевизорам.

Как быть в таком случае? Нужно на странице с кофемашинами сократить количество вхождений слова «телевизор» или увеличить количество вхождений слова «кофемашина».

Еще раз: важно соблюдать пропорцию слов на каждой посадочной странице. Страница должна быть релевантной конкретному запросу.

К чему приводит плохая текстовая релевантность

Фразы в документе, которые не соответствуют тематике сайта или продвигаемому направлению, уменьшают плотность ключевой фразы и размывают релевантность страницы. Это мешает поисковому роботу правильно ее ранжировать. Именно поэтому в ТОП редко выходят страницы с плохим контентом, например, большим количеством «воды».

На сайте не должно быть страниц, релевантных одному и тому же запросу. Если их несколько, то может возникнуть эффект каннибализации. В этом случае поисковый робот при ранжировании сайта по запросу будет отдавать предпочтение то одной странице, то другой. Такое «мигание» страниц в поисковой выдаче может особенно сказываться по ранжировании частотных конкурентных запросов.

Что такое релевантные слова

Сейчас поиском управляет нейросеть, поэтому просто соблюдать пропорцию слов на странице недостаточно. Релевантная страница должна содержать как можно больше слов и профессиональных терминов, которые используют в продвигаемом направлении.

Например, если мы продвигаем страницу, где размещены кофемашины, важно добавить максимально возможное количество слов данной тематики. Чем выше экспертность оптимизатора, тем больше важных релевантных слов он сможет внедрить на странице. А значит, страница поднимется выше.

Например, для страницы с кофемашинами, такими словами могут быть:

  • кофе,
  • автоматическая,
  • кофемолка,
  • приготовление,
  • капсульная,
  • капучинатор,
  • зерновой
  • и пр.

Именно по этим словам нейросеть поймет, о чем идет речь на странице.

Где найти релевантные слова

Есть несколько способов найти слова, которые зададут тематику:

  1. Привлечь эксперта в тематике.
  2. Попросить собрать слова нейросеть, например, ChatGPT.
  3. Использовать слова из семантики прорабатываемой группы запросов, сформировав униграммы.
  4. Воспользоваться специальными анализаторами и онлайн-сервисами. Например, JustMagic, модуль «Акварель-генератор».
  5. Собрать вручную с сайтов, найденных в поисковой выдаче по прорабатываемому запросу.

Лучший способ — собрать релевантные слова всеми перечисленными способами и использовать их при формировании своей страницы.

Как правильно внедрить релевантные слова

Все зависит от вида посадочной страницы.

Если задача — продвинуть информационный материал, можно подготовить текст с нужным количеством релевантных слов. Но не стоит забывать о естественности текста, его форматировании и оформлении, других параметрах качества.

Для коммерческой посадочной страницы, например, категории интернет-магазина, просто статей будет недостаточно. Если разместить много текста, коммерческая страница превратится в информационную и сменит интент . И позиции по запросам для такой страницы уйдут в минус.

Слова на коммерческую страницу нужно внедрять разумно и аккуратно – в разных частях документа и в различных текстовых зонах. Самый оптимальный вариант – подсмотреть, где это слово на странице встречается у конкурентов. Это могут быть:

  • пункты меню;
  • теги;
  • названия товаров;
  • фильтр;
  • отзывы;
  • блок с вопросами и ответами;
  • комментарии пользователей и пр.

Что в итоге

Для формирования хорошей релевантности веб-страницы важно:

  1. Работать со всем документом, учитывая скрытые блоки, а не только с контентной частью страницы.
  2. Исключить появления на всем сайте страниц, релевантных одному и тому же запросу.
  3. Соблюдать пропорцию ключевых слов на странице.
  4. Внедрить на страницу как можно больше тематических релевантных слов и терминов, соответствующих прорабатываемому направлению.
Рецензент статьи: Голомолзин Денис
Рецензент статьи:
Голомолзин Денис
Управляющий партнер компании "Альтера". В прошлом - оптимизатор, ведущий специалист SEO-команды, руководитель отдела продвижения, консультант-евангелист компании.

Вы дочитали статью! Отличная работа!

Рекомендуем ознакомиться со значениями терминов:

Контентная областьУниграммаМуртапузацияЯндекс.ВебмастерГеонезависимый запрос (ГНЗ)Геозависимый запрос (ГЗ)Текстовые факторыПодсветка в выдачеСпектральная примесьМатриксНет (MatrixNet)Краулер (Crawler)Видимость в ПСБиржа ссылокБаден-БаденTF-IDFschema.orgCatBoostШинглЦелевой запросRobots.txtNoindexСпектрПоведенческие факторыkeywordsГлавное зеркало сайтаВертикальный поискАГСПоисковый спамЮзабилити сайтаСчетчик посещаемости