понедельник, 22 апреля 2013 г.

Как определить частоту поиска ключевых фраз?


Некоторые поисковые запросы поступают в Яндекс сотни раз в день, другие один-два раза в год. Каждая формулировка характеризуется своей частотой - ежемесячным количеством обращений пользователей с данным запросом. "Технической" целью оптимизации является достижение положения, когда ссылка на сайт устойчиво показывается в числе первых десяти результатов поиска по избранному поисковому запросу (запросам). Реальная цель - не показы ссылок на сайт в Top10 поисковиков, а переходы по ним заинтересованных (целевых) посетителей.


Стоит ли пытаться достичь положения в Тоp10 по тому или иному запросу, зависит от двух факторов:
  • частоты запроса; 
  • значимости запроса.

Значение частоты понятно - чем чаще используется запрос, тем лучше. Значимость определяется смыслом запроса. Например, запрос "продажа автомобилей в кредит" поступает в Яндекс 200-250 раз в месяц и кажется, что для автоторговой фирмы оптимизация по этому запросу стоит усилий.





Как видно из скриншота для Санкт-Петербурга, Екатеринбурга и Самары гораздо большее значение имеет оптимизация по запросам с частотой в десятки раз меньшей. Значимость запроса - понятие субъективное и определяется вебмастером (оптимизатором, владельцем сайта) самостоятельно в зависимости от тематики и целей сайта. В некоторых случаях для оптимизации имеет смысл рассматривать только высокочастотные запросы, с частотой от 25 обращений в месяц и выше. Но часто не пренебрегают запросами с частотой от 5 обращений ежемесячно.

Что такое НЧ, СЧ и ВЧ? Как определить, является ли запрос высокочастотным или низкочастотным? Влияет ли тематика сайта на отнесение запроса к одному из интервалов? И так далее. Постараемся ответить на все эти вопросы, а также раскрыть более подробно некоторые моменты в вопросах частот.
  • ВЧ (высокочастотные) запросы – наиболее запрашиваемое слово (слова, фразы) в вашей тематике (самые популярные запросы). 
  • СЧ (среднечастотный) запрос – что-то среднее между НЧ и ВЧ. 
  • НЧ (низкочастотные) запросы – слова и фразы, которые запрашиваются с малой частотой в поисковых системах и относятся к вашей тематике. 
Значимость запроса – понятие субъективное и определяется вебмастером (оптимизатором, владельцем сайта) самостоятельно в зависимости от тематики и целей сайта. Частота, ниже которой запросы не попадают в выборку значимых и не просматриваются для анализа, называется минимальной значимой частотой выборки.

Как определить ВЧ запросы для вашего сайта? Для определения частот поиска запросов в поисковых системах существуют сервисы, предоставляющие данную информацию. Например, для поиска частот русскоязычных слов можно воспользоваться сервисом, предоставляемым ПС Яндекс – статистика запросов. Для поиска же статистики по англоязычным словам можно использовать сервис KeywordDiscovery.




Точное определение границ между ВЧ, СЧ и НЧ

Итак, у вас есть выборка. Теперь необходимо вспомнить теорию вероятностей и функцию распределения. Еще раз отметим, хотя это интуитивно понятно, что СЧ – это среднее значение частоты между ВЧ и НЧ. Однако бывает сложно определить это среднее. Например, ВЧ “воздуховод“ – 16949 и НЧ “продажа производство воздуховодов“ – 6 запросов/месяц. Что тогда будет СЧ?

Если брать среднее арифметическое, тогда получится, что среди выборки мы не имеем СЧ вообще. Для этого рассмотрим зависимость выборки на графике (рисунок 1.1). Из графика видно, что зависимость является логарифмической, так как, если ось абсцисс (номер запроса) и ось ординат (частота запроса) взять в логарифмическом масштабе, то с некоторой погрешностью мы получим линейную гистограмму частот запросов. Это означает, что СЧ будет находится посредине этой линейной регрессии.



Рисунок 1.1 – График распределения поисковых запросов по частотам (оси взяты в логарифмическом масштабе).


Введём обозначения,
Хвч — максимальное значение частоты ВЧ запроса;
Хнч — минимальное значение частоты (минимальная значимая частота) запроса


Тогда, можно утверждать, что

Хсч = \/(Хвч – Хнч)

(корень квадратный из разницы максимальной и минимальной частоты). Вышеприведенная зависимость исходит из свойства логарифма log(x)/2 = log(x^0.5) = log(\/x). Зачастую Хнч намного меньше Хвч и, поэтому им можно пренебречь, получим:

Хсч = \/Хвч

Теперь проверим эти значения на примере “воздуховодов“:

Хвч = 16949, Хнч = 6
Хсч = \/(16949-6) = \/16943 ≈ 130

Значение 130 будет являтся среднечастотным значением. Теперь необходимо определить интервал, в котором частота будет считаться средней. Для этого разобъем линейный интервал на 3-и равные части, таким образом, в каждой части будет свой диапазон частот. Значение отклонения от абсолютно средней частоты будет приблизительно равно 33%.

Ширина средних частот:

D = log(Хвч)/3 = 3\/log(Xвч) = 1.41;

Значит интервал от 10log(Хсч) – D/2 до 10log(Хсч) + D/2 будет считатся интервалом средних частот. В нашем случае это

[102.11 – 0.7, 102.11 + 0.7] => [26, 646]

В этот интервал входят такие ключевые слова, как очистка воздуховодов, воздуховоды прайс, воздуховоды пвх, цена воздуховоды, и др. Всё, что стоит выше отметки 646 будет ВЧ, а ниже 26-ти – НЧ. Все запросы, частота поиска которых находится в интервале от 26 до 646 вправе называтьсясреднечастотными запросами.

Основным соотношениям для определения интервала средних частот является следующее:

Xсч.min = 10log(Хсч) – D/2

Xсч.max = 10log(Хсч) + D/2

Хсч = \/Хвч

D = log(Хвч)/3


Заметим, что при определении интервала СЧ следует учитывать индивидуальную выборку для своего сайта и она не всегда может иметь логарифмическую зависимость. Однако приведенные выше формулы подходят для большинства случаев ключевых слов (проверено на нескольких десятках тематик). При другой характеристике поведения частоты поиска ключевых фраз необходимо искать функцию, описывающую распределение частот.


Комментариев нет:

Отправить комментарий