Статистические методы

Автор статьи
Наталья Грачева

Статистические методы — математические способы изучения данных, которые в том числе используют в маркетинговых исследованиях.

Статистические методы позволяют анализировать массивы данных и находить в них закономерности, проверять гипотезы и строить прогнозы. В маркетинге таким образом анализируют информацию о продукте, клиентах, продажах и рекламных кампаниях. Например, сегментируют покупателей в зависимости от разных факторов.

Статистические методы — количественные. Поэтому с их помощью можно увидеть итоги работы в цифрах и с высокой точностью спрогнозировать результаты будущих кампаний и нововведений. Это важно для принятия бизнес-решений, особенно когда речь идет о высоких рисках. Например, можно спрогнозировать, как повлияют разные изменения в компании на объемы продаж, сколько новых клиентов принесет рекламная кампания, какая цена на ваши услуги покажется аудитории справедливой и так далее.

Наиболее часто в маркетинге используют такие виды анализа:

  • корреляционный,
  • регрессионный,
  • дисперсионный,
  • факторный,
  • кластерный,
  • когортный
  • описательный.

О каждом из них подробнее расскажем ниже.

Подходящие для маркетинга статистические методы

Подходящие для маркетинга статистические методы

Корреляционный анализ

Определяет характер зависимости какого-либо явления от одного или нескольких других. Корреляция бывает положительной и отрицательной, сильной и слабой, прямой и обратной.

Например, чем больше писем компания отправляет клиентам, тем больше продаж через этот канал она совершает. Значит, корреляция положительная.

Подробнее о корреляционном анализе

Диаграмма рассеяния

Результаты корреляционного анализа удобно смотреть на диаграмме рассеяния. На ней каждое пересечение двух показателей показано в виде точки. Чем ближе друг к другу они расположены, тем сильнее корреляция

Регрессионный анализ

Как и корреляционный анализ, регрессионный определяет, как именно какое-то явление зависит от одного или нескольких других. Однако между этими методами есть разница. Если корреляция показывает общую тенденцию, то регрессия помогает увидеть её в конкретных цифрах. 

Регрессионный анализ на графике

Регрессию считают по формуле. На графике прямая показывает, на сколько в среднем увеличивается количество продаж при отправке большего числа писем. В нашем случае каждые 100 писем приносят компании примерно 10 продаж

Способ позволяет прогнозировать результаты маркетинговых мероприятий. Например, анализ прошедшей рекламной кампании в соцсети показал, что увеличение бюджета на 1000 рублей в среднем приводит двух новых подписчиков. Можно просчитать заранее, что в следующий раз за 50 000 рублей компания привлечет около 100 человек (если другие параметры останутся прежними). 

Факторный анализ

Измеряет, как разные условия влияют на результат какого-то процесса. Для анализа выбирают один фактор и исследуют, насколько изменились результаты после его появления.

Например, производитель мороженого изменил упаковку продукта. Чтобы оценить результат, он проанализировал уровень продаж до и после изменений.

Факторный анализ в виде простого графика

С декабря мороженое продавалось более или менее линейно, примерно по 50 коробок в день. Потом производитель поменял упаковку. С марта продажи стали расти

Факторный анализ простой, но может показать ложную зависимость. В примере с картинки кажется, что гипотеза оправдалась: новая упаковка привлекла дополнительных покупателей. На самом же деле, скорее всего, повлияла сезонность. В жару мороженое пользуется спросом, а к осени продажи снова начнут падать. Чтобы результаты были точнее, исследуют влияние не одного, а всех возможных факторов. 

С помощью факторного анализа маркетологи решают разные задачи. Например, сегментируют аудиторию: определяют, как влияют на продажи такие факторы, как возраст, пол, финансовые возможности и подобные.

Кластерный анализ

Помогает объединить разрозненные элементы в группы — кластеры. Например, маркетологи сегментируют с его помощью целевую аудиторию.

Чтобы провести кластерный анализ, нужны хотя бы две переменные. Например, возраст клиента и общая сумма его покупок. Результат каждого потребителя выглядит как точка на диаграмме. Покупатели с похожими показателями на схеме оказываются рядом и образуют собой кластеры.

Кластерный анализ в виде диаграммы рассеяния

Диаграмма помогает увидеть, что покупатели в возрасте от 20 до 30 лет делают преимущественно недорогие заказы от 1000 до 1500 рублей. Клиенты от 25 до 40 лет покупают на 3000–3700 рублей. Более взрослые клиенты вновь покупают меньше

Когортный анализ

Показывает, как ведут себя люди в разных группах — когортах. Анализ отличается от кластерного тем, что когорты выделяют по двум основным признакам: одинаковое действие и одинаковое время. Например, можно исследовать сегмент тех, кто скачал приложение (одно действие) в марте 2023 года (одно время). Их можно сравнивать с другими когортами: с установившими приложение в апреле, в мае, в июне и так далее.

Подробнее о когортном анализе

Когортный анализ на схеме

Результаты анализа показывают, насколько были активны пользователи приложения каждый месяц после регистрации. Так, например, можно увидеть, что количество активных юзеров сначала падает, но к 3-4 месяцу составляет стабильно около 40%. На основе этой статистики можно предположить, как поведут себя новые пользователи

Дисперсионный анализ

Дисперсия показывает различия между средними значениями в разных группах. Например,

  • продавцы в магазине на Арбате в среднем продают на 9000 руб. в день,
  • продавцы в точке на Тверской — в среднем на 7500 руб. в день,
  • продавцы на Черкизовской — в среднем на 12 000 руб. в день,
  • продавцы в Бутово — в среднем на 5500 руб. в день.

Анализ покажет, насколько сильно различаются средние показатели в разных группах. Например, насколько средний чек за день различается:

  • в группе магазинов в пределах центра Москвы (Арбат и Тверская) и в группе магазинов в спальных районах (Черкизовская, Бутово);
  • в группе магазинов площадью больше 30 квадратных метров (например, ими окажутся Арбат и Черкизовская) и меньше этой площади (Тверская и Бутово);
  • в группе магазинов, где работает по три продавца в день, и в той, где на смену выходят только двое. 

Группы можно определять на основании самых разных факторов. В нашем примере — это расположение торговой точки, ее площадь и количество продавцов. Анализ покажет, как сильно эти параметры влияют на среднее значение — средний чек на группу. 

Описательная статистика

Дескриптивная, или описательная статистика — это наиболее простой и наглядный способ исследования показателей. В маркетинге чаще всего используют меры центральной тенденции: среднее число, моду и медиану.

 

Меры центральной тенденции — способы описания статистической информации одним числом.

Среднее число. Обычно подсчитывают среднее арифметическое. Для этого сумму чисел делят на их количество. Один из популярных показателей в маркетинге и продажах — средний чек. 

Например, магазин хочет определить эффективность рекламы, которую запустили 1 февраля. В январе средний чек составил 1500 рублей. Через месяц после начала продвижения снова замеряют показатели. Для этого сначала считают средний чек за каждый из 28 февральских дней:

День Чек, руб День Чек, руб День Чек, руб День Чек, руб
1 2169 8 2415 15 3700 22 5392
2 3719 9 3780 16 2100 23 1490
3 1230 10 980 17 1230 24 1678
4 5392 11 50 18 5392 25 980
5 1490 12 1509 19 1490 26 50
6 1678 13 2300 20 1678 27 1509
7 3450 14 2700 21 3450 28 3400

Затем суммы складывают и делят на количество дней. Средний чек за февраль 2023 года — 2371 руб. С января он вырос почти на 900 рублей или на 58%. Значит, рекламная кампания оказалась успешной.

Мода. Значение, которое повторяется чаще других. Моду используют, когда ищут наиболее распространенное значение чего-то: цены, зарплаты, размера или формы популярного товара.

Например, сервис для email-рассылок собрал статистику по тому, сколько писем в день рассылают его клиенты. Результаты показали в таблице:

Клиент 1 250
Клиент 2 1000
Клиент 3 300
Клиент 4 500
Клиент 5 250

Мода — 250 писем в день, потому что число повторяется чаще остальных. Возможно, стоит сделать тариф с включенными 250 письмами. Среднее арифметическое из 460 писем никому не подойдет.

Медиана. Это значение, которое расположено посередине выборки. Чтобы найти медиану, исследуемые показатели выстраивают в порядке возрастания. Если количество чисел нечетное, то медиана — число посередине. Если чисел четное количество, тогда медиана — это среднее арифметическое из двух центральных чисел. Преимущество медианы в том, что она не учитывает выбросы.

 

Выброс — это аномальное число. Например, в магазин пришел покупатель-миллионер и за одну покупку сделал недельный план продаж.

Например, специалисты сервиса email-рассылок хотят понять, сколько в среднем денег клиенты готовы тратить на услуги. Для этого разместили онлайн-опрос на сайте, который прошли 15 посетителей (П):

П1 П2 П3 П4 П5 П6 П7 П8 П9 П10 П11 П12 П13 П14 П15
1200 3000 500 10000 0 2500 0 3000 1700 5000 8000 3500 1500 2000 0

Сначала все 15 чисел выстраивают по порядку. Количество нечетное, поэтому медианой будет центральное число: 0, 0, 0, 500, 1250, 1500, 1700, 2000, 2500, 3000, 3000, 3500, 5000, 8000 и 10000 рублей. В среднем люди готовы отдавать 2000 руб. за услуги компании.

Выбор способа описания зависит от исходных данных и цели измерения. Сравним три метода сразу:

Меры центральной тенденции в маркетинге

На среднее число выброс повлияет, а на медиану или моду — нет. В таблице показаны результаты за ноябрь и декабрь. Если план продаж на январь сделать на основе среднего в декабре, магазин его не выполнит

Главные мысли

статистические методы это

Вы нашли ответ?

3
2