Часто для проведения маркетинговых исследований и принятия управленческих решений мы опираемся на всевозможные опросы респондентов, при этом получить обратную связь от всех представителей нужной нам группы не представляется возможным или экономически нецелесообразно. Но как понять, будет ли мнение определенного количества опрошенных представлять всю изучаемую группу?
Такие задачи легко решаются при помощи выборочных наблюдений, при которых обследованию подвергается часть представителей совокупности (группы), а результаты обследования распространяются на все изучаемое явление. В зависимости от исходных данных нам приходится решать одну из задач:
Например, Вы провели выставку «Товары для дома и сада» и необходимо получить обратную связь от посетителей мероприятия. Количество посетителей выставки составило 15 000 чел.
Для решения первой задачи вам необходимо знать, сколько минимум анкет обратной связи необходимо собрать по результату опроса посетителей из общего числа 15 000 чел.
Вторая задача возникает в том случае, если вы уже имеете какое-то количество заполненных анкет (например, 650) и хотите убедиться, можно ли распространить выводы на всю изучаемую группу.
Генеральная совокупность - это суммарная численность объектов наблюдения (в нашем примере это все участники выставки, 15000 чел.), обладающих определенным набором признаков, ограниченная в пространстве и времени.
Выборка или выборочная совокупность - часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение обо всей генеральной совокупности. В нашем примере для Задачи 1 – это как раз искомая величина, а для Задачи 2 – 650 чел.
Для того чтобы заключение, полученное путем изучения выборки, можно было распространить на всю генеральную совокупность, выборка должна обладать свойством репрезентативности.
Репрезентативность выборки - свойство выборки корректно отражать генеральную совокупность. Одна и та же выборка может быть репрезентативной и нерепрезентативной для разных генеральных совокупностей.
В нашем примере выборка, целиком состоящая из посетителей, владеющих дачей или садом, не будет репрезентировать всех посетителей выставки, также как и выборка из посетителей, живущих в многоквартирных домах, т.е. в опросе должны участвовать посетители разных категорий.
Ошибка выборки или доверительный интервал является показателем погрешности измерений. Это отклонение результатов, полученных с помощью выборочного наблюдения от истинных данных генеральной совокупности. Допустимая предельная ошибка выборки выбирается исследователем в зависимости от целей исследования. Считается, что для принятия бизнес-решений ошибка выборки должна быть не более 5%.
Доверительный уровень или точность – интервал, в котором с той или иной вероятностью находится генеральный параметр. Чаще всего применяются доверительные уровни, равные 0,95 или 0,99. В маркетинговых исследованиях, как правило, выбирается доверительный уровень, равный 0,95 (95%).
Применить все эти показатели и получить необходимые результаты можно в расчетах при помощи достаточно сложных статистических формул, табулированных значений в Excel или воспользоваться онлайн-сервисом расчета.
Задача 1. От какого количества участников выставки (напомним, всего 15 000 чел.) необходимо получить обратную связь, если мы принимаем ошибку выборки на уровне 5%, а доверительный уровень соответствует рекомендованному 95%?
Ответ – 375 человек. Т.е. получив 375 анкет обратной связи мы сможем смело распространить результаты опроса на всю генеральную совокупность с погрешностью 5%.
Задача 2. У нас есть 650 анкет обратной связи участников выставки. Достаточно этого количества и какова при этом ошибка выборки?
Ответ – 650 анкет будет достаточно для распространения результата опроса на всю генеральную совокупность с погрешностью 3,76% (ниже максимально рекомендованного 5%) с уровнем доверия 95%.
Какие именно алгоритмы, сервисы и формулы применяются для расчетов мы обязательно расскажем в наших следующих публикациях.