Контур выборки неизбежно содержит ошибку

5. Разработка и реализация плана исследований

5.1 Выбор методов сбора данных

Можно выделить следующие методы сбора данных при проведении опросов с участием интервьюеров или самостоятельном заполнении анкет респондентами:

1. Интервьюирование, осуществляемое на дому у респондента. Возможно предварительное согласование сроков интервью по телефону.

Обычно в этом случае легче установить доверительные отношения с опрашиваемым, возможен показ образцов товара, рекламных материалов и т.п. Домашняя обстановка настраивает на достаточно длительное интервью с высокой степенью концентрации внимания на проводимом обследовании. Однако это дорогой метод сбора данных.

2. Интервьюирование посетителей крупных магазинов. Компании, проводящие такие обследования, могут в крупных магазинах иметь свои офисы. Посетители магазина опрашиваются интервьюером в помещении магазина или могут приглашаться для дачи интервью в офис. C помощью данного метода, без использования специальных методических подходов, трудно обеспечить репрезентативность результатов обследования и вдумчивое отношение опрашиваемых к задаваемым вопросам. По сравнению с первым данный метод является более дешевым.

3. Интервью в офисах. Используется обычно при сборе информации о продукции производственно-технического и офисного назначения. Этот метод, по существу, обладает теми же достоинствами и недостатками, что и первый, однако имеет более высокую стоимость проведения, обусловленную использованием более квалифицированных интервьюеров.

4. Традиционное телефонное интервью. К числу достоинств данного метода сбора данных относятся: относительно низкая стоимость, возможность охватить большое число респондентов и обеспечить высокий уровень репрезентативности, возможность проведения за относительно короткий период времени. Методу присущи следующие недостатки: невозможность что-либо показать респонденту, невозможность получить личное впечатление от встречи с респондентами. (Правда, отсутствие личного контакта порой способствует получению правдивых ответов на вопросы о потреблении алкоголя, противозачаточных средств и т.п.) Далее – трудность получения пространных ответов на большое число вопросов, так как терпение респондента может иссякнуть. Кроме того, трудно проверить качество проведенного интервью и установить, все ли запланированные к опросу респонденты в реальности были им охвачены.

5. Телефонное интервью из специально оборудованного помещения, где одновременно работают несколько интервьюеров, к телефонам которых могут подсоединяться контролеры.

6. Телефонное интервью с помощью компьютера. Многие компании, занимающиеся опросом потребителей, специально оборудованные помещения для телефонного интервьюирования оснащают компьютерной техникой. Эта техника осуществляет автоматический набор телефонных номеров респондентов, далее на мониторе появляется вступительный текст, а затем – последовательно задаваемые вопросы с возможными вариантами ответов. Интервьюер зачитывает респонденту вопросы и с помощью кода фиксирует названный вариант ответа.

7. Полностью компьютеризованное интервью. В данном случае в дополнение к ранее описанному методу респондент отвечает на вопросы путем нажатия на кнопки своего телефона или вопросы появляются на мониторе его компьютера, а респондент вводит ответы, используя обычную компьютерную клавиатуру.

8. Групповое самостоятельное заполнение анкет. Такой подход используется для удобства и удешевления интервьюирования. Например, перед двадцатью-тридцатью членами группы демонстрируется рекламный ролик, после чего они индивидуально отвечают на вопросы анкеты, касающиеся оценки данного ролика. Участниками группы могут быть школьники одного класса, студенты одной учебной группы, отдыхающие дома отдыха и т.д.

9. Самостоятельное заполнение оставленных анкет. Является вариантом обследования на основе самостоятельного заполнения анкет. После предварительного устного разъяснения целей и задач проводимого обследования анкета оставляется у респондента. Заполненную анкету, спустя определенное время, или забирают у респондента, или он отсылает ее по почте в конверте с оплаченным ответом. Данный метод применяется при проведении опросов на ограниченной территории, не требующей от интервьюера значительных передвижений.

10. Обследование по почте. Вопросы и ответы на них посылаются по почте. Достоинства метода обусловлены тем, что не надо нанимать интервьюеров, легкостью формирования групп целевых респондентов, его дешевизной. Этот метод обладает теми же недостатками, что и методы самостоятельного заполнения анкет без участия интервьюера. Кроме того, он характеризуется низким процентом возвращенных ответов, ориентирован в основном на достаточно грамотных людей, проживающих к тому же в странах с эффективной почтовой системой.

Выбор конкретных методов обследований основан на учете следующих групп факторов: цели и ресурсы исследователя; характеристики респондентов; характеристики вопросов, задаваемых исследователем. Кратко охарактеризуем эти три группы факторов.

Цели сбора данных вытекают из целей проводимого маркетингового исследования. В основе их определения лежат требования получения информации желаемого качества. Последнее же обусловлено временем, отпущенным на принятие решения, и имеющимися ресурсами.

К числу наиболее быстро реализуемых методов относятся телефонный опрос и интервьюирование посетителей крупных магазинов. Отсутствие достаточных денежных средств также оказывает влияние на выбор метода сбора данных. Наиболее дешевым методом является телефонное интервьюирование.

Следует рассмотреть, по крайней мере, следующие характеристики целевой группы респондентов, влияющие на выбор метода сбора данных:

1. Процент респондентов, обладающих требуемыми характеристиками в общей совокупности опрашиваемых. Например, если исследуется концепция низкокалорийных продуктов питания, приготавливаемых в микроволновой печи, то в качестве целевых респондентов следует рассматривать домохозяек, имеющих микроволновые печи и которые в течение последних шести месяцев покупали низкокалорийные продукты питания.

2. Желание участвовать в опросе. Исследователя всегда беспокоит высокая степень отказа респондентов в участии в обследовании. Можно выделить два типа причин нежелания принять участие в любом обследовании. Первый обусловлен некими обобщенными чувствами подозрительности и стремлением никого не допускать в свою личную жизнь: определенная категория людей просто не хочет принимать участия в любом опросе. Второй связан со специфическими обстоятельствами проведения конкретного обследования. Например, некоторые респонденты не желают обсуждать определенные темы. Выбранный метод опроса влияет на степень желания участвовать в обследовании, Так, потенциальные респонденты находят более трудным отказаться от участия в личном интервью, чем в почтовом опросе.

3. Возможность принятия участия в опросе. Даже если потенциальный респондент удовлетворяет двум вышеизложенным требованиям, он в силу тех или иных причин может не принять участие в обследовании (командировка, болезнь, неожиданные семейные обстоятельства, забывчивость и т.п.).

Выбор методов сбора данных во многом определяется уровнем сложности вопросов. Существенное влияние на выбор метода сбора данных оказывает степень затрагивания личных интересов, взглядов, морально-этических аспектов Опыт изучения данных проблем говорит о том, что здесь менее всего подходит персональное интервью, а чаще всего наиболее приемлемым является телефонное интервью или интервью с помощью компьютера.

5.2 Вопросник и порядок его разработки

Главными инструментами реализации методов наблюдения и опроса являются анкета (вопросник) и механические устройства, например счетчики количества людей, кино- и видеокамеры. Далее будет чаше использоваться термин “вопросник”, поскольку он носит более общий характер – анкета применяется только при письменных ответах на поставленные вопросы.

Обычно процесс составления вопросника осуществляется в следующей последовательности:

  1. Определение целей опроса.
  2. Выбор методов сбора данных.
  3. Разработка вопросов.
  4. Оценка вопросов.
  5. Одобрение со стороны клиента.
  6. Тестирование.
  7. Уточнение анкет.

Определение целей опроса и выбор методов сбора данных были рассмотрены ранее. Ниже дается описание процесса непосредственного составления вопросника. Этот процесс носит итеративный характер и направлен на последовательное уточнение содержания вопросника, повышение вероятности получения достоверных ответов, исключение влияния содержания вопросов и их формата на получаемые ответы.

Вопросник обычно состоит из трех частей: введения, реквизитной части и основной части.

Главная задача введения– убедить респондента принять участие в опросе. Оно должно содержать цель проводимого опроса и призвано показать, какую пользу получит респондент, приняв в нем участие.

В реквизитной частиприводится информация, касающаяся респондентов. Кроме того, здесь идентифицируется сам вопросник, то есть ему дается название, указываются дата, время и место проведения опроса, фамилия интервьюера.

При разработке основной частивопросника следует обратить внимание на: тип вопросов (формат ответов), их содержание и число, последовательность представления вопросов в анкете, наличие контрольных вопросов.

Существуют три основных формата задаваемых вопросов: открытые вопросы, закрытые вопросы и вопросы со шкалой ответов.

Открытый вопрос– вопрос анкеты, позволяющий опрашиваемому отвечать на него “своими словами”. В таких вопросах отсутствует предвзятость, стремление навязать определенный ответ. Однако ответы на открытые вопросы требуют достаточно больших затрат времени. Кроме того, полученные ответы могут быть интерпретированы по-разному.

Закрытый вопросвключает все возможные варианты ответов, из которых опрашиваемый делает свой выбор. Использование данного типа вопросов активизирует деятельность респондентов по заполнению анкет, облегчает процесс ввода полученных данных. Главный недостаток вопросов с многовариантным выбором обусловлен трудностью формулирования всех возможных вариантов ответов, характеристик или факторов.

Вопросы со шкалой ответов содержат четкие, возможно количественные, дескрипторы, определяющие отдельные градации шкалы или ее конечные точки. На таких принципах, например, построены шкалы Лайкерта и семантической дифференциации.

Что касается метода сбора данных, то очевидно, что, скажем, телефонное интервью предполагает использование относительно простых вопросников по сравнению с опросами, проводимыми по почте.

Определяя содержание вопросов, необходимо учесть следующие обстоятельства.

Вопрос должен быть сфокусирован на одной проблеме или теме, быть кратким и понятным. Все респонденты должны понимать заданный вопрос однозначно и отвечать именно на него, а не на свои варианты его домысливания. Вопросы следует формулировать в нейтральной тональности, без некоей положительной или отрицательной оценки рассматриваемой проблемы, не должны склонять респондента к ответу, желаемому для исследователя.

При определении числа вопросов следует руководствоваться тезисом: чем их меньше, тем больше шансов получить на них ответы.

Желательно, чтобы вопросы излагались в определенной логической последовательности. Вначале следует задать вопросы, с помощью которых можно определить уровень компетентности респондентов в области проводимого исследования. Дальнейшие вопросы должны служить целям “разминки” респондентов. Эти вопросы должны быть относительно простыми, легкими для ответов, а кроме того, заинтересовывать опрашиваемых, показать им, что они легко справятся с ответами. За разминочными следуют основные вопросы.

Наиболее трудные вопросы, требующие для ответа использования специальных шкал и достаточных умственных усилий, рекомендуется ставить в середине или ближе к концу анкеты.

Вопросы, носящие чрезмерно личный характер (“Чистите ли Вы зубы каждый день?” “Часто ли Вы на своем автомобиле превышаете допустимую скорость?”), обычно помещаются среди “невинных” вопросов.

Описанное выше носит характер общих рекомендаций. Однако существуют, по крайней мере, два специальных подхода к проектированию вопросников: туннельный и секционный.

При использовании туннельного подходаимеет место постепенный переход от широких, общих вопросов к более узким, частным.

Секционный подходзаключается в том, что последовательно рассматриваются вопросы по отдельным темам, до их полного исчерпания.

На практике зачастую используется комбинация рассмотренных подходов.

Опрос может носить анонимный и конфиденциальный характер.

В первом случае респондент должен быть уверен, что его имя и другие реквизиты не будут известны исследователям. Во втором случае предполагается, что имя респондента известно только исследователю, но отнюдь не заказчику данного обследования. В телефонном опросе и при опросах, связанных с присутствием интервьюеров, опрос носит только конфиденциальный характер.

5.3 Рассмотрим понятия выборочных исследований

Рассмотрим основные понятия, используемые при проведении выборочных исследований.

Вся исследуемая группа в целом, например все потребители, купившие какой-нибудь продукт, в статистике называется генеральной совокупностьюили просто совокупностью. Иногда совокупность является достаточно малой по своей численности и можно изучить всех ее членов. Обычно же это сделать невозможно. Следовательно, проводится изучение только части совокупности, называемой выборкой.

Выборка является базовым уровнем проводимых исследований.

Необходимо отметить, что данные, полученные от выборки, скорее всего не будут в точности соответствовать данным, которые можно было бы получить от всех единиц совокупности. Различие между данными, полученными от выборки и истинными данными, называется ошибкой выборки. Ошибка выборки обусловливается двумя факторами: методом формирования выборки и размером выборки. Эти вопросы будут рассмотрены ниже.

Формирование выборки основывается прежде всего на знании контура выборки, под которым понимается список всех единиц совокупности, из которого выбираются единицы выборки. Например, если в качестве совокупности рассматривать все автосервисные мастерские города Москвы, то надо иметь список таких мастерских, рассматриваемый как контур, в пределах которого формируется выборка.

Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что не существует полного официального списка всех автосервисных мастерских города Москвы, включая полулегальный и нелегальный бизнес в данной области.

При формировании выборки используются вероятностные (cлучайные) и невероятностные (неслучайные) методы.

Если все единицы выборки имеют известный шанс (вероятность) быть включенными в выборку, то выборка называется вероятностной. Если эта вероятность неизвестна, то выборка называется невероятностной. К сожалению, в большинстве маркетинговых исследований из-за невозможности точного определения размера совокупности нельзя точно рассчитать вероятности. Поэтому термин “известная вероятность” скорее основан на использовании определенных методов формирования выборки, чем на знании точных размеров совокупности.

Вероятностные методы включают: простой случайный отбор, систематический отбор, кластерный отбор и стратифицированный отбор.

Простой случайный отборпредполагает, что вероятность быть включенным в выборку известна и является одинаковой для всех единиц совокупности. Вероятность эта определяется отношением объема выборки к размеру совокупности.

Простой случайный отбор может осуществляться с помощью следующих методов: формирование выборки вслепую и с помощью таблицы случайных чисел.

При использовании метода формирования выборки вслепую единицы совокупности в соответствии с их фамилиями, названиями или другими признаками вносятся в карточки, которые в перемешанном виде помещаются в какую-то непрозрачную емкость (ящик, коробку и т.п.). Из данной емкости кто-то случайным образом вытягивает число карточек, определяемое объемом выборки.

В таблицах случайных чисел содержатся числа, порядок включения которых в таблицу осуществлен случайным образом. Единицам совокупности присваивают порядковые номера. В таблице случайных чисел выбирают любую начальную точку и, двигаясь в произвольном направлении и произвольно меняя направление движения, выбирают необходимое количество номеров из числа присвоенных, равное заранее установленному объему выборки.

Кроме того, используются генераторы случайных чисел. Например, при телефонном интервьюировании компьютер, имеющий генератор случайных чисел, может генерировать случайным образом телефонные номера.

Начальная часть метода систематического отборасоответствует начальному этапу проведения метода простого случайного отбора: необходимо получить полный список единиц генеральной совокупности. Однако далее вместо присвоения им порядковых номеров используется показатель “интервал скачка”, рассчитанный как отношение размера совокупности к объему выборки. Например, если используется телефонный справочник и интервал скачка определен равным 250, то это означает, что каждый 250-й телефонный номер включается в выборку. Однако для определения начальных страницы и колонки справочника используются случайные числа.

Особенно широко метод систематического отбора применяется, когда для различных видов совокупностей существуют различные справочники, списки, спецификации и иные подобные материалы.

Другим методом вероятностного отбора является кластерный отбор, основанный на делении совокупности на подгруппы, каждая из которых представляет совокупность в целом. Базовая концепция данного метода очень похожа на базовую концепцию метода систематического отбора, однако реализация этой концепции осуществляется по-другому.

Предположим, что исследуется мнение населения какого-то региона относительно марки какого-либо товара. Регион разбивается на четко определяемые части (кластеры), например области. Исследователь может считать, что выделенные кластеры являются идентичными и мнение населения этих областей характерно для региона в целом. Далее одна из областей (один кластер) выбирается случайным образом, определяется совокупность для этой области, в ней проводится соответствующее исследование, а выводы распространяются на совокупность всего региона (одноступенчатый подход).

В основе всех описанных методов лежит предположение, что любая совокупность характеризуется симметричным распределением ее ключевых характеристик, – говоря иными словами, что каждая выборка достаточно полно характеризует всю совокупность и различные крайности в выборке уравновешивают друг друга. Однако такая ситуация на практике встречается крайне редко. Скажем, исследуется рыночный потенциал определенного региона для какого-то товара, но и население больших, средних и малых городов, сельской местности данного региона различается по уровню образования, доходу, образу жизни и т.п.

В случае несимметричного распределения совокупности последняя подразделяется на различные подгруппы (страты), например по уровню доходов, и выборки формируются из этих подгрупп, по сути дела являющихся сегментами рынка. Такой метод носит название стратифицированного отбора. Далее для каждой страты с помощью случайного отбора формируется выборка.

При применении невероятностных методов отбора формирование выборки осуществляется без использования понятий теории вероятности, вследствие чего невозможно рассчитать вероятность включения в выборку единицы совокупности.

Кратко охарактеризуем следующие невероятностные методы отбора: отбор на основе принципа удобства, отбор на основе суждений, формирование выборки в процессе обследования и формирование выборки на основе квот.

Смысл метода отбора на основе принципа удобствазаключается в том, что формирование выборки осуществляется самым удобным с позиций исследователя образом, например, с позиций минимальных затрат времени и усилий, с позиции доступности респондентов.

Формирование выборки на основе сужденийосновано на использовании мнений квалифицированных специалистов, экспертов относительно состава выборки. На основе такого подхода часто формируется состав фокус-группы.

Формирование выборки в процессе обследования основано на расширении числа опрашиваемых на основе предложений респондентов, которые уже приняли участие в обследовании. Первоначально исследователь формирует выборку намного меньшую, чем требуется в проводимом исследовании, затем она по мере проведения обследования расширяется.

Формирование выборки на основе квот (квотный отбор) предполагает предварительное, исходя из целей исследования, определение численности групп респондентов, отвечающих определенным требованиям (признакам). Например, в целях исследования принимается решение, что в универсаме должно быть опрошено пятьдесят мужчин и пятьдесят женщин, и интервьюер проводит опрос, пока не выберет установленную квоту.

На практике имеет место одновременное использование нескольких методов формирования выборки.

5.4 Этапы разработки выборочного плана

Рассмотренные выше понятия встраиваются в определенную логическую последовательность отдельных шагов (этапов) по разработке выборочного плана, целью которого является получение конечного варианта выборки. Можно выделить следующие обобщенные этапы разработки выборочного плана:

  1. Определение соответствующей совокупности.
  2. Получение “списка” совокупности.
  3. Проектирование выборочного плана.
  4. Достижение нужного объема выборки или ее переформирование.

Кратко охарактеризует отдельные этапы разработки выборочного плана.

На первом этапе определяется совокупность исходя из целей исследования.

На втором этапе устанавливается, откуда может быть получен перечень единиц совокупности, – это нужно для определения контура выборки. На данном этапе также необходимо оценить ошибку контура выборки.

На третьем этапе с учетом ранее выполненных работ осуществляется проектирование самой выборки. Здесь необходимо найти баланс между структурой выборки, затратами на сбор данных и объемом выборки, а также в деталях обсудить выборочные методы.

Достижение нужного объема выборки осуществляется в два этапа. Прежде всего устанавливается единица выборки, затем, исходя из этой единицы, должна быть получена требуемая информация. Однако очевидно, что на ряд выбранных респондентов в силу тех или иных причин невозможно выйти и что не каждый выбранный респондент выразит желание отвечать на вопросы. Возникает проблема замены респондентов, которая может быть решена с помощью трех методов: выбор следующего по списку респондента (например, следующего номера в телефонном справочнике), использование первоначальной выборки больших размеров и формирование повторной выборки. В последнем случае, если процент ответов оказался намного ниже, чем ожидалось, контуры исходной выборки расширяются за счет дополнительных имен, найденных, скажем, случайным образом.

Переформирование выборки осуществляется тогда, когда проверка показала, что выборка не представляет совокупность в целом. В этом случае выбираются новые респонденты, и они добавляются к ранее использованной выборке, пока не достигается удовлетворительный уровень репрезентативности.

В реальности решение об объеме выборки является компромиссом между теоретическими предположениями о точности результатов обследования и возможностями их практической реализации – прежде всего имеются в виду затраты на проведение опроса.

На практике используется несколько подходов к определению объема выборки. Прежде всего опишем наиболее простые.

Произвольный подход основан на применении “правила большого пальца”. Например, бездоказательно принимается, что для получения точных результатов выборка должна составлять 5% от совокупности. Данный подход является простым и легким в исполнении, однако при его применении не представляется возможным установить точность полученных результатов. При достаточно большой совокупности он к тому же может быть и весьма дорогим.

Объем выборки может быть установлен исходя их неких заранее оговоренных условий. Скажем, заказчик маркетингового исследования знает, что при изучении общественного мнения выборка обычно составляет 1000-1200 человек, поэтому он рекомендует исследователю придерживаться данной цифры.

В ряде случаев в качестве главного аргумента при определении объема выборки используется стоимость проведения обследования. Так, в бюджете маркетинговых исследований предусматриваются затраты на проведение определенных обследований, которые нельзя превышать, и очевидно, что ценность получаемой информации не принимается при этом в расчет. Однако в ряде случаев и малая выборка может дать достаточно точные результаты.

Объем выборки может определяться на основе статистического анализа. Этот подход основан на определении минимального объема выборки исходя из определенных требований к надежности и достоверности получаемых результатов.

Наиболее теоретически обоснованный и корректный подход к определению объема выборки основан на расчете доверительных интервалов, в основе которых лежит ряд базовых понятий математической статистики (вариация, среднее квадратическое отклонение, доверительный интервал, средняя квадратическая ошибка). Краткое описание данных понятий приводится в приложении.

На основе этих понятий с учетом ряда предположений выводятся формулы расчета объема выборки. Все формулы для расчета объема выборки предполагают, что репрезентативность гарантируется путем использования корректных вероятностных процедур формирования выборки. (Более подробную информацию по данным вопросам можно получить из работ [2, 3, 4].)

5.5 Организация и проведение сбора данных

Существуют по крайней мере три альтернативных подхода к сбору данных: осуществлять это самим, осуществлять путем создания специальной группы или путем привлечения коммерческих компаний, специализирующихся на сборе данных.

В первом случае сотрудники маркетинговой службы организации своими силами производят сбор данных – скажем, путем интервьюирования.

Специальная группа обычно комплектуется из специалистов не очень высокой квалификации, например студентов, для проведения телефонного или персонального интервьюирования.

Услуги специализированных компаний, осуществляющих маркетинговые исследования, в большинстве случаев обеспечивают быстрое и качественное получение маркетинговых данных. Однако стоимость их услуг в три-пять раз превышает стоимость других двух подходов к сбору данных. Поэтому ее необходимо сопоставлять с качеством и надежностью получаемой информации.

Большое значение имеет правильное проведение сбора данных. При личном интервьюировании необходимо представиться и сказать несколько слов о проводимом исследовании. При использовании анкеты данная информации должна содержаться в ее вводной части. Следует подчеркивать конфиденциальность ответов. Скажите, сколько времени займет опрос. Не начинайте с вопросов о доходах и других вопросов личного характера. Помогайте респонденту разобраться в сложных вопросах.

При сборе данных могут иметь место многие погрешности – другие, нежели ошибки выборки, называемые поэтому невыборочными ошибками.

Невыборочные ошибки включают: 1) типы ошибок, обусловленные тем, что не все респонденты дали ответы; 2) ошибки сбора данных; 3) ошибки обращения с полученными данными; 4) ошибки анализа собранных данных; 5) ошибки интерпретации полученных результатов. Кроме того, существуют ошибки, обусловленные нечетким выявлением проблем, использованием неоднозначных терминов, и т.п.

Невыборочные ошибки можно классифицировать на ошибки лиц, осуществляющих сбор данных, и ошибки респондентов. Кроме того, невыборочные ошибки подразделяются на преднамеренные и на непреднамеренные.

Преднамеренные ошибки лица, собирающего информацию, имеют место, когда оно сознательно нарушает установленные исследователем требования к сбору данных.

Непреднамеренная ошибка лица, собирающего информацию, главным образом определяется неправильным пониманием интервьюером отдельных аспектов сбора данных, изложенных в различных инструкциях, хотя ему и кажется, что он все делает правильно.

Существуют два вида преднамеренных ошибок респондентов.

Первый вид обусловлен стремлением респондента фальсифицировать свои ответы вследствие определенного замешательства, нежелания отвечать на персональные вопросы (об уровне дохода, о национальности, возрасте, семейном положении и т.п.), из-за подозрения, что интервьюер преследует какие-то свои цели.

Второй вид обусловлен отказом респондента отвечать на вопросы из-за своей занятости, нежелания открывать личные аспекты своей жизни, предубежденности к опросам.

Непреднамеренная ошибка респондента возникает в случае, когда респондент, думая, что говорит правду, на самом деле дает ошибочный ответ.

Контроль за преднамеренными ошибками интервьюеров осуществляется двумя способами: путем надзора за их работой и путем проверки выполненной работы. Надзор осуществляется, например, незаметным подключением к телефонной линии, по которой берется интервью. При устном интервьюировании интервьюера может сопровождать проверяющее лицо.

Контроль за преднамеренными ошибками респондентов направлен на снижение числа случаев лжи и отказа участвовать в обследовании. Для этого прежде всего необходимо сохранять анонимность и конфиденциальность.

Контроль за непреднамеренными ошибками респондентов осуществляется в различных формах. Необходимо тщательно составлять вопросники и инструкции к ним, использовать разнонаправленные шкалы измерений. Для уменьшения числа ответов-предположений в шкалы вводятся такие градации, как “не имею мнения”, “не могу вспомнить”, “не уверен”.

Можно выделить три типа ошибок, обусловленных нежеланием респондентов отвечать на вопросы: из-за отказа вообще принять участие в обследовании, из-за прекращения участия в нем и из-за отказа отвечать на определенные вопросы.

Перед тем как табулировать и анализировать данные проведенного обследования, целесообразно произвести их предварительную проверку и выявить ошибки респондентов. Жестких правил в данной области не существует, и они основаны на традициях, опыте и т.п., то есть на неформальных подходах к определению, какие анкеты пригодны для последующего анализа, а какие нет. Поэтому лучше ужесточить контроль за сбором анных, уменьшив таким образом проблемы предварительной оценки собранных данных.

5.6 Анализ данных и подготовка заключительного отчета

Анализ данных начинается с перевода полученных “сырых” сведений в осмысленную информацию и включает их введение в компьютер, проверку на предмет выявления ошибок, кодирование, представление в матричной форме (табулирование). Обычно закодированные исходные данные представляются в виде матрицы, столбцы которой содержат ответы на различные вопросы анкеты, а ряды – респондентов или изучаемые ситуации. Все это называется преобразованием исходных данных.

Далее проводится статистический анализ, т.е. определяются средние величины, частоты, корреляционные и регрессионные соотношения, осуществляется анализ трендов.

Выделяют пять основных видов статистического анализа, используемых при проведении маркетинговых исследований: дескриптивный анализ, выводной анализ, анализ различий, анализ связей и предсказательный анализ. Иногда эти виды анализа используются по отдельности, иногда – одновременно.

В основе дескриптивного анализалежит использование двух групп статистических мер. Первая включает меры “центральной тенденции”, или меры, которые описывают типичного респондента или типичный ответ (средняя величина, мода, медиана). Вторая включает меры вариации, или меры, описывающие степень схожести или несхожести респондентов или ответов относительно “типичных” респондентов или ответов (распределение частот, размах вариации и среднее квадратическое отклонение).

Существуют и другие описательные меры, например меры асимметрии (насколько найденные кривые распределения отличаются от нормальных кривых распределения). Однако они используются не столь часто, как вышеупомянутые, и не представляют особого интереса для заказчика.

Анализ, в основе которого лежит использование статистических процедур (например, проверка гипотез) с целью обобщения полученных результатов на всю совокупность, называется выводным анализом. Вывод является видом логического анализа, направленного на получение общих заключений о всей совокупности на основе наблюдений за малой группой единиц данной совокупности.

Выводы делаются на основе анализа малого числа фактов. Например, если два ваших товарища, имеющие одну и ту же марку автомобиля, жалуются на его качество, то вы можете сделать вывод о низком качестве данной марки автомобиля в целом.

Статистический же вывод основан на статистическом анализе результатов выборочных исследований и направлен на оценку параметров совокупности в целом. В данном случае результаты выборочных исследований являются только отправной точкой для получения общих выводов. Например, автомобилестроительная компания провела два независимых исследования с целью определения степени удовлетворенности потребителей своими автомобилями. Первая выборка включала 100 потребителей, купивших данную модель в течение последних шести месяцев. Вторая выборка включала 1000 потребителей. В ходе телефонного интервьюирования респонденты отвечали на вопрос: “Удовлетворены или не удовлетворены вы купленной вами моделью автомобиля?” Первый опрос выявил 30% неудовлетворенных, второй – 35%.

Поскольку существуют ошибки выборки и в первом, и во втором случаях, то здесь можно рассуждать следующим образом. Для первого случая около 30% опрошенных выразили неудовлетворенность купленной моделью автомобиля, для второго случая – около 35% опрошенных. Какой же общий вывод можно сделать в данном случае? Как избавиться от слова “около”? Для этого введем показатель ошибки: 30% + x% и 35% + y% и сравним x и y. Используя логический анализ, можно прийти к заключению, что бо2льшая выборка содержит меньшую ошибку и что на ее основе можно сделать более правильные выводы о мнении всей совокупности потребителей. Видно, что решающим фактором для получения правильных выводов является размер выборки. Данный показатель присутствует во всех формулах, определяющих содержание различных методов статистического вывода.

Анализ различийиспользуется для сравнения результатов исследования двух групп (двух рыночных сегментов) с целью определения степени реального различия в их поведении, в реакции на одну и ту же рекламу и т.п.

Проверка существенности различий заключается в сопоставлении ответов на один и тот же вопрос, полученных для двух

Автор: Голубков Е.П.,
академик Международной академии информатизации,
д.э.н., профессор АНХ при Правительстве РФ
Источник: Опубликовано в журнале “Маркетинг в России и за рубежом” №1 за 2001

1. Методология маркетинговых исследований

Тема Процедура выборки

2. Вопросы лекции

Основные понятия, используемые при проведении
выборочных исследований. Генеральная совокупность.
Выборка. Контур выборки. Единица и объем выборки.
Ошибка выборки.
Проблемы формирования выборки
Репрезентативность выборки.
Типы выборок. Виды вероятностной выборки. Виды
невероятностной выборки.
Комбинация типов выборки при проведении
исследования. Многоступенчатая выборка.
Этапы разработки выборочного плана. Подходы к
определению объема выборки. Ошибка выборки.

3. Почему появляются выборки?

Для маркетинговых целей
в целях экономии времени
и средств весьма типично
подвергать исследованию
лишь небольшую часть
той группы людей или
предприятий
(генеральной
совокупности), которая
представляет интерес для
исследователей.
Она обычно составляет
несколько сотен, иногда
тысячу объектов.

4. Суть выборочного метода

Суть выборочного метода заключается в том, что
по определенным правилам из общей
численности генеральной совокупности
отбирается ограниченное число единиц, которое
призвано в качестве своеобразной модели
воспроизводить структуру всей генеральной
совокупности
Генеральная совокупность — та часть объекта
исследования, которая локализована по времени
и территориально, и на нее распространяются
все выводы исследования

5. Примеры генеральных совокупностей:

Все жители Нижнего Новгорода (1267760 человек
по данным 2015 года)
Юридические лица России (2,2 млн. на начало
2008 года)
Розничные торговые точки, осуществляющие
продажу продуктов питания (20 тысяч на начало
2008 года) и т.д.

6. Выборка. Контур выборки

Ограниченное число единиц, выбранное из
генеральной совокупности (равно как и процедура по
их определению) именуется выборкой.
Контур выборки – это наличие полного списка всех
элементов генеральной совокупности.
Контур выборки неизбежно содержит ошибку,
называемую ошибкой контура выборки и
характеризующую степень отклонения от истинных
размеров совокупности.
Пример: Очевидно, что не существует полного официального списка всех
автосервисных мастерских города Москвы, включая полулегальный и
нелегальный бизнес в данной области. Исследователь должен
информировать заказчика работы о размерах ошибки контура выборки.

7.

8. Итак, основные понятия:

Генеральная совокупность – вся группа, про
которую необходимо собрать информацию;
Выборка – часть совокупности, базовый уровень
исследования;
Ошибка выборки – разница между полученными
данными и фактическими по совокупности;
Контур выборки – все единицы совокупности, из
которых будет формироваться выборка;
Ошибка контура выборки – степень отклонения
контура выборки от генеральной совокупности;
Единица выборки – объект исследования

9. Три главные проблемы формирования выборки

Прежде всего, исходя из сути рассматриваемой
задачи, необходимо определить, кто является
единицей выборки.
Очень важным является также определение
контура выборки.
В целях выполнения правила репрезентативности
проводимого исследования необходимо обратить
внимание на метод, с помощью которого
выбираются единицы выборки
И наконец, необходимо решить вопрос об объеме
выборки, который определяет число изучаемых
единиц выборки.

10. Репрезентативность выборки

Цель отбора объектов в состав выборки всегда
состоит в получении такой совокупности, которая
по своим качествам репрезентирует ту, которую мы
намереваемся изучить
Под репрезентативностью в маркетинговых
исследованиях понимают такие свойства выборки,
которые позволяют ей выступать на момент опроса
моделью, представителем генеральной
совокупности.
Важно понимать, что репрезентативность выборки и
ошибка выборки – разные явления. Репрезентативность,
в отличие от ошибки никак не зависит от размера
выборки

11. Репрезентативность выборки

Одна и та же выборка может быть репрезентативной
и нерепрезентативной для разных генеральных
совокупностей
Пример:
— Выборка, целиком состоящая из москвичей,
владеющих автомобилем, не репрезентирует все
население Москвы.
— Выборка из российских предприятий численностью
до 100 человек не репрезентирует все предприятия
России.
— Выборка из москвичей, совершающих покупки на
рынке, не репрезентирует покупательское поведение
всех москвичей.

12. Репрезентативность выборки

В то же время, указанные выборки (при
соблюдении прочих условий) могут отлично
репрезентировать москвичей-автовладельцев,
небольшие и средние российские
предприятия и покупателей, совершающих
покупки на рынках соответственно.
Как бы мы не увеличивали количество
опрошенных москвичей-автовладельцев, мы
не сможем репрезентировать этой выборкой
всех москвичей.

13. Группы выборочных методов (типы выборки)

Вероятностная выборка (случайная) –
это такая выборка, для которой каждый
элемент генеральной совокупности имеет
определенную, заранее заданную
вероятность быть отобранным.
Это позволяет исследователю рассчитать,
насколько правильно выборка отражает
популяцию, из которой она спроектирована
(рассчитать ошибку выборки).

14. Неслучайная (невероятностная) выборка Еще одно название -детерминированная

Неслучайная (невероятностная)
выборка – это такой способ отбора
единиц, при котором мы не можем заранее
рассчитать вероятность каждого элемента
попасть в состав выборочной
совокупности.
Данный тип выборки не дает возможности
рассчитать, насколько правильна
(репрезентативна) выборка
Иногда по условиям исследования
оказывается единственно возможным
провести неслучайную выборку.

15.

16. Метод простого случайного отбора

Метод простого случайного отбора
предполагает, что вероятность быть избранным в
выборку известна и является одинаковой для всех
единиц совокупности. Для этого используется:
— Лотерейный метод (жребия)
— Таблицы случайных чисел
Главное условие осуществления вероятностной
выборки – наличие полного списка (контура) всех
элементов генеральной совокупности.
Использование простого случайного отбора
гарантирует, что каждая единица совокупности
известна и имеет равные шансы быть включенной
в выборку.

17. Лотерейный метод (жребия)

При использовании лотерейного метода
(или метода жребия) жетоны с номерами
всех элементов помещают в урну,
тщательно перемешивают и извлекают
последовательно n жетонов, где n – число
элементов выборочной совокупности.
Элементы генеральной совокупности,
имеющие номера оказавшиеся на
извлеченных жетонах, будут составлять
выборочную совокупность.

18. Фрагмент таблицы случайных цифр

37
52
35
15
04
80
44
83
21
28
31
42
46
72
13
20
07
99
95
64
13
06
27
29
10
16
69
93
39
08
09
38
00
84
65
56
09
29
67
19

19. Комментарий к использованию таблицы случайных цифр

Если мы имеем, скажем, популяцию (то есть генеральную
совокупность) из 1507 элементов и хотим спроектировать выборку
численностью 150 элементов, мы можем выбирать любые два
смежных столбца в таблице случайных чисел: цифры, стоящие в
двух смежных ячейках будут образовывать четырехзначное число.
Каждый раз, когда будет появляться число от 0001 до 1507, мы
будем считать, что оно обозначает номер отбираемого элемента.
Когда число появляется более чем один раз, этот номер
игнорируется после первого раза.
Если мы начнем с первых четырех столбцов в таблице, спускаясь
по столбцам, то в выборку будут включены элементы под номерами
0799, 1016, 0084, 480, 1306, 929, 1320 и 938.
Поскольку мы не стремимся умышленно отыскать определенное
число, мы можем начать с любого места таблицы и использовать
любую систему для движения по таблице.
С тем же успехом случайные числа могут генерироваться
специальной программой компьютера.

20. Метод систематической (или механической) выборки

На практике чаще всего
используют метод
систематической (или
механической) выборки,
когда из
пронумерованного списка
через равные интервалы k
отбирается заданное число
респондентов. При этом
шаг выборки k (интервал
скачка) рассчитывается по
простой формуле:
N
k
n
где N – численность
генеральной совокупности
n – численность
выборочной совокупности.

21. Пример систематической (или механической) выборки

Предположим, что нам нужно спроектировать выборку
численностью 100 из списка 5000 студентов какого-то вуза.
Если мы намерены использовать систематическую выборку, то
должны вначале рассчитать интервал выборки делением числа
элементов в списке на размер выборки.
В данном случае, разделив общую численность студентов 5000 на
требуемый размер выборки 100 единиц, мы получим интервал
(шаг) выборки 50.
Далее будем систематически двигаться по списку и отбирать
каждого пятидесятого студента (отобрав таким образом 100 имен).
Определение того места в списке, с которого мы начнем,
проводится случайным образом, по таблице случайных чисел
(это называется случайный старт).
Таким образом, если случайно выбрана точка старта под номером
31, то в выборку будут включены студенты, стоящие под номерами
31, 81, 131, 181 и т.д.

22. Метод кластерного отбора. (гнездовая или серийная выборка)

Метод кластерного отбора основан на
делении совокупности на подгруппы, каждая
из которых представляет совокупность в
целом.
Здесь отбираются не объекты исследования
(например, люди), а группы. Группы отбираются
случайным образом, а внутри них проводится
сплошной опрос. Например, в ВУЗе с большим
количеством студенческих групп отбор можно
проводить путем случайного отбора этих групп и
дальнейшего сплошного опроса в этих группах

23. Пример кластерного отбора

Предположим, что исследуется мнение населения
какого-то региона относительно марки какого-то товара.
Регион разбивается на четко определяемые части
(кластеры), например области.
Исследователь может считать, что выделенные кластеры
являются идентичными и мнение населения этих
областей характерно для региона в целом.
Далее одна из областей (один кластер) выбирается
случайным образом, определяется совокупность для
этой области, в ней проводится соответствующее
исследование, а выводы обобщаются на совокупность
всего региона

24. Причины появления стратифицированного отбора (типической или районированной выборки)

В основе всех вероятностных методов лежит
предположение, что любая совокупность характеризуется
симметричным распределением ее ключевых
характеристик. Другими словами, каждая выборка
достаточно полно характеризует всю совокупность,
различные крайности в выборке уравновешивают друг
друга.
Но такая ситуация на практике встречается крайне редко.
Скажем, исследуется рыночный потенциал определенного
региона для какого-то товара. Население больших, средних
и малых городов, сельской местности данного региона
отличается по уровню образования, дохода, образу жизни
и т.п. В таком случае необходим стратифицированный
отбор

25. Понятие стратифицированной выборки

При наличии в составе генеральной
совокупности различных типов явлений с
разными уровнями изучаемых признаков
организуют стратифицированную выборку,
чтобы обеспечить более равномерное
представительство в выборочной совокупности
различных частей (типов) явления.
Генеральная совокупность разделяется на различные
подгруппы (страты), например по уровню доходов, и
выборки формируются из этих подгрупп, по сути
дела являющихся сегментами рынка.

26. Условия осуществления стратифицированной выборки

При использовании данного метода прежде всего
следует выбрать некоторую наблюдаемую
характеристику (признак), характеризующую каждую
единицу совокупности, например уровень дохода.
Далее для каждой страты с помощью случайного
отбора формируется выборка.
Стратифицированная выборка может быть применена
лишь при наличии дополнительной информации о
генеральной совокупности (например, нам необходимо
процентное соотношение мужчин и женщин, в случае,
если мы хотим стратифицировать выборку по полу).
Отсутствие такой информации делает применение
стратифицированной выборки невозможным

27. Методы (типы) невероятностной выборки

Отбор в такой выборке осуществляется не по
принципам случайности, а по субъективным
критериям – доступности, типичности,
равного представительства и т.д.
При применении невероятностных методов
отбора формирование выборки
осуществляется без использования понятий
теории вероятностей, вследствие чего
невозможно рассчитать вероятность
включения в выборку единицы
совокупности.

28. Нерепрезентативный отбор. Метод стихийной выборки: отбор на основе удобства и доступности

Смысл метода заключается в том, что
формирование выборки осуществляется
самым удобным с позиций исследователя
образом, например, с позиций минимальных
затрат времени и усилий, с позиции
доступности респондентов.
Выбор места исследования и состава выборки
производится субъективным образом, например,
опрос покупателей осуществляется в магазине,
ближайшем к месту жительства исследователя.
Очевидно, что многие представители
совокупности не принимают участия в опросе.

29. Метод экспертного отбора (на основе суждения)

Метод основан на использовании мнения
квалифицированных специалистов, экспертов
относительно состава выборки. На основе такого
подхода часто формируется состав фокус-группы.
Например, изучается потребность в издании
кулинарной книги для приготовления в
микроволновой печи низкокалорийной пищи. На
основе мнения исследователей в состав фокусгруппы было включено 12 домохозяек; шестеро из
них владело микроволновыми печами более трех
лет, трое — менее трех лет и трое только
собирались их купить.

30. Метод квотной выборки

Формирование выборки на основе квот
(квотный отбор) предполагает
предварительное, исходя из целей
исследования, определение состава и
численности групп респондентов, отвечающих
определенным требованиям (признакам).
Например, мужчины в возрасте 20-30 лет, 31-45
лет и 46-60 лет; лица с доходом до 30 тысяч
рублей, с доходом от 30 до 60 тысяч рублей и с
доходом свыше 60 тысяч рублей)

31. Метод квотной выборки

Для каждой группы задается количество объектов,
которые должны попасть выборку и быть обследованы.
Количество объектов, которые должны попасть в
каждую из групп, задается, чаще всего, либо
пропорционально заранее известной доле группы в
генеральной совокупности, либо одинаковым для
каждой группы.
Внутри групп объекты отбираются произвольно.
Квотные выборки используются в маркетинговых
исследованиях достаточно часто

32. Пример квотной выборки

Приведем пример расчета выборки по
таким параметрам квоты как пол и возраст.
В одном из маркетинговых исследований
при опросе населения, исследователи
опирались на данные Областного комитета
по статистике о половозрастной структуре
населения районов города.
Так, половозрастная структура населения
Советского района Нижнего Новгорода
выглядела следующим образом:

33.

Генеральная совокупность
численность
Выборочная
совокупность
Доля, %
число
Всего
муж.
жен.
муж.
жен.
всего
муж.
жен.
всего
128546
55757
72789
43,4
56,6
100,00
521
679
1200
20 — 24
11958
6009
5949
50,3
49,7
9,30
56
56
112
25 — 29
11858
6520
5338
55,0
45,0
9,22
61
50
111
30 — 34
12093
5861
6232
48,5
51,5
9,41
55
58
113
35 — 39
14360
6795
7565
47,3
52,7
11,17
63
71
134
40 — 44
14112
6598
7514
46,8
53,2
10,98
62
70
132
45— 49
12779
5840
6939
45,7
54,3
9,94
55
65
119
50 — 54
7274
3222
4052
44,3
55,7
5,66
30
38
68
55 — 59
11981
5035
6946
42,0
58,0
9,32
47
65
112
60 — 69
17503
6828
10675
39,0
61,0
13,62
64
100
163
70 и старше
14628
3049
11579
20,8
79,2
11,38
28
108
137
Основа выборки
Возраст (лет)

34. Пример квотной выборки

Изучая данные таблицы, нетрудно убедиться, что
численность каждой из половозрастных групп в
трех последних столбцах таблицы (объеме
выборки) пропорциональна численности каждой из
соответствующих групп в генеральной
совокупности. Такая выборка называется
пропорциональной.
Иногда используются и непропорциональные
выборки, если это необходимо исходя из целей
исследования
Таким образом на основе определенных заданных
параметров создается микромодель
генеральной совокупности

35. Метод снежного кома

Формирование выборки в процессе опроса основано на
расширении числа опрашиваемых на основе предложений
респондентов, которые уже приняли участие в
обследовании.
У каждого респондента, начиная с первого, просят
контакты его друзей, коллег, знакомых, которые подходили
бы под условия отбора и могли бы принять участие в
исследовании.
Таким образом, за исключением первого шага, выборка
формируется с участием самих объектов исследования.
Метод часто применяется, когда необходимо найти и
опросить труднодоступные группы респондентов
(например, респондентов, имеющих высокий доход,
респондентов, принадлежащих к одной профессиональной
группе, респондентов, имеющих какие-либо схожие
хобби/увлечения и т.д.)

36. Комбинация типов выборки при проведении исследования: многоступенчатая выборка

Многоступенчатая выборка –строится с
применением процедуры поэтапного отбора
объектов опроса.
При этом совокупность объектов, отобранных
на предыдущем этапе (ступени), становится
исходной для отбора на следующем.
Промежуточные объекты, составляющие
выборочную совокупность на высших
ступенях, называют единицами отбора.
Объекты самой нижней ступени, с которых
ведется непосредственный сбор информации,
называются единицами наблюдения.

37. Пример многоступенчатой выборки

Так, формирование выборки для оценки мнения населения России
относительно различных марок какого-либо товара, например
холодильника, может осуществляться по следующей схеме:
1. Россия, согласно ее административно — территориальному
делению, делится на 89 субъектов Федерации.
2. Осуществляется случайным образом выбор девяти субъектов
(исключая Москву и С.-Петербург).
3. Все населенные пункты (исключая Москву и С.-Петербург) в
зависимости от численности населения делятся на шесть групп:
до 1000 жителей, от 1000 до 10 000 (поселки), от 10 000 до 100
000, от 100 000 до 500 000, свыше 500 000 (города). Москва и С.Петербург исследуются отдельно.
4. На основе квотного метода устанавливается, что для каждого из
девяти выбранных субъектов Федерации исследуются три города
и два поселка

38. Пример многоступенчатой выборки

Для этого берется каждый пятый населенный пункт из справочника
Госкомстата «Численность населения Российской Федерации по
городам, рабочим поселкам и районам и определяется, в какую из
категорий он попадет (систематический отбор). Так поступают
до тех пор, пока не наберется нужное количество населенных
пунктов. Если, дойдя до конца списка, не будет найдено квотное
число населенных пунктов, процесс выбора населенных пунктов
начинается сначала, но берется каждый четвертый населенный
пункт, и т.д.
5. Выбирается случайным образом в каждом выбранном городе и
поселке по меньшей мере 20 респондентов.
Таким образом, кроме Москвы и С.-Петербурга должно быть
проинтервьюировано 900 респондентов. В Москве и С.Петербурге опрашивается по 50 респондентов. В итоге должно
быть проинтервьюировано 1000 респондентов.

39. Этапы разработки выборочного плана

1. Определение соответствующей совокупности
согласно поставленным целям исследования.
2. Получение «списка» совокупности для
установления контура выборки.
3. Проектирование выборочного плана –
определение состава и объема выборки.
4. Определение методов доступа к совокупности.
5. Достижение нужной численности выборки.
6. Проверка выборки на соответствие требованиям.
7. В случае необходимости формирование новой
выборки.

40. Определение объема выборки

Исходным пунктом расчета объема выборки
становится вопрос об определении размеров
выборочной совокупности.
Численность выборочной совокупности зависит от
двух факторов:
(1) стоимости сбора информации
(2) стремления к определенной степени
статистической достоверности результатов,
которую надеется получить исследователь.
Чем больше размеры выборки, то есть чем ближе
они к размерам генеральной совокупности в
целом, тем более надежны и достоверны
полученные данные.

41. Определение объема выборки

Самый спорный вопрос по выборочному
плану.
На практике, решение о объеме выборки
всегда есть компромисс между точностью
результатов исследования и затратами на
проведение исследования.
Способ определения объема выборки
зависит от того, имеется ли у
исследователя информация о составе
генеральной совокупности

42. Связь между объемом выборки и репрезентативностью

Следует отметить, что объем выборки никак не
влияет на репрезентативность полученных
результатов.
Пример: Предположим, например, что в целях
изучения степени использования в России
персональных компьютеров в научной работе
проводился опрос на основе принципа удобства
на одном из московских перекрестков. И хотя
было опрошено 5000 респондентов, полученные
результаты не являются репрезентативными даже
для Москвы.
Это обусловлено тем, что был использован метод
формирования выборки, который в данном случае
применять было нельзя.

43. Методы определения объема выборки Если исходная информация о генеральной совокупности отсутствует, то используется:

Правило большого пальца –
бездоказательно принимается, что для
получения нужных результатов
выборка должна составлять, например,
5% от генеральной совокупности
Исходя из заранее оговоренных с
заказчиком условий (он рекомендует
цифры выборки)

44. Методы определения объема выборки Если исходная информация о генеральной совокупности отсутствует, то используется:

Многолетний опыт социологов-практиков. Он
свидетельствует о том, что при массовых опросах,
если величина генеральной совокупности
составляет менее 5000, то достаточный объем
выборочной совокупности должен быть не менее
500 человек.
Если величина генеральной совокупности
составляет более 5000, то для получения
статистически значимых результатов нужно
обследовать 10% ее состава, но не более 2000-2500
единиц.

45.

Зависимость объема выборки от ее ошибки
(размер генеральной совокупности составляет 20 тыс.
единиц)
Ошибка
выборки,
%
2
3
4
5
6
7
8
9
10
Объем
выборки,
ед.
2500
1100
620
400
280
200
160
110
100
12
67
14
50
17
30
20
25

46. Зависимость объема выборки от ее ошибки

В.И. Паниотто приводит следующие расчеты
репрезентативной выборки с допущением 5процентной ошибки:
Объем
генеральной
совокупности
500 1000 2000 3000
4000
5000
10000
100000
Объем
выборки
222 286
360
370
385
358
333
350

47. Комментарии к таблице

Суть данных, приведенных в этой таблице, состоит в
следующем. Если вы, опросив, предположим, 400
человек в районном городе, где численность взрослого
платежеспособного населения составляет 100 тысяч
человек, выявили, что 33 процента опрошенных
покупателей предпочитают продукцию местного
мясокомбината, то с 95-процентной степенью
вероятности можете утверждать, что постоянными
покупателями этой продукции являются 33 5% (то
есть от 28 до 38 процентов) жителей этого города.
Уровень уверенности в 95% – это условие, оно
показывает 95% уверенности в том, что параметр
популяции попадает в пределы допуска ошибки
выборочной статистики.

48. Методы определения объема выборки Если исходная информация о генеральной совокупности имеется, то:

Наиболее теоретически обоснованный и
корректный подход к определению
объемов выборки основан на расчете
доверительных интервалов.
Метод требует понимания некоторых
базовых понятий математической
статистики (закона нормального
распределения, меры вариации, среднего
квадратического отклонения,
доверительного интервала и т. д.)

49. Понятие вариации

Понятие вариации характеризует величину
несхожести (схожести) ответов респондентов на
определенный вопрос.
В более строгом плане вариацией значений какоголибо признака в совокупности называется различие
его значений у разных единиц данной совокупности
в один и тот же период или момент времени.
Результаты ответов на вопросы опроса обычно
представляются в форме кривой распределения.
При высокой схожести ответов говорят о малой
вариации (узкая кривая распределения) и при
низкой схожести ответов — о высокой вариации
(широкая кривая распределения).

50. Кривые распределения результатов ответа на вопрос: «Сколько миль за год проходит ваш автомобиль?»

51. Среднее квадратическое отклонение

В качестве меры вариации обычно принимается
среднее квадратическое отклонение, которое
характеризует среднее расстояние от средней
оценки ответов каждого респондента на
определенный вопрос.
Можно сравнить среднее квадратическое
отклонения для двух выборок и определить, для
какой из них вариация является меньшей.
Поскольку все маркетинговые решения
принимаются в условиях неопределенности, то
это обстоятельство целесообразно учесть при
определении объема выборки.

52. «Доверительный интервал»

Так как определение исследуемых величин для
совокупности в целом осуществляется на основе
выборочной статистики, то следует установить
диапазон (доверительный интервал), в который, как
ожидается, попадут оценки для совокупности в целом,
и ошибку их определения.
Понятие «доверительный интервал» — это диапазон,
крайним точкам которого соответствует определенный
процент определенных ответов на какой-то вопрос.
Данное понятие тесно связано с понятием «среднее
квадратическое отклонение изучаемого признака в
генеральной совокупности»: чем оно больше, тем шире
должен быть доверительный интервал, чтобы
включить в свой состав, например, 95% ответов.

53. Пример

Проведено исследование числа визитов
автовладельцев в сервисные мастерские за год.
Доверительный интервал для среднего числа
визитов был рассчитан равным 5—7 визитам при
99%-ном уровне доверительности (надежности
выборки).
Это означает, что если появится возможность
провести независимо 100 раз выборочные
исследования, то для 99 средних значений числа
визитов попадут в диапазон от 5 до 7 визитов —
другими словами, 99% автовладельцев попадут в
доверительный интервал. (в 99 случаях результат
будет находиться в указанных границах)

54. Важно понимать!

Выборка всегда дает более относительный
результат по сравнению с генеральной
совокупностью.
Всегда есть вероятность отклонения, которая
считается ошибкой выборки (измеряется в
процентах)

55. Средняя квадратическая ошибка выборки

Индикатором степени отличия оценки, истинной
для совокупности в целом, от оценки, которая
ожидается для типичной выборки, является
средняя квадратическая ошибка выборки.
Например, исследуется мнение потребителей о новом
продукте и заказчик данного исследования указал, что
его устроит точность полученных результатов,
равная ±5% (ошибка выборки)
Предположим, что 30% членов выборки высказалось за
новый продукт. Это означает, что диапазон возможных
оценок для всей совокупности составляет 25—35%.

56. Определение объема выборки на основе расчета доверительного интервала

Исходной информацией, необходимой для
реализации данного подхода, является:
Величина вариации, которой, как
считается, обладает совокупность.
Желаемая точность.
Уровень доверительности, которому
должны удовлетворять результаты
проводимого обследования.

57. Когда на заданный в анкете вопрос существует только два варианта ответа, выраженные в процентах (используется процентная мера), объем выбо

Когда на заданный в анкете вопрос существует только два
варианта ответа, выраженные в процентах (используется
процентная мера), объем выборки определяется по следующей
формуле:

58.

59. Пример расчета объема выборки

Фирмой, выпускающей покрышки, проводится опрос
автолюбителей. Целью обследования является
определение процента автолюбителей, использующих
радиальные покрышки, поэтому на вопрос:
«Используете ли вы радиальные покрышки?»
возможно только два ответа: «Да» или «Нет» (шкала
наименований).
Если предположить, что совокупность автолюбителей
обладает низким показателем вариации, то это
означает, что почти каждый опрошенный использует
радиальные покрышки. В этом случае может быть
сформирована выборка достаточно малых размеров. В
формуле (4.1) произведение pq выражает вариацию,
свойственную совокупности.

60. Пример расчета объема выборки

Предположим, что 90% единиц
совокупности используют радиальные
покрышки. Это означает, что рq = 900. Если
принять, что показатель вариации выше (р
= 70%), то рq = 2100.
Наибольшая вариация достигается в
случае, когда половина совокупности
(50%) используют радиальные покрышки, а
другая (50%) — не использует. В этом
случае произведение рq достигает
наибольшего значения, равного 2500

61. Пример расчета объема выборки

При проведении исследования следует
указать точность полученных оценок
(точность выборки).
Скажем, в результате исследования было
установлено, что 44% респондентов
используют радиальные покрышки.
В этом случае результаты измерения
желательно представить в виде: «Процент
автолюбителей, использующих
радиальные покрышки, составляет 44%
плюс-минус …%».

62. Пример расчета объема выборки

Что касается уровня доверительности, то при
проведении маркетинговых исследований, обычно
рассматриваются только два его значения: 95%
или 99%.
Первому значению соответствует значение z =
1,96, второму — z = 2,58.
Если выбирается уровень доверительности,
равный 99%, то это говорит о том, что мы
уверены на 99% (другими словами, доверительная
вероятность равна 0,99) в том, что процент
членов совокупности, попавших в диапазон ± е%,
равен проценту членов выборки, попавших в тот
же диапазон ошибки.

63. Пример расчета объема выборки

Принимая вариацию,
равную 50%,
точность, равную ± 10%,
при 95%-ном уровне
доверительности,
рассчитаем размер
выборки:
При уровне
доверительности,
равном 99%, и е =
±3% n = 1067.

64. Важно понимать!

Приведенные формулы расчета объема выборки
основаны на предположении, что все правила
формирования выборки были соблюдены и
единственной ошибкой выборки является ошибка,
обусловленная ее объемом.
Однако следует помнить, что объем выборки
определяет точность полученных результатов, но
не их представительность, которая определяется
методом формирования выборки.
Все формулы для расчета объема выборки
предполагают, что репрезентативность
гарантируется использованием корректных
процедур формирования выборки.

65. Систематическая ошибка выборки

Систематическая ошибка зависит от различных
факторов, оказывающих постоянное воздействие
на исследование и смещающих результаты
исследования в определенную сторону.
Пример:
— Использование любых вероятностных выборок
занижает долю людей с высоким доходом,
ведущих активный образ жизни. Происходит это в
силу того, что таких людей гораздо сложней
застать в каком-либо определенном месте
(например, дома).
— Проблема респондентов, отказывающихся
отвечать на вопросы анкеты (доля «отказников» в
Москве, для разных опросов, колеблется от 50%
до 80%)

66. Зависимость ошибки выборки от степени различий между единицами генеральной совокупности

Чем больше различия (или гетерогенности) внутри
генеральной совокупности, тем больше величина
возможной ошибки выборки
Например, если нам нужно узнать, какое количество
пива потребляется, то мы обнаружим, что внутри
нашей генеральной совокупности нормы
потребления у различных людей существенно
различаются (гетерогенная генеральная
совокупность).
В другом случае мы будем изучать потребление
хлеба и установим, что у разных людей оно
различается гораздо менее существенно (гомогенная
генеральная совокупность).

67. Важно понимать!

Помимо четкого планирования репрезентативности
выборки, нельзя распространять полученные результаты
за ее границы. Так, результаты исследования мнения
массового потребителя города Москвы о товарах
определенной фирмы нельзя распространять на всю Россию.
Можно быть поставленным в тупик разными результатами
обследования степени лояльности потенциальных
покупателей к определенной марке пылесоса (в одном
исследовании была названа цифра 10%, в другом случае —
25%).
Дело в том, что в первом случае цифра была получена от
общего числа опрошенных, а во втором случае — только от
числа тех покупателей, которые твердо решили приобрести
пылесос.

68. Из этого следует:

Для вдумчивого маркетолога очень
важными являются те пояснения,
которые сопровождают полученные
данные (как минимум, формулировки
вопросов и описание выборки)

69. Итак:

Объем выборки не влияет на репрезентативность
результатов (влияет метод ее формирования)
Чем больше величина выборки, тем меньше ее
возможная ошибка
Чем больше различий (гетерогенность) внутри
генеральной совокупности, тем больше величина
возможной ошибки выборки
Решение об объеме выборки является
компромиссом между точностью результатов
исследования и возможностями его практической
реализации.

Генеральная
совокупность
[1] (в
англ. — population)
— совокупность всех объектов (единиц),
относительно которых учёный намерен
делать выводы при изучении конкретной
проблемы.

Генеральная
совокупность состоит из всех объектов,
которые подлежат изучению. Состав
генеральной совокупности зависит от
целей исследования. Иногда генеральная
совокупность — это все население
определённого региона (например, когда
изучается отношение потенциальных
избирателей к кандидату), чаще всего
задаётся несколько критериев, определяющих
объект исследования. Например, мужчины
30-50 лет, использующие бритву определённой
марки не реже раза в неделю, и имеющие
доход не ниже $100 на одного члена семьи.

Выборка или выборочная
совокупность
 —
множество случаев (испытуемых, объектов,
событий, образцов), с помощью определённой
процедуры выбранных из генеральной
совокупности для участия в исследовании.

Характеристики
выборки:

                  Качественная
характеристика выборки – кого именно
мы выбираем и какие способы построения
выборки мы для этого используем.

                  Количественная
характеристика выборки – сколько
случаев выбираем, другими словами объём
выборки.

Необходимость
выборки

                  Объект
исследования очень обширный. Например,
потребители продукции глобальной
компании – огромное количество
территориально разбросанных рынков.

                  Существует
необходимость в сборе первичной
информации.

Объём
выборки

Объём
выборки
 —
число случаев, включённых в выборочную
совокупность. Из статистических
соображений рекомендуется, чтобы число
случаев составляло не менее 30 – 35.

17. Основные способы формирования выборки

Формирование
выборки

прежде всего основывается на знании
контура выборки, под которым понимается
список всех единиц совокупности, из
которого выбираются единицы выборки.
Например, если в качестве совокупности
рассматривать все автосервисные
мастерские города Москвы, то надо иметь
список таких мастерских, рассматриваемый
как контур, в пределах которого формируется
выборка.

Контур
выборки неизбежно содержит ошибку,
называемую ошибкой контура выборки и
характеризующую степень отклонения от
истинных размеров совокупности. Очевидно,
что не существует полно официального
списка всех автосервисных мастерских
г. Москвы. Исследователь должен
информировать заказчика работы о
размерах ошибки контура выборки.

При
формировании выборки используются
вероятностные (случайные) и невероятностные
(неслучайные) методы.

Если
все единицы выборки имеют известный
шанс (вероятность) быть включенными в
выборку, то выборка называется
вероятностной. Если эта вероятность
неизвестна, то выборка называется
невероятностной. К сожалению, в большинстве
маркетинговых исследований из-за
невозможности точного определения
размера совокупности не представляется
возможным точно рассчитать вероятности.
Поэтому термин «известная вероятность»
скорее основан на использовании
определенных методов формирования
выборки, чем на знании точных размеров
совокупности.

Вероятностные
методы включают в себя:


простой случайный отбор;


систематический отбор;


кластерный отбор;


стратифицированный отбор.

Невероятностные
методы:


отбор на основе принципа удобства;


отбор на основе суждений;


формирование выборки в процессе опроса;


формирование выборки на основе квот.

Смысл
метода отбора на основе принципа удобства
заключается в том, что формирование
выборки осуществляется самым удобным
с позиций исследователя образом, например
с позиций минимальных затрат времени
и усилий, с позиций доступности
респондентов. Выбор места исследования
и состава выборки производится
субъективным образом, например, опрос
покупателей осуществляется в магазине,
ближайшем к месту жительства исследователя.
Очевидно, что многие представители
совокупности не принимают участия в
опросе.

Формирование
выборки на основе суждения основано на
использовании мнения квалифицированных
специалистов, экспертов относительно
состава выборки. На основе такого подхода
часто формируется состав фокус-группы.

Формирование
выборки в процессе опроса основано на
расширении числа опрашиваемых исходя
из предложений респондентов, которые
уже приняли участие в обследовании.
Первоначально исследователь формирует
выборку намного меньшую, чем требуется
для исследования, затем она по мере
проведения расширяется.

Формирование
выборки на основе квот (квотный отбор)
предполагает предварительное, исходя
из целей исследования, определение
численности групп респондентов,
отвечающих определенным требованиям
(признакам). Например, в целях исследования
было принято решение, что в универмаге
должно быть опрошено пятьдесят мужчин
и пятьдесят женщин. Интервьюер проводит
опрос, пока не выберет установленную
квоту.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Контур — выборка

Cтраница 1

Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что не существует полного официального списка всех автосервисных мастерских города Москвы, включая полулегальный и нелегальный бизнес в данной области. Исследователь должен информировать заказчика работы о размерах ошибки контура выборки.
 [1]

Ниже приводятся четыре генеральные совокупности и контуры выборки для них.
 [2]

Формирование выборки прежде всего основывается на знании контура выборки, под которым понимается список всех единиц совокупности, из которого выбираются единицы выборки. Например, если в качестве совокупности рассматривать все автосервисные мастерские города Москвы, то надо иметь список таких мастерских, рассматриваемый как контур, в пределах которого формируется выборка.
 [3]

На данном этапе также необходимо оценить ошибку контура выборки. Определить, насколько список людей ( юридических лиц), включенных в контур выборки, отличается от совокупности в целом.
 [4]

Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что не существует полного официального списка всех автосервисных мастерских города Москвы, включая полулегальный и нелегальный бизнес в данной области. Исследователь должен информировать заказчика работы о размерах ошибки контура выборки.
 [5]

Можете ли вы определить для каждой генеральной совокупности, является ли ошибка контура выборки допустимой или недопустимой.
 [6]

Устанавливается, откуда может быть получен перечень единиц совокупности. Это нужно для установления контура выборки. Здесь используются соответствующие справочники и материалы различных консультационных организаций.
 [7]

На втором этапе устанавливается, откуда может быть получен перечень единиц совокупности. Это нужно для установления контура выборки. Здесь используются соответствующие справочники, данные переписи населения и местных органов власти, материалы различных консультационных организаций.
 [8]

На данном этапе также необходимо оценить ошибку контура выборки. Определить, насколько список людей ( юридических лиц), включенных в контур выборки, отличается от совокупности в целом.
 [9]

Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что не существует полного официального списка всех автосервисных мастерских города Москвы, включая полулегальный и нелегальный бизнес в данной области. Исследователь должен информировать заказчика работы о размерах ошибки контура выборки.
 [10]

Страницы:  

   1

© 2008-2019 PR-агентство «Красное Слово».

Сетевое издание PR-агентство «КРАСНОЕ СЛОВО» / PR-agency «KRASNOE SLOVO» зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) 07 декабря 2018 г. Свидетельство о регистрации СМИ Эл № ФС77-74461.

Учредитель: Горжанкин В.В. Главный редактор: Горжанкин В.В. Адрес электронной почты редакции: info@pr-agentstvo.com Телефон редакции: +7 (916) 360 12 12.

Политика персональных данных. Любое использование материалов допускается только при соблюдении правил перепечатки. Мнения и взгляды авторов не всегда совпадают с точкой зрения редакции. Отдельные публикации могут содержать информацию, не предназначенную для пользователей до 18 лет.

1. Методология маркетинговых исследований

Тема Процедура выборки

2. Вопросы лекции

Основные понятия, используемые при проведении
выборочных исследований. Генеральная совокупность.
Выборка. Контур выборки. Единица и объем выборки.
Ошибка выборки.
Проблемы формирования выборки
Репрезентативность выборки.
Типы выборок. Виды вероятностной выборки. Виды
невероятностной выборки.
Комбинация типов выборки при проведении
исследования. Многоступенчатая выборка.
Этапы разработки выборочного плана. Подходы к
определению объема выборки. Ошибка выборки.

3. Почему появляются выборки?

Для маркетинговых целей
в целях экономии времени
и средств весьма типично
подвергать исследованию
лишь небольшую часть
той группы людей или
предприятий
(генеральной
совокупности), которая
представляет интерес для
исследователей.
Она обычно составляет
несколько сотен, иногда
тысячу объектов.

4. Суть выборочного метода

Суть выборочного метода заключается в том, что
по определенным правилам из общей
численности генеральной совокупности
отбирается ограниченное число единиц, которое
призвано в качестве своеобразной модели
воспроизводить структуру всей генеральной
совокупности
Генеральная совокупность — та часть объекта
исследования, которая локализована по времени
и территориально, и на нее распространяются
все выводы исследования

5. Примеры генеральных совокупностей:

Все жители Нижнего Новгорода (1267760 человек
по данным 2015 года)
Юридические лица России (2,2 млн. на начало
2008 года)
Розничные торговые точки, осуществляющие
продажу продуктов питания (20 тысяч на начало
2008 года) и т.д.

6. Выборка. Контур выборки

Ограниченное число единиц, выбранное из
генеральной совокупности (равно как и процедура по
их определению) именуется выборкой.
Контур выборки – это наличие полного списка всех
элементов генеральной совокупности.
Контур выборки неизбежно содержит ошибку,
называемую ошибкой контура выборки и
характеризующую степень отклонения от истинных
размеров совокупности.
Пример: Очевидно, что не существует полного официального списка всех
автосервисных мастерских города Москвы, включая полулегальный и
нелегальный бизнес в данной области. Исследователь должен
информировать заказчика работы о размерах ошибки контура выборки.

7.

8. Итак, основные понятия:

Генеральная совокупность – вся группа, про
которую необходимо собрать информацию;
Выборка – часть совокупности, базовый уровень
исследования;
Ошибка выборки – разница между полученными
данными и фактическими по совокупности;
Контур выборки – все единицы совокупности, из
которых будет формироваться выборка;
Ошибка контура выборки – степень отклонения
контура выборки от генеральной совокупности;
Единица выборки – объект исследования

9. Три главные проблемы формирования выборки

Прежде всего, исходя из сути рассматриваемой
задачи, необходимо определить, кто является
единицей выборки.
Очень важным является также определение
контура выборки.
В целях выполнения правила репрезентативности
проводимого исследования необходимо обратить
внимание на метод, с помощью которого
выбираются единицы выборки
И наконец, необходимо решить вопрос об объеме
выборки, который определяет число изучаемых
единиц выборки.

10. Репрезентативность выборки

Цель отбора объектов в состав выборки всегда
состоит в получении такой совокупности, которая
по своим качествам репрезентирует ту, которую мы
намереваемся изучить
Под репрезентативностью в маркетинговых
исследованиях понимают такие свойства выборки,
которые позволяют ей выступать на момент опроса
моделью, представителем генеральной
совокупности.
Важно понимать, что репрезентативность выборки и
ошибка выборки – разные явления. Репрезентативность,
в отличие от ошибки никак не зависит от размера
выборки

11. Репрезентативность выборки

Одна и та же выборка может быть репрезентативной
и нерепрезентативной для разных генеральных
совокупностей
Пример:
— Выборка, целиком состоящая из москвичей,
владеющих автомобилем, не репрезентирует все
население Москвы.
— Выборка из российских предприятий численностью
до 100 человек не репрезентирует все предприятия
России.
— Выборка из москвичей, совершающих покупки на
рынке, не репрезентирует покупательское поведение
всех москвичей.

12. Репрезентативность выборки

В то же время, указанные выборки (при
соблюдении прочих условий) могут отлично
репрезентировать москвичей-автовладельцев,
небольшие и средние российские
предприятия и покупателей, совершающих
покупки на рынках соответственно.
Как бы мы не увеличивали количество
опрошенных москвичей-автовладельцев, мы
не сможем репрезентировать этой выборкой
всех москвичей.

13. Группы выборочных методов (типы выборки)

Вероятностная выборка (случайная) –
это такая выборка, для которой каждый
элемент генеральной совокупности имеет
определенную, заранее заданную
вероятность быть отобранным.
Это позволяет исследователю рассчитать,
насколько правильно выборка отражает
популяцию, из которой она спроектирована
(рассчитать ошибку выборки).

14. Неслучайная (невероятностная) выборка Еще одно название -детерминированная

Неслучайная (невероятностная)
выборка – это такой способ отбора
единиц, при котором мы не можем заранее
рассчитать вероятность каждого элемента
попасть в состав выборочной
совокупности.
Данный тип выборки не дает возможности
рассчитать, насколько правильна
(репрезентативна) выборка
Иногда по условиям исследования
оказывается единственно возможным
провести неслучайную выборку.

15.

16. Метод простого случайного отбора

Метод простого случайного отбора
предполагает, что вероятность быть избранным в
выборку известна и является одинаковой для всех
единиц совокупности. Для этого используется:
— Лотерейный метод (жребия)
— Таблицы случайных чисел
Главное условие осуществления вероятностной
выборки – наличие полного списка (контура) всех
элементов генеральной совокупности.
Использование простого случайного отбора
гарантирует, что каждая единица совокупности
известна и имеет равные шансы быть включенной
в выборку.

17. Лотерейный метод (жребия)

При использовании лотерейного метода
(или метода жребия) жетоны с номерами
всех элементов помещают в урну,
тщательно перемешивают и извлекают
последовательно n жетонов, где n – число
элементов выборочной совокупности.
Элементы генеральной совокупности,
имеющие номера оказавшиеся на
извлеченных жетонах, будут составлять
выборочную совокупность.

18. Фрагмент таблицы случайных цифр

37
52
35
15
04
80
44
83
21
28
31
42
46
72
13
20
07
99
95
64
13
06
27
29
10
16
69
93
39
08
09
38
00
84
65
56
09
29
67
19

19. Комментарий к использованию таблицы случайных цифр

Если мы имеем, скажем, популяцию (то есть генеральную
совокупность) из 1507 элементов и хотим спроектировать выборку
численностью 150 элементов, мы можем выбирать любые два
смежных столбца в таблице случайных чисел: цифры, стоящие в
двух смежных ячейках будут образовывать четырехзначное число.
Каждый раз, когда будет появляться число от 0001 до 1507, мы
будем считать, что оно обозначает номер отбираемого элемента.
Когда число появляется более чем один раз, этот номер
игнорируется после первого раза.
Если мы начнем с первых четырех столбцов в таблице, спускаясь
по столбцам, то в выборку будут включены элементы под номерами
0799, 1016, 0084, 480, 1306, 929, 1320 и 938.
Поскольку мы не стремимся умышленно отыскать определенное
число, мы можем начать с любого места таблицы и использовать
любую систему для движения по таблице.
С тем же успехом случайные числа могут генерироваться
специальной программой компьютера.

20. Метод систематической (или механической) выборки

На практике чаще всего
используют метод
систематической (или
механической) выборки,
когда из
пронумерованного списка
через равные интервалы k
отбирается заданное число
респондентов. При этом
шаг выборки k (интервал
скачка) рассчитывается по
простой формуле:
N
k
n
где N – численность
генеральной совокупности
n – численность
выборочной совокупности.

21. Пример систематической (или механической) выборки

Предположим, что нам нужно спроектировать выборку
численностью 100 из списка 5000 студентов какого-то вуза.
Если мы намерены использовать систематическую выборку, то
должны вначале рассчитать интервал выборки делением числа
элементов в списке на размер выборки.
В данном случае, разделив общую численность студентов 5000 на
требуемый размер выборки 100 единиц, мы получим интервал
(шаг) выборки 50.
Далее будем систематически двигаться по списку и отбирать
каждого пятидесятого студента (отобрав таким образом 100 имен).
Определение того места в списке, с которого мы начнем,
проводится случайным образом, по таблице случайных чисел
(это называется случайный старт).
Таким образом, если случайно выбрана точка старта под номером
31, то в выборку будут включены студенты, стоящие под номерами
31, 81, 131, 181 и т.д.

22. Метод кластерного отбора. (гнездовая или серийная выборка)

Метод кластерного отбора основан на
делении совокупности на подгруппы, каждая
из которых представляет совокупность в
целом.
Здесь отбираются не объекты исследования
(например, люди), а группы. Группы отбираются
случайным образом, а внутри них проводится
сплошной опрос. Например, в ВУЗе с большим
количеством студенческих групп отбор можно
проводить путем случайного отбора этих групп и
дальнейшего сплошного опроса в этих группах

23. Пример кластерного отбора

Предположим, что исследуется мнение населения
какого-то региона относительно марки какого-то товара.
Регион разбивается на четко определяемые части
(кластеры), например области.
Исследователь может считать, что выделенные кластеры
являются идентичными и мнение населения этих
областей характерно для региона в целом.
Далее одна из областей (один кластер) выбирается
случайным образом, определяется совокупность для
этой области, в ней проводится соответствующее
исследование, а выводы обобщаются на совокупность
всего региона

24. Причины появления стратифицированного отбора (типической или районированной выборки)

В основе всех вероятностных методов лежит
предположение, что любая совокупность характеризуется
симметричным распределением ее ключевых
характеристик. Другими словами, каждая выборка
достаточно полно характеризует всю совокупность,
различные крайности в выборке уравновешивают друг
друга.
Но такая ситуация на практике встречается крайне редко.
Скажем, исследуется рыночный потенциал определенного
региона для какого-то товара. Население больших, средних
и малых городов, сельской местности данного региона
отличается по уровню образования, дохода, образу жизни
и т.п. В таком случае необходим стратифицированный
отбор

25. Понятие стратифицированной выборки

При наличии в составе генеральной
совокупности различных типов явлений с
разными уровнями изучаемых признаков
организуют стратифицированную выборку,
чтобы обеспечить более равномерное
представительство в выборочной совокупности
различных частей (типов) явления.
Генеральная совокупность разделяется на различные
подгруппы (страты), например по уровню доходов, и
выборки формируются из этих подгрупп, по сути
дела являющихся сегментами рынка.

26. Условия осуществления стратифицированной выборки

При использовании данного метода прежде всего
следует выбрать некоторую наблюдаемую
характеристику (признак), характеризующую каждую
единицу совокупности, например уровень дохода.
Далее для каждой страты с помощью случайного
отбора формируется выборка.
Стратифицированная выборка может быть применена
лишь при наличии дополнительной информации о
генеральной совокупности (например, нам необходимо
процентное соотношение мужчин и женщин, в случае,
если мы хотим стратифицировать выборку по полу).
Отсутствие такой информации делает применение
стратифицированной выборки невозможным

27. Методы (типы) невероятностной выборки

Отбор в такой выборке осуществляется не по
принципам случайности, а по субъективным
критериям – доступности, типичности,
равного представительства и т.д.
При применении невероятностных методов
отбора формирование выборки
осуществляется без использования понятий
теории вероятностей, вследствие чего
невозможно рассчитать вероятность
включения в выборку единицы
совокупности.

28. Нерепрезентативный отбор. Метод стихийной выборки: отбор на основе удобства и доступности

Смысл метода заключается в том, что
формирование выборки осуществляется
самым удобным с позиций исследователя
образом, например, с позиций минимальных
затрат времени и усилий, с позиции
доступности респондентов.
Выбор места исследования и состава выборки
производится субъективным образом, например,
опрос покупателей осуществляется в магазине,
ближайшем к месту жительства исследователя.
Очевидно, что многие представители
совокупности не принимают участия в опросе.

29. Метод экспертного отбора (на основе суждения)

Метод основан на использовании мнения
квалифицированных специалистов, экспертов
относительно состава выборки. На основе такого
подхода часто формируется состав фокус-группы.
Например, изучается потребность в издании
кулинарной книги для приготовления в
микроволновой печи низкокалорийной пищи. На
основе мнения исследователей в состав фокусгруппы было включено 12 домохозяек; шестеро из
них владело микроволновыми печами более трех
лет, трое — менее трех лет и трое только
собирались их купить.

30. Метод квотной выборки

Формирование выборки на основе квот
(квотный отбор) предполагает
предварительное, исходя из целей
исследования, определение состава и
численности групп респондентов, отвечающих
определенным требованиям (признакам).
Например, мужчины в возрасте 20-30 лет, 31-45
лет и 46-60 лет; лица с доходом до 30 тысяч
рублей, с доходом от 30 до 60 тысяч рублей и с
доходом свыше 60 тысяч рублей)

31. Метод квотной выборки

Для каждой группы задается количество объектов,
которые должны попасть выборку и быть обследованы.
Количество объектов, которые должны попасть в
каждую из групп, задается, чаще всего, либо
пропорционально заранее известной доле группы в
генеральной совокупности, либо одинаковым для
каждой группы.
Внутри групп объекты отбираются произвольно.
Квотные выборки используются в маркетинговых
исследованиях достаточно часто

32. Пример квотной выборки

Приведем пример расчета выборки по
таким параметрам квоты как пол и возраст.
В одном из маркетинговых исследований
при опросе населения, исследователи
опирались на данные Областного комитета
по статистике о половозрастной структуре
населения районов города.
Так, половозрастная структура населения
Советского района Нижнего Новгорода
выглядела следующим образом:

33.

Генеральная совокупность
численность
Выборочная
совокупность
Доля, %
число
Всего
муж.
жен.
муж.
жен.
всего
муж.
жен.
всего
128546
55757
72789
43,4
56,6
100,00
521
679
1200
20 — 24
11958
6009
5949
50,3
49,7
9,30
56
56
112
25 — 29
11858
6520
5338
55,0
45,0
9,22
61
50
111
30 — 34
12093
5861
6232
48,5
51,5
9,41
55
58
113
35 — 39
14360
6795
7565
47,3
52,7
11,17
63
71
134
40 — 44
14112
6598
7514
46,8
53,2
10,98
62
70
132
45— 49
12779
5840
6939
45,7
54,3
9,94
55
65
119
50 — 54
7274
3222
4052
44,3
55,7
5,66
30
38
68
55 — 59
11981
5035
6946
42,0
58,0
9,32
47
65
112
60 — 69
17503
6828
10675
39,0
61,0
13,62
64
100
163
70 и старше
14628
3049
11579
20,8
79,2
11,38
28
108
137
Основа выборки
Возраст (лет)

34. Пример квотной выборки

Изучая данные таблицы, нетрудно убедиться, что
численность каждой из половозрастных групп в
трех последних столбцах таблицы (объеме
выборки) пропорциональна численности каждой из
соответствующих групп в генеральной
совокупности. Такая выборка называется
пропорциональной.
Иногда используются и непропорциональные
выборки, если это необходимо исходя из целей
исследования
Таким образом на основе определенных заданных
параметров создается микромодель
генеральной совокупности

35. Метод снежного кома

Формирование выборки в процессе опроса основано на
расширении числа опрашиваемых на основе предложений
респондентов, которые уже приняли участие в
обследовании.
У каждого респондента, начиная с первого, просят
контакты его друзей, коллег, знакомых, которые подходили
бы под условия отбора и могли бы принять участие в
исследовании.
Таким образом, за исключением первого шага, выборка
формируется с участием самих объектов исследования.
Метод часто применяется, когда необходимо найти и
опросить труднодоступные группы респондентов
(например, респондентов, имеющих высокий доход,
респондентов, принадлежащих к одной профессиональной
группе, респондентов, имеющих какие-либо схожие
хобби/увлечения и т.д.)

36. Комбинация типов выборки при проведении исследования: многоступенчатая выборка

Многоступенчатая выборка –строится с
применением процедуры поэтапного отбора
объектов опроса.
При этом совокупность объектов, отобранных
на предыдущем этапе (ступени), становится
исходной для отбора на следующем.
Промежуточные объекты, составляющие
выборочную совокупность на высших
ступенях, называют единицами отбора.
Объекты самой нижней ступени, с которых
ведется непосредственный сбор информации,
называются единицами наблюдения.

37. Пример многоступенчатой выборки

Так, формирование выборки для оценки мнения населения России
относительно различных марок какого-либо товара, например
холодильника, может осуществляться по следующей схеме:
1. Россия, согласно ее административно — территориальному
делению, делится на 89 субъектов Федерации.
2. Осуществляется случайным образом выбор девяти субъектов
(исключая Москву и С.-Петербург).
3. Все населенные пункты (исключая Москву и С.-Петербург) в
зависимости от численности населения делятся на шесть групп:
до 1000 жителей, от 1000 до 10 000 (поселки), от 10 000 до 100
000, от 100 000 до 500 000, свыше 500 000 (города). Москва и С.Петербург исследуются отдельно.
4. На основе квотного метода устанавливается, что для каждого из
девяти выбранных субъектов Федерации исследуются три города
и два поселка

38. Пример многоступенчатой выборки

Для этого берется каждый пятый населенный пункт из справочника
Госкомстата «Численность населения Российской Федерации по
городам, рабочим поселкам и районам и определяется, в какую из
категорий он попадет (систематический отбор). Так поступают
до тех пор, пока не наберется нужное количество населенных
пунктов. Если, дойдя до конца списка, не будет найдено квотное
число населенных пунктов, процесс выбора населенных пунктов
начинается сначала, но берется каждый четвертый населенный
пункт, и т.д.
5. Выбирается случайным образом в каждом выбранном городе и
поселке по меньшей мере 20 респондентов.
Таким образом, кроме Москвы и С.-Петербурга должно быть
проинтервьюировано 900 респондентов. В Москве и С.Петербурге опрашивается по 50 респондентов. В итоге должно
быть проинтервьюировано 1000 респондентов.

39. Этапы разработки выборочного плана

1. Определение соответствующей совокупности
согласно поставленным целям исследования.
2. Получение «списка» совокупности для
установления контура выборки.
3. Проектирование выборочного плана –
определение состава и объема выборки.
4. Определение методов доступа к совокупности.
5. Достижение нужной численности выборки.
6. Проверка выборки на соответствие требованиям.
7. В случае необходимости формирование новой
выборки.

40. Определение объема выборки

Исходным пунктом расчета объема выборки
становится вопрос об определении размеров
выборочной совокупности.
Численность выборочной совокупности зависит от
двух факторов:
(1) стоимости сбора информации
(2) стремления к определенной степени
статистической достоверности результатов,
которую надеется получить исследователь.
Чем больше размеры выборки, то есть чем ближе
они к размерам генеральной совокупности в
целом, тем более надежны и достоверны
полученные данные.

41. Определение объема выборки

Самый спорный вопрос по выборочному
плану.
На практике, решение о объеме выборки
всегда есть компромисс между точностью
результатов исследования и затратами на
проведение исследования.
Способ определения объема выборки
зависит от того, имеется ли у
исследователя информация о составе
генеральной совокупности

42. Связь между объемом выборки и репрезентативностью

Следует отметить, что объем выборки никак не
влияет на репрезентативность полученных
результатов.
Пример: Предположим, например, что в целях
изучения степени использования в России
персональных компьютеров в научной работе
проводился опрос на основе принципа удобства
на одном из московских перекрестков. И хотя
было опрошено 5000 респондентов, полученные
результаты не являются репрезентативными даже
для Москвы.
Это обусловлено тем, что был использован метод
формирования выборки, который в данном случае
применять было нельзя.

43. Методы определения объема выборки Если исходная информация о генеральной совокупности отсутствует, то используется:

Правило большого пальца –
бездоказательно принимается, что для
получения нужных результатов
выборка должна составлять, например,
5% от генеральной совокупности
Исходя из заранее оговоренных с
заказчиком условий (он рекомендует
цифры выборки)

44. Методы определения объема выборки Если исходная информация о генеральной совокупности отсутствует, то используется:

Многолетний опыт социологов-практиков. Он
свидетельствует о том, что при массовых опросах,
если величина генеральной совокупности
составляет менее 5000, то достаточный объем
выборочной совокупности должен быть не менее
500 человек.
Если величина генеральной совокупности
составляет более 5000, то для получения
статистически значимых результатов нужно
обследовать 10% ее состава, но не более 2000-2500
единиц.

45.

Зависимость объема выборки от ее ошибки
(размер генеральной совокупности составляет 20 тыс.
единиц)
Ошибка
выборки,
%
2
3
4
5
6
7
8
9
10
Объем
выборки,
ед.
2500
1100
620
400
280
200
160
110
100
12
67
14
50
17
30
20
25

46. Зависимость объема выборки от ее ошибки

В.И. Паниотто приводит следующие расчеты
репрезентативной выборки с допущением 5процентной ошибки:
Объем
генеральной
совокупности
500 1000 2000 3000
4000
5000
10000
100000
Объем
выборки
222 286
360
370
385
358
333
350

47. Комментарии к таблице

Суть данных, приведенных в этой таблице, состоит в
следующем. Если вы, опросив, предположим, 400
человек в районном городе, где численность взрослого
платежеспособного населения составляет 100 тысяч
человек, выявили, что 33 процента опрошенных
покупателей предпочитают продукцию местного
мясокомбината, то с 95-процентной степенью
вероятности можете утверждать, что постоянными
покупателями этой продукции являются 33 5% (то
есть от 28 до 38 процентов) жителей этого города.
Уровень уверенности в 95% – это условие, оно
показывает 95% уверенности в том, что параметр
популяции попадает в пределы допуска ошибки
выборочной статистики.

48. Методы определения объема выборки Если исходная информация о генеральной совокупности имеется, то:

Наиболее теоретически обоснованный и
корректный подход к определению
объемов выборки основан на расчете
доверительных интервалов.
Метод требует понимания некоторых
базовых понятий математической
статистики (закона нормального
распределения, меры вариации, среднего
квадратического отклонения,
доверительного интервала и т. д.)

49. Понятие вариации

Понятие вариации характеризует величину
несхожести (схожести) ответов респондентов на
определенный вопрос.
В более строгом плане вариацией значений какоголибо признака в совокупности называется различие
его значений у разных единиц данной совокупности
в один и тот же период или момент времени.
Результаты ответов на вопросы опроса обычно
представляются в форме кривой распределения.
При высокой схожести ответов говорят о малой
вариации (узкая кривая распределения) и при
низкой схожести ответов — о высокой вариации
(широкая кривая распределения).

50. Кривые распределения результатов ответа на вопрос: «Сколько миль за год проходит ваш автомобиль?»

51. Среднее квадратическое отклонение

В качестве меры вариации обычно принимается
среднее квадратическое отклонение, которое
характеризует среднее расстояние от средней
оценки ответов каждого респондента на
определенный вопрос.
Можно сравнить среднее квадратическое
отклонения для двух выборок и определить, для
какой из них вариация является меньшей.
Поскольку все маркетинговые решения
принимаются в условиях неопределенности, то
это обстоятельство целесообразно учесть при
определении объема выборки.

52. «Доверительный интервал»

Так как определение исследуемых величин для
совокупности в целом осуществляется на основе
выборочной статистики, то следует установить
диапазон (доверительный интервал), в который, как
ожидается, попадут оценки для совокупности в целом,
и ошибку их определения.
Понятие «доверительный интервал» — это диапазон,
крайним точкам которого соответствует определенный
процент определенных ответов на какой-то вопрос.
Данное понятие тесно связано с понятием «среднее
квадратическое отклонение изучаемого признака в
генеральной совокупности»: чем оно больше, тем шире
должен быть доверительный интервал, чтобы
включить в свой состав, например, 95% ответов.

53. Пример

Проведено исследование числа визитов
автовладельцев в сервисные мастерские за год.
Доверительный интервал для среднего числа
визитов был рассчитан равным 5—7 визитам при
99%-ном уровне доверительности (надежности
выборки).
Это означает, что если появится возможность
провести независимо 100 раз выборочные
исследования, то для 99 средних значений числа
визитов попадут в диапазон от 5 до 7 визитов —
другими словами, 99% автовладельцев попадут в
доверительный интервал. (в 99 случаях результат
будет находиться в указанных границах)

54. Важно понимать!

Выборка всегда дает более относительный
результат по сравнению с генеральной
совокупностью.
Всегда есть вероятность отклонения, которая
считается ошибкой выборки (измеряется в
процентах)

55. Средняя квадратическая ошибка выборки

Индикатором степени отличия оценки, истинной
для совокупности в целом, от оценки, которая
ожидается для типичной выборки, является
средняя квадратическая ошибка выборки.
Например, исследуется мнение потребителей о новом
продукте и заказчик данного исследования указал, что
его устроит точность полученных результатов,
равная ±5% (ошибка выборки)
Предположим, что 30% членов выборки высказалось за
новый продукт. Это означает, что диапазон возможных
оценок для всей совокупности составляет 25—35%.

56. Определение объема выборки на основе расчета доверительного интервала

Исходной информацией, необходимой для
реализации данного подхода, является:
Величина вариации, которой, как
считается, обладает совокупность.
Желаемая точность.
Уровень доверительности, которому
должны удовлетворять результаты
проводимого обследования.

57. Когда на заданный в анкете вопрос существует только два варианта ответа, выраженные в процентах (используется процентная мера), объем выбо

Когда на заданный в анкете вопрос существует только два
варианта ответа, выраженные в процентах (используется
процентная мера), объем выборки определяется по следующей
формуле:

58.

59. Пример расчета объема выборки

Фирмой, выпускающей покрышки, проводится опрос
автолюбителей. Целью обследования является
определение процента автолюбителей, использующих
радиальные покрышки, поэтому на вопрос:
«Используете ли вы радиальные покрышки?»
возможно только два ответа: «Да» или «Нет» (шкала
наименований).
Если предположить, что совокупность автолюбителей
обладает низким показателем вариации, то это
означает, что почти каждый опрошенный использует
радиальные покрышки. В этом случае может быть
сформирована выборка достаточно малых размеров. В
формуле (4.1) произведение pq выражает вариацию,
свойственную совокупности.

60. Пример расчета объема выборки

Предположим, что 90% единиц
совокупности используют радиальные
покрышки. Это означает, что рq = 900. Если
принять, что показатель вариации выше (р
= 70%), то рq = 2100.
Наибольшая вариация достигается в
случае, когда половина совокупности
(50%) используют радиальные покрышки, а
другая (50%) — не использует. В этом
случае произведение рq достигает
наибольшего значения, равного 2500

61. Пример расчета объема выборки

При проведении исследования следует
указать точность полученных оценок
(точность выборки).
Скажем, в результате исследования было
установлено, что 44% респондентов
используют радиальные покрышки.
В этом случае результаты измерения
желательно представить в виде: «Процент
автолюбителей, использующих
радиальные покрышки, составляет 44%
плюс-минус …%».

62. Пример расчета объема выборки

Что касается уровня доверительности, то при
проведении маркетинговых исследований, обычно
рассматриваются только два его значения: 95%
или 99%.
Первому значению соответствует значение z =
1,96, второму — z = 2,58.
Если выбирается уровень доверительности,
равный 99%, то это говорит о том, что мы
уверены на 99% (другими словами, доверительная
вероятность равна 0,99) в том, что процент
членов совокупности, попавших в диапазон ± е%,
равен проценту членов выборки, попавших в тот
же диапазон ошибки.

63. Пример расчета объема выборки

Принимая вариацию,
равную 50%,
точность, равную ± 10%,
при 95%-ном уровне
доверительности,
рассчитаем размер
выборки:
При уровне
доверительности,
равном 99%, и е =
±3% n = 1067.

64. Важно понимать!

Приведенные формулы расчета объема выборки
основаны на предположении, что все правила
формирования выборки были соблюдены и
единственной ошибкой выборки является ошибка,
обусловленная ее объемом.
Однако следует помнить, что объем выборки
определяет точность полученных результатов, но
не их представительность, которая определяется
методом формирования выборки.
Все формулы для расчета объема выборки
предполагают, что репрезентативность
гарантируется использованием корректных
процедур формирования выборки.

65. Систематическая ошибка выборки

Систематическая ошибка зависит от различных
факторов, оказывающих постоянное воздействие
на исследование и смещающих результаты
исследования в определенную сторону.
Пример:
— Использование любых вероятностных выборок
занижает долю людей с высоким доходом,
ведущих активный образ жизни. Происходит это в
силу того, что таких людей гораздо сложней
застать в каком-либо определенном месте
(например, дома).
— Проблема респондентов, отказывающихся
отвечать на вопросы анкеты (доля «отказников» в
Москве, для разных опросов, колеблется от 50%
до 80%)

66. Зависимость ошибки выборки от степени различий между единицами генеральной совокупности

Чем больше различия (или гетерогенности) внутри
генеральной совокупности, тем больше величина
возможной ошибки выборки
Например, если нам нужно узнать, какое количество
пива потребляется, то мы обнаружим, что внутри
нашей генеральной совокупности нормы
потребления у различных людей существенно
различаются (гетерогенная генеральная
совокупность).
В другом случае мы будем изучать потребление
хлеба и установим, что у разных людей оно
различается гораздо менее существенно (гомогенная
генеральная совокупность).

67. Важно понимать!

Помимо четкого планирования репрезентативности
выборки, нельзя распространять полученные результаты
за ее границы. Так, результаты исследования мнения
массового потребителя города Москвы о товарах
определенной фирмы нельзя распространять на всю Россию.
Можно быть поставленным в тупик разными результатами
обследования степени лояльности потенциальных
покупателей к определенной марке пылесоса (в одном
исследовании была названа цифра 10%, в другом случае —
25%).
Дело в том, что в первом случае цифра была получена от
общего числа опрошенных, а во втором случае — только от
числа тех покупателей, которые твердо решили приобрести
пылесос.

68. Из этого следует:

Для вдумчивого маркетолога очень
важными являются те пояснения,
которые сопровождают полученные
данные (как минимум, формулировки
вопросов и описание выборки)

69. Итак:

Объем выборки не влияет на репрезентативность
результатов (влияет метод ее формирования)
Чем больше величина выборки, тем меньше ее
возможная ошибка
Чем больше различий (гетерогенность) внутри
генеральной совокупности, тем больше величина
возможной ошибки выборки
Решение об объеме выборки является
компромиссом между точностью результатов
исследования и возможностями его практической
реализации.

  • Контрольное списывание работа над ошибками 2 класс
  • Контрольное списывание исправь ошибки 3 класс
  • Контрольное списывание анализ ошибок 2 класс
  • Контрольное правило вестгарда указывающее только на случайную ошибку наблюдается если
  • Контрольное правило вестгарда позволяющее выявить случайную ошибку наблюдается когда