Систематическая ошибка регистрации это

Ошибки регистрации

Систематические ошибки

Случайные ошибки– ошибки регистрации, которые могут
быть допущены как опрашиваемыми в их
ответах, так и регистраторами при
заполнении бланков.

Преднамеренные
ошибки
получаются в результате
того, что опрашиваемый, зная действительное
положение дела, сознательно сообщает
неправильные данные.

Непреднамеренные
ошибки
вызываются различными
случайными причинами (небрежность,
невнимание регистратора; неисправность
измерительных приборов).

Рис.
2.1. Виды ошибок регистрации.

Для
выявления и устранения допущенных при
регистрации ошибок может применяться
счетный и логический контроль собранного
материала.

Счетный
контроль

заключается в проверке точности
арифметических расчетов, применявшихся
при составлении отчетности или заполнении
формуляров обследования.

Логический
контроль

заключается в проверке ответов на
вопросы программы наблюдения путем их
логического осмысления или путем
сравнения полученных данных с другими
источниками по этому же вопросу.

Примером
логического сравнения могут служить
листы переписи населения: в переписном
листе двухлетний ребенок имеет высшее
образование, а девятилетний мальчик
женат. Ясно, что полученные ответы на
вопросы не верны и требуют уточнения и
исправления допущенных ошибок.

Так же примером
логического контроля может являться
сопоставление сведений о фонде заработной
платы, содержащихся в отчете по труду
и в отчете по издержкам обращения.

Контрольные вопросы и задания к теме 2:

  1. Что такое
    статистическая информация. Особенности
    ее формирования.

  2. Организация
    государственной и международной
    статистики.

  3. Виды и формы
    статистического наблюдения. Основные
    требования, предъявляемые к его
    организации и проведению.

  4. Сущность и
    содержание программно-методологических
    вопросов статистического наблюдения.

  5. Приведите пример
    объекта и единицы статистического
    наблюдения.

  6. Виды и содержание
    статистических формуляров.

  7. Какими методами
    проверяют достоверность отчетных
    данных.

Тема 3. Сводка и группировка статистических данных.

  1. Понятие о
    статистической сводке.

  2. Статистическая
    группировка как основной метод обобщения
    информации.

  3. Ряды распределения.

  4. Статистические
    таблицы.

  5. Графическое
    изображение статистических показателей.

  1. Понятие о
    статистической сводке.

В результате статистического
наблюдения получают материала, которые
содержат данные о каждой единице
совокупности. Дальнейшая задача
заключается в том, чтобы привести эти
материалы в определенный порядок,
систематизировать их и не этой основе
дать сводную характеристику всей
совокупности фактов при помощи обобщающих
статистических показателей. Этого
достигают при помощи статистической
сводки.

Статистическая
сводка

– это научная обработка первичных
материалов статистического наблюдения
для характеристики совокупности
обобщающими показателями
.
Это вторая стадия статистического
исследования.

Основная
цель и
содержание

статистической сводки состоит в том,
чтобы, обобщив материл, дать полную и
объективную характеристику всей
совокупности фактов, вскрыть закономерности
массовых процессов, которые в нем
содержатся и которые проявляются в
обобщающих показателях.

Статистические
сводки различаются по ряду признаков:
сложности построения, месту проведения
и способу разработки материалов
статистического наблюдения.

По
сложности
построения

сводка может, прежде всего, представлять
общие итоги по изучаемой совокупности
в целом без какой-либо предварительной
систематизации собранного материала.
Она определяет общий размер изучаемого
явления по заданным показателям. Это
так называемая простая сводка. Она может
быть вспомогательной, если содержащаяся
в ней информация используется в дальнейшем
для углубленного изучения статистической
совокупности.

Примером могут выступать результата
переписи населения в декабре 2001 года,
в соответствие с которыми численность
населения в Донецкой области составила
4,8 млн. чел. Данные о численности населения
в Украине могут быть более детально
рассмотрены по различным направлениям:
пол, возраст, семейное положение, место
жительства, образования и т.д.

Статистическая
сводка в широком ее понимании предполагает
систематизацию и группировку цифровых
данных, характеристику образованных
групп системой показателей, подсчет
соответствующих итогов и представление
результатов сводки в виде таблиц,
графиков.

Выделение однородных
в социально-экономическом отношении
групп является основой статистической
сводки исходной информации, непременным
условием ее научной разработки и
практического использования в коммерческой
деятельности.

Последовательность
работ
по
статистической сводке исходной информации
подразделяется на следующие этапы:

  1. формулировка
    задач сводки на основе цели статистического
    исследования;

  2. формирование
    групп и подгрупп, определение
    группировочных признаков, числа групп
    и величины интервала. Решение вопросов,
    связанных с осуществлением группировки,
    включая выделение существенных
    признаков, установление специализированных
    интервалов, построение комбинированных
    группировок;

  3. осуществление
    технической стороны сводки, то есть
    проверка полноты и качества собранного
    материала, подсчет различных итогов и
    исчисление необходимых показателей
    для характеристики всей совокупности
    и ее частей.

Статистическую
сводку производят по определенной
программе, составленной в соответствии
с задачами статистического исследования,
и с учетом принятой формы организации
сводки и техники разработки. Программа
содержит перечень групп, на которые
должна быть расчленена совокупность
по отдельным признакам, а так же перечень
показателей, которые следует подсчитать
для характеристики каждой группы. В ней
так же предусматривают территориальные
границы, в которых надо произвести
разработку материала, степень детализации
материала.

По результатам
переписи в Донецкой области проживает
90% городского населения и 10% сельского;
женщин 54%, а мужчин соответственно –
46%.

Способ
разработки

статистической сводки может быть
централизованным и децентрализованным.
При централизованной
сводке

все данные сосредотачиваются в одном
месте и сводятся по разработанной
методике. При децентрализованной
сводке

обобщение материала осуществляется
снизу вверх по иерархической лестнице
управления, подвергаясь на каждом из
них соответствующей обработке.

Положив начало
научной систематизации и обработке
исходной информации, сводка и группировка
статистических данных служат тем самым
базой для осуществления всестороннего
анализа и прогнозирования коммерческой
деятельности.

П

  1. Статистическая
    группировка как основной метод обобщения
    информации.

ри сводке статистических материалов
не ограничиваются простым подсчетом
общей численности учтенных единиц и
объема зарегистрированных признаков.
Как правило, в процессе сводки
статистические материалы упорядочиваются,
систематизируются, делятся на группы
по существенным признакам. Это достигается
с помощью группировки.

Группировка
– это процесс образования однородных
групп на основе расчленения статистической
совокупности на части или объединение
изучаемых единиц в частные совокупности
по существенным для них признакам
.
Иначе говоря, группировка – выделение
единиц, однородных в заданном смысле.
Группировка всегда отвечает поставленным
задачам,
а именно:

  1. Выделение
    социально-экономических типов явлений.

  2. Изучение структуры
    изучаемого явления.

  3. Выявление
    взаимосвязи между изучаемыми признаками.

Для решения этих
задач соответственно применяют различные
виды группировок:

  1. Типологические
    группировки
    .
    Важнейшим их содержанием является
    выделение из множества признаков,
    характеризующих изучаемые явления,
    основных типов в качественно однородные.
    Особое значение имеет правильный выбор
    группировочного признака. При атрибутивном
    признаке с незначительным разнообразием
    его значений число групп определяется
    свойствами изучаемого явления
    (группировка
    населения по половому признаку
    ).
    Выделение типов на основе количественно
    признака состоит в определении групп
    с учетом значений изучаемых признаков.
    При этом очень важно правильно установить
    интервал группировки, на основе которого
    количественно различаются одни группы
    от других, намечаются границы выделения
    их нового качества.

  2. Структурные
    группировки
    .
    Представляет собой группировку изучаемых
    единиц в пределах одного типа явления
    или однокачественной совокупности.
    Такие группировки имеют задачей либо
    изучение состава (структуры) совокупности
    по какому-либо варьирующему признаку,
    либо изучение в пределах этой совокупности
    взаимосвязей варьирующих признаков
    (состав
    населения по полу, возрасту, образованию
    ).

  3. Аналитические
    группировки
    .
    Дают возможность исследовать взаимосвязь
    между изменяющихся признаков в пределах
    однородной совокупности. Взаимосвязанные
    признаки делятся на факторные, те
    которые оказывают влияние, и результативные,
    те которые изменяются под воздействием
    фактора. Группировка позволяет выявить
    и изучить формы зависимости между
    варьирующими признаками, отражающими
    различные свойства совокупности
    (зависимость
    товарооборота от производительности
    труда
    ).

  4. Комбинированные
    группировки
    .
    Происходит образование групп по двум
    и более признакам, взятым в определенном
    сочетании (зависимость
    товарооборота от производительности
    труда и средней заработной платы
    ).

Признаки
единиц совокупности, положенные в
основание группировки статистического
материала, называются группировочными
признаками
.
Следует различать признаки, имеющие
количественное выражение, которые
называются количественными, и признаки,
не имеющие количественного выражения
– атрибутивные.

Разновидностью
атрибутивные признаков являются признаки
альтернативные, которые может иметь
данная единица совокупности, а может и
не иметь (студент может быть отличником,
а может и не быть).

Важнейшим
вопросом теории группировки является
выбор группировочных признаков. От
правильного выбора группировочного
признака зависят выводы, которые получают
в результате статистической разработки.
Выбор
группировочного признака

необходимо проводить с учетом следующих
основополагающих моментов:

  1. Руководствуясь
    знанием сущности данного явления,
    законов его развития, в основание
    группировки необходимо положить
    наиболее существенные признаки,
    отвечающие задачам исследования.

  2. Следует исходить
    из тех конкретных исторических и
    территориальных условий, в которых
    протекает процесс развития изучаемого
    явления, так как с изменением конкретных
    условий могут меняться и группировочные
    признаки.

  3. При изучении
    явлений, на которые воздействует
    несколько различных закономерностей,
    необходимо в основание группировки
    класть не один, а несколько признаков,
    взятых в комбинации.

Специфический
характер образования групп зависит от
признаков, на которых основывается
группировка, и от задач группировки.
При группировке по количественным
признакам возникает вопрос о количестве
групп и величине интервала. Количество
групп во многом зависит от того, какой
признак служит основанием группировки.
Интервалы групп устанавливаются только
при значительной колеблемости дискретного
признака и тем более при непрерывно
изменяющемся количественном признаке.

Под
величиной
интервала

обычно понимают разность между
максимальными и минимальными значениями
признака в каждой группе. Для определения
величины интервала (i)
при выделении равновеликих групп разница
между максимальным (xmax)
и минимальным значениями (xmin)
изучаемого признака делится на число
выделяемых групп (n):

i
=

Намечаемые
при группировке интервалы бывают
открытые
(у них указана одно граница – верхняя
или нижняя) и закрытые
(имеют и верхнюю и нижнюю границы). При
дальнейшем исследовании изучаемой
совокупности открытые интервалы
закрывают путем определения границ
интервала на основе его величины.

Для определения
нижней границы интервала: из верхней
границы вычитают величину интервала.
Для закрытия верхней границы наоборот:
к нижней границе прибавляют величину
интервала.

Если с помощью
группировки исследуют структуру той
или иной совокупности, то показателями
такой группировки обычно бывают единицы
совокупности – их число и процент к
итогу. Когда группировка преследует
аналитические цели выявления и измерения
зависимостей в каждой группе, то кроме
числа единиц совокупности, обязательно
приводят среднее значение того признака,
изменение которого изучают в зависимости
от изменения группировочного признака.

Р

  1. Ряды распределения.

езультаты сводки и группировки
материалов статистического наблюдения
оформляются в виде статистических рядов
распределения и таблиц.

Статистические
ряды распределения представляют собой
упорядоченное расположение единиц
изучаемой совокупности на группы по
группировочному признаку
.
Они характеризуют состав изучаемого
явления, позволяют судить об однородности
совокупности, границах ее изменения,
закономерностях развития наблюдаемого
объекта.

Распределение
может быть по признакам, не имеющим
количественной меры (атрибутивным),
и по признакам, в которых изменяется их
количественная
мера.

Атрибутивные
ряды

распределения показывают состав
совокупности по тем или иным существенным
признакам. В изменении состава выявляются
важные черты закономерности изучаемого
явления.

Ряды
распределения единиц совокупности по
количественным признакам, называю
вариационными
рядами
.
Вариационные ряды дают возможность
установить характер распределения
единиц совокупности по тому или иному
количественному признаку.

Однодневный
товарооборот продовольственных товаров
по предприятиям розничной торговли
Ворошиловского района составил:

  • до 1000 грн. –10
    магазинов;

  • от 1000 до 2000 грн.
    – 17магазинов;

  • от 2000 до 3000 грн.
    – 6 магазинов;

  • более 3000 грн.- 2
    магазина.

В
вариационном ряду различают два элемента:
варианты и частоты. Вариантами
называются отдельные значения
группировочного признака, которые он
принимает в вариационном ряду. Числа,
которые показывают как часто встречаются
те или иные варианты в ряду распределения,
называют частотами.
Частоты, выраженные в долях единицы или
процентах к итогу, называются частностями.
Сумма частот составляет объем ряда
распределения.

Вариационные
ряды, как и сами вариации, бывают
интервальными и дискретными. Интервальные
вариационные ряды

– это такие ряды, где значения варианты
даны в виде интервалов. Дискретные
вариационные ряды

основаны на прерывной вариации признака,
то есть отдельные варианты имеют
определенные значения.

Примером
дискретного вариационного ряда могут
являться средние цены на продовольственные
товары. Средняя цена на сахар по Донецкой
области составляла:

  • 1995 год – 1,28 грн.;

  • 1998 год – 1,27 грн.;

  • 2001 год – 2,62 грн.

В
дискретных рядах распределение
изображается как ряд перпендикулярных
линий к соответствующим значениям
вариант, при этом высота этих линий
определяется частотой данной варианты.
Если концы этих линий соединить прямыми,
то график будет называться полигоном
распределения
.

Интервальные
ряды распределения изображаются
графически в виде гистограммы. При
ее построении на оси абсцисс откладывают
интервалы ряда, высота которых равна
частотам, отложенным на оси ординат.
Над осью абсцисс строятся прямоугольники,
площадь которых соответствует величинам
произведений интервалов и их частоты.

На
основании ранжированных рядов, то есть
рядов, расположенных в порядке убывания
или возрастания могут строится кумуляты
накопленных частот
.
Накопленные частоты определяются путем
последовательного прибывления к частотам
первой группы этих показателей последующих
групп ряда распределения. Накопленные
частоты наносятся на график в виде
перпендикуляров к оси х,
в точках, отмечающих полусуммы интервалов.
Длина перпендикуляра равна сумме
накопленных частот в данном интервале.
Перпендикуляры затем соединяем прямыми,
в результате чего получаем ломанную
линию, которая начиная от нуля, все время
возрастает до тех пор, пока не достигнет
высоты, равной общей сумме частот.

Р

  1. Статистические
    таблицы.

езультаты сводки и группировки
материалов наблюдения, как правило,
представляются в виде статистических
таблиц. Значение статистических таблиц
состоит в том, что они позволяют охватить
материалы статистической сводки в
целом. Статистическая таблица, по
существу, является системой мыслей об
исследуемом объекте, излагаемых цифрами
на основе определенного порядка в
расположении систематизированной
информации.

Статистические
таблицы

– это форма систематизированного
рационального и наглядного изложения
цифрового материала характеризующего
изучаемые явления и процессы.

По внешнему виду
статистическая таблица представляет
собой ряд пересекающихся горизонтальных
(строк) и вертикальных линий (граф,
столбцов, колонок). Составленную, но не
заполненную таблицу принято называть
макетом таблицы. В таблице имеются два
основных элемента:

  • подлежащее
    – то, о чем говориться в таблице, объект
    изучения. Может быть представлен в виде
    групп и подгрупп, которые характеризуются
    рядом показателей;

  • сказуемое
    – перечень числовых показателей,
    которыми характеризуется объект
    изучения.

Подлежащее обычно
располагается в левой части таблиц;
сказуемое – в верхней части таблицы в
виде названий граф.

Вид
статистической таблицы зависит от
построения подлежащего – рисунок 3.1.

2.4. Точность статистического наблюдения

Под точностью статистического наблюдения понимают степень соответствия значения наблюдаемого показателя, вычисленного по материалам обследования, его действительной величине. Расхождение, или разница, между ними называется ошибкой статистического наблюдения.

Различают две группы ошибок:

  1. ошибки регистрации;
  2. ошибки репрезентативности.

Ошибки регистрации присущи любому статистическому наблюдению, как сплошному, так и несплошному. Они делятся на случайные ошибки регистрации и систематические ошибки регистрации.

Случайными ошибками регистрации называют ошибки, возникающие вследствие действия случайных факторов. К ним можно отнести различного рода непреднамеренные описки: например, вместо возраста человека «15 лет» указано «5 лет», у Ивановой Марии Петровны в графе пол отмечен «Мужской» и т. п. Такие ошибки легко выявляются методом логического анализа, например, если человеку 8 лет, но имеется высшее образование, а в графе «Семейное положение» указано «Состоит в браке», то, естественно, следует исправить возраст. Если объем исследуемой совокупности велик или велика доля отбора при выборочном наблюдении, случайные ошибки регистрации имеют тенденцию взаимопогашаться вследствие действия закона больших чисел, поскольку ошибки, как правило, разнонаправлены и искажают статистический показатель как в большую, так и в меньшую сторону. При небольшом объеме наблюдения требуется тщательная выверка его результатов — логический анализ данных.

Систематические ошибки регистрации чаще всего имеют однонаправленные искажения: они либо увеличивают, либо уменьшают статистический показатель, и, что характерно, подобная ситуация повторяется от обследования к обследованию. Так, по результатам переписей (практически всех!) число замужних женщин превышает число женатых мужчин — мужчинам приятнее ощущать себя неженатыми, а для женщины как бы «стыдно» быть не замужем. Другой пример, когда человек округляет свой возраст — вместо 32 лет говорит 30, вместо 79-80 и т. п. (это явление широко известно и даже получило свое название — «аккумуляция возрастов»). Систематические ошибки регистрации могут возникать и из-за неточностей измерительных приборов, если сбор информации проводят путем непосредственного наблюдения.

Ошибки репрезентативности присущи только несплошному обследованию. Они также делятся на случайные и систематические ошибки.

Случайные ошибки репрезентативности возникают из-за того, что обследованию подвергается не вся совокупность в целом, а только ее часть, и, следовательно, при несплошном наблюдении они присутствуют всегда. В теории статистики разработаны специальные методы для оценки величин таких ошибок, на их основе для наблюдаемых показателей строят доверительные интервалы, т.д. эти ошибки вычисляются и находятся как бы «под контролем».

Хуже обстоит дело, если наряду со случайными ошибками имеются и ошибки систематические.

Систематические ошибки репрезентативности возникают, если при несплошном наблюдении кардинально нарушаются технологии отбора единиц из генеральной совокупности объектов, но чаще — если в ходе обследования не удается получить информацию обо всех отобранных для наблюдения единицах, например, вследствие отказа отвечать на вопросы анкеты, или если человека не удалось застать дома и т. п.

Ошибки статистического наблюдения для наглядности можно изобразить в виде схемы (рис. 2.1).

Виды ошибок статистического наблюдения

Рис.
2.1.
Виды ошибок статистического наблюдения

Для повышения точности наблюдения необходимо:

  1. правильно разработать формуляр статистического наблюдения: вопросы должны быть четкими, однозначными, не допускающими двойного толкования;
  2. иметь хорошо обученный персонал для проведения обследования;
  3. строго придерживаться выбранной технологии обследования (если проводится несплошное наблюдение) и помнить, что если не удается опросить какую-то конкретную единицу, отобранную для наблюдения, замена ее на другую единицу может привести к возникновению систематической ошибки репрезентативности;
  4. провести логический анализ данных, основанный на логических взаимосвязях показателей, после сбора всей совокупности анкет или формуляров;
  5. целесообразно провести и арифметический контроль данных, т.д. заново пересчитать расчетные величины, если какие-либо показатели получаются в результате определенных арифметических действий;
  6. предпринять определенные меры по восстановлению данных при наличии незаполненных анкет или формуляров либо при получении результатов обследования сделать поправку на неответы респондентов.

Теория

Ошибки статистического наблюдения

Степень соответствия значения какого-либо признака, полученного посредством статистического наблюдения, действительному его значению называется точностью статистического наблюдения.

Исходя из этого, точность статистического наблюдения может быть охарактеризована как абсолютной, так и относительной ошибкой. Абсолютная ошибка статистического наблюдения определяется разностью фактических данных изучаемых признаков и данных, полученных в ходе статистического наблюдения. Относительная ошибка статистического наблюдения определяется их соотношением.

Ошибки регистрации возникают вследствие неверной, ошибочной регистрации фактов в процессе статистического наблюдения или ошибочной их записи. Случайными называются ошибки регистрации, которые возникают вследствие действия различных случайных причин, не имеющих строгой направленности.

Систематическими называются ошибки регистрации, возникающие в силу Определенных и постоянно действующих на протяжении процесса статистического наблюдения причин в одном направлении. Систематические ошибки регистрации могут быть преднамеренными и непреднамеренными и наблюдаться как при сплошном, так и несплошном наблюдении.

Проверка достоверности, объективности и точности данных статистического наблюдения на практике может быть осуществлена посредством реализации следующих видов контроля: синтаксического, логического, счетного.

Любое статистическое наблюдение должно подготавливаться и проводиться по четко разработанному плану, который включает вопросы методологии, организации и техники сбора данных, контроля ее качества и достоверности. Таким образом, статистическое наблюдение должно иметь программу и организационный план проведения. При этом необходимо решить вопросы о способе, форме, виде, средствах, сроках, месте организации и проведения наблюдения и т.д., чем, в свою очередь, и определяется его планомерность.

Всякое статистическое
наблюдение ставит задачу получения
таких данных, которые точнее бы отражали
действительность. Отклонения, или
разности между исчисленными показателями
и действительными (истинными) величинами
исследуемых явлений нашли отражение в
показателях, называемых ошибками, или
погрешностями. В зависимости от характера
и степени влияния на конечные результаты
наблюдения, а также исходя из источников
и причин возникновения неточностей,
допускаемых в процессе статистического
наблюдения, обычно выделяют ошибки
регистрации и ошибки репрезентативности.

Ошибки регистрации
возникают вследствие неправильного
установления фактов в процессе наблюдения
или неправильной их записи. Они
подразделяются на случайные и
систематические и могут быть как при
сплошном, так и несплошном наблюдении.

Случайные
ошибки

ошибки регистрации, которые могут быть
допущены как опрашиваемыми в их ответах,
так и регистраторами при заполнении
бланков.

Систематические
ошибки

могут быть преднамеренными, так и
непреднамеренными. Преднамеренные
ошибки получаются в результате того,
что опрашиваемый, зная действительное
положение дела, сознательно сообщает
неправильные данные. Непреднамеренные
ошибки вызываются различными случайными
причинами (небрежностью или невнимательностью
регистратора, неисправностью измерительных
приборов и т.д.).

Ошибки
репрезентативности

возникают в результате того, что состав
отобранной для обследования части
единиц совокупности недостаточно полно
отображает состав всей изучаемой
совокупности, хотя регистрация сведений
по каждой отобранной для обследования
единице была проведена точно. Ошибки
репрезентативности могут быть случайными
и систематическими.

Случайные
ошибки

возникают из-за того, что совокупность
отобранных единиц наблюдения неполно
воспроизводит всю совокупность в целом.

Систематические
ошибки

возникают вследствие нарушения принципов
случайного отбора единиц изучаемой
совокупности.

Для выявления и
устранения допущенных при регистрации
ошибок может применяться счётный и
логический контроль собранного материала.

Счётный контроль
заключается в проверке точности
арифметических расчётов, применявшихся
при составлении отчётности или заполнении
формуляров обследования.

Логический
контроль

заключается в проверке ответов на
вопросы программы наблюдения путём их
логического осмысления или путём
сравнения полученных данных с другими
источниками по этому же вопросу.

Указанные приемы
проверки статистических данных путем
счетного и логического контроля могут
быть использованы при проверке как
материалов специальных статистических
наблюдений, так и отчетности.

1.3. Сводка и группировка статистических данных

1.3.1. Сводка — второй этап статистического исследования

В результате первой
стадии статистического исследования
— статистического наблюдения — получают
сведения о каждой единице совокупности.
Задача второй стадии статистического
исследования состоит в том, чтобы
упорядочить и обобщить первичный
материал, свести его в группы и на этой
основе дать обобщающую характеристику
совокупности. Этот этап в статистике
называется сводкой.

Сводкой
в
статистике называется научно организованная
обработка
материалов наблюдения, включающая
контроль, систематизацию, составление
таблиц, получение итоговых и производных
показателей.

Целью
сводки служит получение обобщающих
статистических показателей,
отражающих сущность социально-экономических
явлений, а также установление статистических
закономерностей.

Статистическая
сводка осуществляется по программе,
составляемой одновременно с планом и
программой статистического наблюдения.
Программа сводки включает определения
групп и подгрупп, системы
показателей и видов таблиц.

По
технике и способу выполнения сводка
может быть ручной или механизированной.
Ручная
сводка
применяется
для небольших массивов
данных и начинается с шифровки
статистических формуляров (карточек).
Затем они группируются с подсчетом их
числа и других показателей.
При механизированной
сводке
большие
объемы статистических
данных сразу заносятся на машиночитаемые
носители информации
и полностью обрабатываются на ЭВМ.

Различают простую
сводку (подсчет только общих итогов) и
статистическую группировку, которая
сводится к расчленению совокупности
на группы по существенному для единиц
совокупности признаку. Группировка
позволяет получить такие результаты,
по которым можно выявить состав
совокупности, характерные черты и
свойства типичных явлений, обнаружить
закономерности и взаимосвязи.

Результаты сводки
могут быть представлены в виде
статистических рядов распределения.

Статистическим
рядом распределения

называют упорядоченное распределение
единиц совокупности на группы по
изучаемому признаку. В зависимости от
признака ряды могут быть вариационными
(количественными) и атрибутивными
(качественными).

Количественные
признаки

это признаки, имеющие количественное
выражение у отдельных единиц совокупности,
например, заработная плата рабочих,
стоимость продукции промышленных
предприятий, возраст людей, урожайность
отдельных участков посевной площади и
т.д.

Атрибутивные
признаки

это признаки, не имеющие количественной
меры. Например, пол (мужской, женский),
отрасль народного хозяйства, вид
продукции, профессия рабочего и т.д.

Вариационные
ряды
могут
быть дискретными или интервальными.

Дискретный ряд
распределения

— это ряд, в котором варианты выражены
целым числом.

Примером может
служить распределение рабочих по
тарифным разрядам:

Тарифный разряд

Число рабочих,
чел.

1-й

10

2-й

20

3-й

40

4-й

60

5-й

50

6-й

20

200

Интервальный
ряд распределения

— это ряд, в котором значения признака
заданы в виде интервала. Например,
распределение рабочих по разрядам можно
представить в виде интервального ряда.

Тарифный разряд

Число рабочих,
чел.

1-2-й

30

3-4-й

100

5-6-й

70

200

Статистические
ряды распределения позволяют
систематизировать и обобщать статистический
материал. Однако они не дают всесторонней
характеристики выделенных групп. Чтобы
решить ряд конкретных задач, выявить
особенности в развитии явления, обнаружить
тенденции, установить зависимости,
необходимо произвести группировку
статистических данных.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

2.4. Точность статистического наблюдения

Под точностью статистического наблюдения понимают степень соответствия значения наблюдаемого показателя, вычисленного по материалам обследования, его действительной величине. Расхождение, или разница, между ними называется ошибкой статистического наблюдения.

Различают две группы ошибок:

  1. ошибки регистрации;
  2. ошибки репрезентативности.

Ошибки регистрации присущи любому статистическому наблюдению, как сплошному, так и несплошному. Они делятся на случайные ошибки регистрации и систематические ошибки регистрации.

Случайными ошибками регистрации называют ошибки, возникающие вследствие действия случайных факторов. К ним можно отнести различного рода непреднамеренные описки: например, вместо возраста человека «15 лет» указано «5 лет», у Ивановой Марии Петровны в графе пол отмечен «Мужской» и т. п. Такие ошибки легко выявляются методом логического анализа, например, если человеку 8 лет, но имеется высшее образование, а в графе «Семейное положение» указано «Состоит в браке», то, естественно, следует исправить возраст. Если объем исследуемой совокупности велик или велика доля отбора при выборочном наблюдении, случайные ошибки регистрации имеют тенденцию взаимопогашаться вследствие действия закона больших чисел, поскольку ошибки, как правило, разнонаправлены и искажают статистический показатель как в большую, так и в меньшую сторону. При небольшом объеме наблюдения требуется тщательная выверка его результатов — логический анализ данных.

Систематические ошибки регистрации чаще всего имеют однонаправленные искажения: они либо увеличивают, либо уменьшают статистический показатель, и, что характерно, подобная ситуация повторяется от обследования к обследованию. Так, по результатам переписей (практически всех!) число замужних женщин превышает число женатых мужчин — мужчинам приятнее ощущать себя неженатыми, а для женщины как бы «стыдно» быть не замужем. Другой пример, когда человек округляет свой возраст — вместо 32 лет говорит 30, вместо 79-80 и т. п. (это явление широко известно и даже получило свое название — «аккумуляция возрастов»). Систематические ошибки регистрации могут возникать и из-за неточностей измерительных приборов, если сбор информации проводят путем непосредственного наблюдения.

Ошибки репрезентативности присущи только несплошному обследованию. Они также делятся на случайные и систематические ошибки.

Случайные ошибки репрезентативности возникают из-за того, что обследованию подвергается не вся совокупность в целом, а только ее часть, и, следовательно, при несплошном наблюдении они присутствуют всегда. В теории статистики разработаны специальные методы для оценки величин таких ошибок, на их основе для наблюдаемых показателей строят доверительные интервалы, т.д. эти ошибки вычисляются и находятся как бы «под контролем».

Хуже обстоит дело, если наряду со случайными ошибками имеются и ошибки систематические.

Систематические ошибки репрезентативности возникают, если при несплошном наблюдении кардинально нарушаются технологии отбора единиц из генеральной совокупности объектов, но чаще — если в ходе обследования не удается получить информацию обо всех отобранных для наблюдения единицах, например, вследствие отказа отвечать на вопросы анкеты, или если человека не удалось застать дома и т. п.

Ошибки статистического наблюдения для наглядности можно изобразить в виде схемы (рис. 2.1).

Виды ошибок статистического наблюдения

Рис.
2.1.
Виды ошибок статистического наблюдения

Для повышения точности наблюдения необходимо:

  1. правильно разработать формуляр статистического наблюдения: вопросы должны быть четкими, однозначными, не допускающими двойного толкования;
  2. иметь хорошо обученный персонал для проведения обследования;
  3. строго придерживаться выбранной технологии обследования (если проводится несплошное наблюдение) и помнить, что если не удается опросить какую-то конкретную единицу, отобранную для наблюдения, замена ее на другую единицу может привести к возникновению систематической ошибки репрезентативности;
  4. провести логический анализ данных, основанный на логических взаимосвязях показателей, после сбора всей совокупности анкет или формуляров;
  5. целесообразно провести и арифметический контроль данных, т.д. заново пересчитать расчетные величины, если какие-либо показатели получаются в результате определенных арифметических действий;
  6. предпринять определенные меры по восстановлению данных при наличии незаполненных анкет или формуляров либо при получении результатов обследования сделать поправку на неответы респондентов.

Ошибки в статистике

Ошибки в статистике (сплошных и выборочных) могут возникнуть ошибки двух видов: репрезентативности и регистрации.

Ошибки репрезентативности характерны только для выборочного наблюдения и возникают в результате того, что выборочная совокупность не полностью воспроизводит генеральную. Они определяются как расхождение между значениями показателей, полученных по выборке, и значениями показателей этих же величин, которые были бы получены при проведенном сплошном наблюдении с одинаковой степенью точности.

Ошибки регистрации могут иметь случайный, систематический и непреднамеренный характер.

Случайные ошибки часто уравновешивают друг друга, так как они не имеют преимущественного направления в сторону преувеличения (преуменьшении) значения изучаемого показателя. Данные ошибки имеют объективный характер и возникают в следствии случайных различий между единицами, попавшими в выборку, и единицами генеральной совокупности. В результате и структуры этих совокупностей чаще всего не совпадают. Научным обоснованием случайных ошибок являются теория вероятностей и ее предельные теоремы.

Систематические ошибки направлены в одну сторону в результате предумышленного нарушения правил отбора. Их можно избежать при правильной организации и проведении наблюдения.

Ошибка выборки в статистике

Ошибка выборки или ошибка репрезентативности определяется как разница между значением показателя, который был получен по выборке, и генеральным параметром. Она характерна только для выборочных наблюдений. Чем больше значение этой ошибки, тем в большей степени выборочные показатели отличаются от соответствующих им генеральных показателей.

Ошибку выборки часто определяют по формулам:

1. Для среднего количественного признака:

Ошибка выборки

где первое — среднее значение признака в генеральной совокупности или генеральная средняя;
второе — выборочная средняя.

2. Для доли (альтернативного признака):

Выборочная доля

где w — выборочная доля;
р — генеральная доля, или доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности.

Ошибки выборки возникают вследствие двух причин из-за нарушения принципа случайности как основного принципа выборки (систематические ошибки) и в результате случайного отбора (случайные ошибки). Выборки являются случайными величинами и могут принимать разные значения.

Источник: Балинова B.C. Статистика в вопросах и ответах: Учеб. пособие. — М.: ТК. Велби, Изд-во Проспект, 2004. — 344 с.

6. Достоверность статистических данных и
ошибки статистического наблюдения

Важнейшим требованием
предъявляемым к статистическим данным является их достоверность. Под достоверностью
данных наблюдения
 понимается степень приближения, соответствия
данных тому, что есть на самом деле. Расхождение межу фактическим значением и
результатом наблюдения называют погрешностью (ошибкой) наблюдения.

Ошибки наблюдения
разнообразны по происхождению и своему содержанию. В зависимости от
причин
возникновения различают следующие виды ошибок:

• методические ошибки;

• ошибки регистрации;

• ошибки
репрезентативности (представительности).

Методические ошибки возникают
в результате использования несовершенных методик, неправильных теоретических
концепций, лежащих в основе исследования.

Ошибки регистрации возникают при
получении данных об отдельных единицах совокупности вследствие неправильного
установления фактов в процессе наблюдения или неправильной их записи. Они
подразделяются на:

-объективные (непреднамеренные)
причиной появления которых является неправильное восприятие наблюдаемых фактов,
неисправность измерительных приборов и неправильная регистрация. Такие ошибки
являются результатом добросовестного заблуждения регистратора;

— субъективные (преднамеренные)
ошибки, возникающие по причине сознательного искажения фактов. К ним относятся
всевозможные преднамеренные ошибки и приписки, при которых опрашиваемый
преднамеренно сообщает неправильные сведения; регистратор преднамеренно
воздействует на респондента с целью получения нужного ответа; регистратор
преднамеренно искажает в формулярах результаты наблюдения.

Ошибки репрезентативности
(представительности)
характерны только для несплошного наблюдения.
Они возникают в результате того, что состав отобранной для обследования части
единиц совокупности (выборки) не полностью отражает состав и свойства всей
изучаемой совокупности, несмотря на то, что регистрация сведений по каждой
отобранной единице была проведена точно.

По форме проявления (по
влиянию на результат)
ошибки делятся на:

• систематически;

• случайные.

Систематические ошибки возникают
по какой-то определенной причине и вызывают одностороннее искажение значений
признака у наблюдаемых единиц (увеличение или уменьшение). Они очень опасны,
так как величина показателя, рассчитанная в целом по всей совокупности будет
включать накопленную ошибку.

Случайные ошибки являются
результатом действия различных случайных факторов. Они не имеют какой-либо
направленности. В больших совокупностях в результате действия закона больших
чисел эти ошибки взаимно погашаются и не оказывают существенного влияния на
точность наблюдения.

Оба вида ошибок в любом
исследовании выступают совместно и составляют совокупную ошибку наблюдения Δ:

Δ=σ+ε;

где σ — систематическая
ошибка наблюдения,

ε — случайная ошибка
наблюдения.

Для выявления и
исправления ошибок, данные наблюдения необходимо тщательно контролировать.
Процедура контроля сводится к следующему:

Проверка материалов
наблюдения на полноту и правильность оформления.
Проверяется полнота охвата
статистических единиц наблюдения, правильность заполнения каждого формуляра.

Арифметический
(счетный) контроль
. Этот вид контроля основан на использовании
количественных связей между показателями, которые могут быть проверены
арифметическими действиями. Такие связи обычно отражаются в заголовках граф или
строк формуляров. Например, графа x = графа y — графа z и т.д. Арифметический
контроль используется для проверки итоговых данных, с его помощью устанавливается
наличие ошибки.

Логический контроль основан
на использовании логической взаимосвязи показателей, установлении логического
соответствия между ними. Он не выявляет ошибки наблюдения, а лишь ставит под
сомнение правильность полученных данных. Логический контроль заключается в
проверке ответов на вопросы программы наблюдения путем их логического
осмысления или сравнения полученных данных с другими источниками по данному
вопросу. Классическим примером логического контроля является соответствие данных
при переписи населения о возрасте, образовании и семейном положении. Для
проверки данных наблюдения обычно составляется схема контроля, в которую
включаются различные виды контроля. При обнаружении ошибок нельзя
самостоятельно их исправлять. Для этого необходимо получить дополнительную
информацию путем повторного наблюдения. Данные наблюдения считаются принятыми,
если они прошли контроль, и в них внесены все необходимые исправления.
Проверкой собранных данных заканчивается начальная стадия статистического
исследования. После этого можно переходить ко второй стадии исследования
обработке данных наблюдения. Обработка заключается в классификации и
систематизации полученного статистического материала, осуществляемых через
сводку и группировку.

О сводке и группировке мы
поговорим с Вами в следующей лекции.

   Расхождение между действительными значениями изучаемых величин и значениями, установленными в процессе статистического наблюдения, и называют ошибкой наблюдения. Ошибки являются следствием неточности при установлении и регистрации значений изучаемых признаков.
   В зависимости от причин возникновения различают следующие виды ошибок:
   1) ошибки регистрации;
   2) ошибки репрезентативности (представительности);
   3) случайные ошибки;
   4) систематические ошибки;
   5) преднамеренные ошибки;
   6) непреднамеренные ошибки.
   Ошибки регистрации — это отклонения между значением показателя, полученным в ходе статистического наблюдения, и фактическим, действительным его значением. Этот вид ошибок возникает при сплошном и несплошном наблюдениях.
   Ошибки репрезентативности (представительности) — собственное расхождение величины изучаемого признака в отобранной части совокупности и во всей совокупности. Ошибки репрезентативности свойственны только несплошному наблюдению.
   Случайная ошибка — это результат действия различных случайных факторов, оговорок при ответах, описок, неправильности измерения. Случайные ошибки действуют как в направлении увеличения, так и в направлении уменьшения значений изучаемых признаков.
   При достаточно большой обследуемой совокупности в результате действия закона больших чисел эти ошибки взаимно погашаются.
   Систематические ошибки регистрации всегда имеют одинаковую тенденцию либо к увеличению, либо к уменьшению значения показателей по каждой единице наблюдения, и поэтому величина показателя по совокупности в целом будет включать в себя накопленную ошибку. Систематические ошибки могут появляться в результате несовершенства измерительных приборов, неправильности округлений результатов, неясной формулировки программы.
   Преднамеренные и непреднамеренные ошибки определяются степенью тенденциозности подхода к установлению факта. Преднамеренные ошибки выражаются в сознательном искажении значений признаков. Непреднамеренные ошибки возникают независимо от сознания людей, участвующих в статистическом наблюдении.
   Для выявления ошибок наблюдения применяют следующие виды контроля:
   1) счетный контроль. Заключается в проверке итогов подсчета данных, а также в использовании количественных связей между показателями;
   2) логический контроль. Осуществляется путем проверки содержательной связи между значениями признаков. При логическом контроле отыскиваются недопустимые отклонения значений признака от наиболее вероятных.

20. Понятие о выборочном наблюдении

Выборочное наблюдение — это такое наблюдение, при котором обследованию подвергается часть единиц изучаемой совокупности, отобранных на основе научно разработанных принципов, обеспечивающих получение достаточного количества достоверных данных для характеристики совокупности в целом.
   Основные принципы выборочного наблюдения следующие: случайность отбора наблюдаемого явления; репрезентативность выборки.
   В основе принципа случайности лежит равная возможность для каждой единицы попасть в выборку. Репрезентативные выборки обеспечивают достаточным числом отобранных единиц. Средние и относительные показатели, полученные на основе выборочных данных, должны достаточно полно воспроизводить или представлять соответствующие показатели совокупности в целом.
   Выборочное наблюдение предполагает проведение таких этапов, как:
   1) определение объекта и целей выборочного наблюдения;
   2) выбор схемы отбора единиц наблюдения;
   3) расчет объема выборки;
   4) проведение случайного отбора установленного числа единиц из генеральной совокупности;
   5) наблюдение отобранных единиц по установленной программе;
   6) расчет выборочных характеристик в соответствии с программой выборочного наблюдения;
   7) определение ошибки, ее размера;
   8) распространение выборочных данных на генеральную совокупность;
   9) анализ полученных данных.
   Выборочное наблюдение имеет следующие основные преимущества и недостатки:
   1) преимущества:
   а) его можно осуществить по более широкой программе;
   б) его требует меньше затрат на проведение;
   в) его организуют в тех случаях, когда невозможно воспользоваться отчетностью;
   2) недостатки:
   а) полученные данные всегда содержат ошибку;
   б) о результатах наблюдения можно судить лишь с определенной степенью достоверности.
   Вся совокупность единиц, из которых производится отбор, называется генеральной совокупностью. Часть единиц генеральной совокупности, отобранная в случайном порядке, составляет выборочную совокупность. Характеристиками генеральной и выборочной совокупности служат доля и средняя величина, а также дисперсия и среднее квадратическое отклонение. Средняя величина является характеристикой количественных признаков, а дол я — характеристикой альтернативных признаков.
   Среднее значение признака генеральной совокупности называется генеральной средней, обозначается , выборочной совокупности — выборочной средней, обозначается .
   Доля генеральной совокупности называется генеральной долей и обозначается р, доля выборочной совокупности называется выборочной долей и обозначается w. Численность генеральной совокупности обозначается N, а численность выборочной — n.

12. Ошибки выборочного наблюдения

Ошибка выборки — расхождение между характеристиками выборки и характеристиками генеральной совокупности. Она зависит от ряда факторов: степени вариации изучаемого признака, численности выборки, методов отбора единиц в выборочную совокупность, принятого уровня достоверности результата исследования. Ошибка выборки состоит из ошибки регистрации и ошибки репрезентативности, которые бывают систематическими и случайными.
   

Конец бесплатного ознакомительного фрагмента

  • Систематическая ошибка регистрации пример
  • Систематические ошибки делятся на
  • Систематическая ошибка отбора это
  • Систематическая ошибка это физика
  • Систематическая ошибка обусловленная измерением возникает когда