Любое статистическое исследование массовых общественных явлений включает в себя 3 основных этапа:

    Статистическое наблюдение - формируются первичные статистические данные, или исходная статистическая информация, которая является основой статисти­ческого исследования. Если при сборе первичных статистических данных допущена ошибка или материал оказался недоброкачественным, это повлияет на правильность и достоверность как теоретических, так и практических выводов;

    Сводка и группировка данных - на этой стадии совокупность делится по признакам различия и объединяется по признакам сходства, подсчитываются суммарные показатели по группам и в целом. С помощью метода группировок изучаемые явления в зависимости от существенных признаков подразделяются на типы, группы и подгруппы. Метод группировок позволяет ограничивать качественно однородные в существенном отношении совокупности, что служит предпосылкой для определения и применения обобщающих показателей;

    Обработка и анализ полученных данных, выявление закономерностей. На этом этапе с помощью обобщающих показателей рассчитываются относительные и средние величины, дается сводная оценка вариации признаков, характеризуется динамика явлений, применяются индексы, балансовые построения, рассчитываются показатели, характеризующие тесноту связей в изменении признаков. С целью наиболее рационального и наглядного изложения цифрового материала он представляется в виде таблиц и графиков.

Лекция №2. Статистическое наблюдение

1. Понятие и формы статистического наблюдения

Статистическое наблюдение - это первая стадия всякого статистического исследования.

Статистическое наблюдение представляет собой научно организованную работу по сбору массовых первичных данных о явлениях и процессах общественной жизни.

Однако не всякий сбор сведений является статистическим наблюдением. О статистическом наблюдении можно говорить лишь тогда, когда изучаются статистические закономерности, т.е. такие, которые проявляются только в массовом процессе, в большом числе единиц какой-то совокупности.

Следовательно, статистическое наблюдение должно быть:

    планомерным - готовиться и проводиться по разработанному плану, который включает вопросы методологии, организации, техники сбора информации, контроля за качеством собранного материала, его достоверности, оформления итоговых результатов;

    массовым - охватывать большое число случаев проявления данного процесса, достаточное для того, чтобы получить правдивые статистические данные, характеризующие не только отдельные единицы, но и всю совокупность в целом;

    система­тическим – изучение тенденций и закономерностей социально-экономических процессов, характеризующихся количественными и качественными измене­ниями, возможно лишь на основе систематичности.

К статистическому наблюдению предъявляются следующие основные требования:

    полнота статистических данных (полнота охвата единиц изучаемой совокупности, сторон того или иного явления, а также полнота охвата во времени);

    достоверность и точность данных;

    единообразие и сопоставимость данных.

В статистической практике используются две организационные формы наблюдения:

1) отчетность - это такая организационная форма, при которой единицы наблюдения представляют сведения о своей деятельности в виде формуляров регламентированного образца. Особенность отчетности состоит в том, что она обязательна, документально обоснована и юридически подтверждена подписью руководителя;

2) специальное статистическое обследование, примером чего являются проведение переписей населения, социологические исследования, переписи остатков материала и др. наблюдения, которые проводятся, если возникают задачи, для решения которых нет достаточной информации. Они дают дополнительный материал к отчетным данным или с их помощью проверяют отчетные данные.

1. ЭТАПЫ СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ

Процесс изучения социально-экономических явлений посредством системы статистических методов и количественных характеристик – системы показателей, называется статистическим исследованием.

Основными этапами проведения статистического исследования являются:

1) статистическое наблюдение;

2) сводка полученных данных;

3) статистический анализ.

В случае необходимости статистическое исследование может содержать дополнительный этап – статистический прогноз.

Статистическое наблюдение – научно организованный сбор данных о явлениях и процессах общественной жизни посредством регистрации по заранее разработанной программе наблюдения их существенных признаков. Данные наблюдения представляют собой первичную статистическую информацию о наблюдаемых объектах, которая является основой для получения их обобщающих характеристик. Наблюдение выступает как один из главных методов статистики и как одна из важнейших стадий статистического исследования.

Проведение статистического исследования невозможно без качественной информационной базы, получаемой в ходе статистического наблюдения. Поэтому, с момента изменения представлений о статистике как о науке описательной, разрабатываются особые правила проведения наблюдения и специальные требования к его результатам – статистическим данным. То есть, наблюдение является одним из основных методов статистики.

Наблюдение является первым этапом статистического исследования, от качества которого зависит достижение конечных задач исследования.

1.1. Наблюдение осуществляется по специально подготовленной программе.

Программа включает в себя перечень характеристик объекта исследования, данные о которых необходимо получить в результате наблюдения.

При подготовке наблюдения необходимо заранее определить:

1. Программу наблюдения, в которой:

а) определен объект наблюдения, т.е. то множество единиц явления, которое необходимо исследовать. Причем, необходимо отличать единицу наблюдения от отчетной единицы. Отчетная единица – единица предоставляющая статистические данные, может состоять из нескольких единиц совокупности, а может совпадать с единицей совокупности. Например, при обследовании населения единицей может быть член домохозяйства, а отчетной единицей – домохозяйство.

б) определены границы объекта наблюдения.

в) определены признаки объекта наблюдения, сведения о которых необходимо получить в результате наблюдения.

2. Время наблюдения объекта – время по состоянию на которое или за которое регистрируются сведения об изучаемом объекте.

3. Сроки проведения наблюдения. То есть, определяются период времени сбора данных и дата завершения наблюдения. Сроки наблюдения влияют на время окончания в целом статистического исследования и на своевременность его выводов.

4. Средства и ресурсы, необходимые для проведения наблюдения: количество квалифицированных специалистов; материальные ресурсы; средства обработки результатов наблюдения.

5. Требования к статистическим данным. Основными требованиями являются: а) достоверность, т.е. сведения об объекте исследования должны отражать реальное его состояние в момент наблюдения; б) сопоставимость данных, т.е. сведения, полученные в результате наблюдения, должны быть сравнимыми, что обеспечивается единой методикой сбора и анализа данных, по единицам измерения и т.д.

1.2. Выделяют несколько видов статистического наблюдения.

1. По охвату единиц совокупности:

а) сплошное;

б) несплошное (выборочное, монографическое, по методу основного массива)

2. По времени регистрации фактов: а) текущее (непрерывное); б) прерывное (периодическое, единовременное)

3. По способу сбора информации: а) непосредственное наблюдение; б) документальное наблюдение; в) опрос (анкетный, корреспондентский и др.)

Сводка – процесс приведения в систему полученных данных, их обработка и подсчет промежуточных и общих итогов, расчет взаимосвязанных величин аналитического характера.

Следующим этапом статистического исследования является подготовка полученных в ходе наблюдения сведений к анализу. Этот этап называется сводка.

Сводка включает в себя:

— систематизацию полученных в ходе наблюдений сведений;

— их группировку;

— разработку системы показателей, характеризующих образованные группы;

— создание разработочных таблиц для сгруппированных данных;

— расчет производных величин по разработочным таблицам.

В литературе по теории статистики часто встречается рассмотрение сводки и группировки как самостоятельных этапов исследования. Однако, следует заметить, что понятие сводки включает в себя действия по группировке статистических данных, поэтому здесь в качестве названия этапа исследования принято понятие «сводка».

Статистический анализ – исследование характерных особенностей структуры, связи явлений, тенденций, закономерностей развития социально-экономических явлений, для чего используются специфические экономико-статистические и математико-статистические методы. Статистический анализ завершается интерпретаций полученных результатов.

Статистический прогноз – научное выявление состояния и вероятных путей развития явлений и процессов, основанное на системе установленных причинно-следственных связей и закономерностей.

ЗАДАНИЕ 1

В результате выборочного обследования заработной платы 60-ти работников предприятия промышленности были получены следующие данные (табл. 1).

Постройте интервальный ряд распределения по результативному признаку, образовав пять групп с равными интервалами.

Определите основные показатели вариации (дисперсию, среднее квадратическое отклонение, коэффициент вариации), среднюю степенную величину (среднее значение признака) и структурные средние. Изобразите графически в виде: а) гистограммы; б) кумуляты; в) огивы. Сделайте вывод.

РЕШЕНИЕ

1. Определим размах вариации по результативному признаку – по производственному стажу по формуле:

R = Хmax – Хmin = 36 – 5 = 31

где Хmax – максимальный размер активов

Хmin – минимальный размер активов

2. Определим величину интервала

i = R/n = 31/5= 6,2

с учетом полученной величины интервалов производим группировку банков и получаем

3. Построим вспомогательную таблицу

Группа призна-ка

Значение значений в группе

х i

Количество частота признака (частота)

f i

в % к итогу

ω

Накопленная частота

S i

Середина интервала

* f i

ω

I

5 – 11,2

6,8,7,5,8,6,10,9,9,7, 6,6,9,10,7,9,10,10, 11,8,9,8, 7, 6, 9, 10

43,3

43,3

210,6

350,73

46,24

1202,24

II

11,2 – 17,4

16,15,13,12,14,14, 12,14,17,13,15,17, 14

21,7

14,3

185,9

310,31

0,36

4,68

III

17,4 – 23,6

18,21,20,20,21,18, 19,22,21,21,21,18, 19

21,7

86,7

20,5

266,5

444,85

31,36

407,68

IV

23,6 –29,8

28,29,25,28, 24

26,7

133,5

221,61

11,8

139,24

696,2

V

29,8 – 36

36,35,33,

32,9

98,7

164,5

ИТОГО

895,2

1492

541,2

3282,8

4. Среднее значение признака в изучаемой совокупности определяется по формуле арифметической взвешенной:

года

5. Дисперсия и среднее квадратическое отклонение признака определяется по формуле



Определение колеблемости


Таким образом, V>33,3%, следовательно, совокупность неоднородна.

6. Определение моды

Мода – значение признака, наиболее часто встречающееся в изучаемой совокупности. В исследуемом интервальном вариационном ряду мода рассчитывается по формуле:


где

x M0
– нижняя граница модального интервала:

i M0 – величина модального интервала;

f M0-1 f M0 f M0+1 – частоты (частости) соответственно модального, домо-дального и послемодального интервалов.

Модальный интервал – это интервал, имеющий наибольшую частоту (частость). В нашей задаче – это первый интервал.


7. Рассчитаем медиану.

Медиана – вариант, расположенный в середине упорядоченного вариационного ряда, делящий его на две равные части, таким образом, что половина единиц совокупности имеют значения признака меньше, чем медиана, а половина– больше, чем медиана.

В интервальном ряду медиана определяется по формуле:


где – начало медианного интервала;

– величина медианного интервала

– частота медианного интервала;

– сумма накопленных частот в домедианном интервале.

Медианный интервал – это интервал, в котором находится порядковый номер медианы. Для его определения необходимо подсчитать сумму накопленных частот до числа, превышающего половину совокупности.

По данным гр. 5 вспомогательной таблицы находим интервал, сумму накопленных часто в котором превышает 50%. Это второй интервал – от 11,6 до 18,4, он и является медианным.

Тогда


Следовательно, половина работников имеющих стаж работы меньше 13,25 лет, а половина – больше этой величины.

6. Изобразим ряд в виде полигона, гистограммы, кумулятивной прямой, огивы.

Графическое представление играет важную роль в изучении вариационных рядов, так как позволяет в простой и наглядной форме проводить анализ статистических данных.

Существует несколько способов графического изображения рядов (гистограмма, полигон, кумулята, огива), выбор которых зависит от цели исследования и от вида вариационного ряда.

Полигон распределения в основном используется для изображения дискретного ряда, но можно построить полигон и для интервального ряда, если предварительно привести его к декретному. Полигон распределения представляет собой замкнутую ломаную линию в прямоугольной системе координат с координатами (x i , q i), где x i — значение i-го признака, q i — частота или частость i-ro признака.

Гистограмма распределения применяется для изображения интервального ряда. Для построения гистограммы на горизонтальной оси откладывают последовательно отрезки, равные интервалам признака, и на этих отрезках, как на основаниях, строят прямоугольники, высоты которых равны частотам или частностям для ряда с равными интервалами, плотностям; для ряда с неравными интервалами.


Кумулята есть графическое изображение вариационного ряда, когда на вертикальной оси откладываются накопленные частоты или частности, а на горизонтальной – значения признака. Кумулята служит для графического представления как дискретных, так и интервальных вариационных рядов.


Вывод: Таким образом, были рассчитаны основные показатели вариации исследуемого ряда: среднее значение признака – производственного стажа составляет 14,9 лет, рассчитана дисперсия равная 54,713, в свою очередь среднее квадратическое отклонение признака – 7,397. Мода имеет значение 9,13, в модальным интервалом является первый интервал изучаемого ряда. Медиана ряда равная 13,108, делит ряд на две равные части говорит о том что в исследуемой организации половина работников имеет стаж работы меньше 13,108 лет, а половина – больше.

ЗАДАНИЕ 2

Имеются следующие исходные данные, характеризующие динамику за 1997 – 2001 г.г. (таблица 2).

Таблица 2 Исходные данные

Год

1997

1998

1999

2000

2001

Выпуск сахарного песка, тыс.т.

1620

1660

1700

1680

1700

Определите основные показатели ряда динамики. Расчет представьте в виде таблицы. Рассчитайте среднегодовые значения показателей. В виде графического изображения – полигона, обозначьте динамику анализируемого показателя. Сделайте вывод.

РЕШЕНИЕ

Дано

Год

Годы

1997

1998

1999

2000

2001

1620

1660

1700

1680

1700

1) Средний уровень динамики рассчитывается по формуле


2) Цепные и базисные темпы роста рассчитываем следующим образом:

1. Абсолютный прирост определяется по формуле:

Аiб = yi – y0

Аiц = yi – yi-1

2. Темп роста определяется по формуле: (%)

Трб = (yi / y0) *100

Трц = (yi / yi-1)*100

3. Темп прироста определяется по формуле: (%)

Тnрб = Трб –100%:

Тnрц = Трц – 100%

4. Средний абсолютный прирост:


y n
– конечный уровень динамического ряда;

y 0
начальный уровень динамического ряда;

n ц
– число цепных абсолютных приростов.

5. Среднегодовой темп роста:


6. Среднегодовой темп прироста:


3) Абсолютное содержание 1% прироста:

А = Хi-1 / 100

Все рассчитанные показатели сводим в таблицу.

Показатели

Годы

1997

1998

1999

2000

2001

Количество хирургических операций за период

1620

1660

1700

1680

1700

2. Абсолютный прирост

Aiц

3. Темп роста

Трib

102,5

104,9

103,7

104,9

Трiц

102,5

102,4

98,8

101,2

4. Темп прироста

Тпib

Тпiц

5. Значение 1% прироста

16,2

16,6

17,0

16,8

5) Среднегодовое значение


7. Изобразим графически в виде полигона.


Таким образом, получено следующее. Наибольший абсолютный и относительный прирост хирургических операций за период было в 1999 году и составило 1700, абсолютный прирост по сравнению с базисным годом составил 80 операций, темп роста по отношению к базовому 1997 годом равен 104,9%, а базовый темп прирост был 4,9%. Наибольшие цепные абсолютные приросты были в 1998 и 1999 году – по 40 операций. Наибольший цепной темп роста наблюдался в 1998 году – 102,5%, а наименьший цепной темп прироста количества операций составляет в 2000 году – 98,8%.

ЗАДАНИЕ 3

Имеются данные о реализации товаров (см. таблицу 3)

Таблица 3 Исходные данные о реализации товаров

Товар

Базовый год

Отчетный год

кол-во

цена

кол-во

цена

1100

1000

1350

1300

1650

1700

Определить: а) индивидуальные индексы (i p , i q ); б) общие индексы (I p , I q , I pq); в) абсолютное изменение товарооборота за счет: 1) количества товаров; 2) цены.

На основании исчисленных показателей сделайте вывод.

РЕШЕНИЕ

Составим вспомогательную таблицу

Вид

Базисное

Отчетное

Произведение

Индексы

Кол-во, q 0

Цена, p 0

Кол-во, q 1

Цена, p 1

q 0 * p 0

q 1 * p 1

i q =q 1 /q 0

i p =p 1 /p 0

q 1 * p 0

44000

35000

0,875

0,909

38500

1100

1000

41800

40000

0,909

1,053

38000

7500

8400

1,200

0,933

9000

1350

1300

40500

26000

0,667

0,963

27000

45000

44000

1,100

0,889

49500

1650

1700

26400

25500

1,030

0,938

27200

ИТОГО

205200

178900

189200


Вывод: Как видим общий прирост товарооборота за год составил (-26300) усл.ед., включая влияние изменения количества проданного товара на — 16000 и из-за изменения цены на товар – 10300 усл.ед. Общий прирост товарооборота составил 87,2%. Следует отметить, что согласно рассчитанным индексам количества товара по ассортименту наблюдается незначительный прирост товарооборота по товару «П» на 120% и товару «С» 110%, незначительный рост реализации товара «Т» – всего 103%. Довольно значительно снизилась реализации товара «Р» – всего 66,7% от реализации в базисном году, чуть выше реализация товара «Н» – 87,5% и товара «О» – 90,9% от соответствующего показателя базисного года. Индивидуальный индекс цены показывает, что цена выросла лишь на товар «О» – на 105,3%, в то же время по всем остальным наименованиям товара – «Н», «П», «Р», «С», «Т» индивидуальный индекс цен свидетельствует об отрицательной динамике (снижении) соответственно – 90,9%; 93,3%;, 96,3%, 88,9; 93,8.

Общий индекс физического объема реализации свидетельствует о незначительном снижении общего объема реализации на 94,6%; общий индекс цены свидетельствует об общем снижении цены на реализуемые товары на 92,2%, а общий индекс товарооборота говорит об общем снижении товарооборота на 87,2%.

ЗАДАНИЕ 4

Из исходных данных таблицы № 1 (выбрать строки с 14 до 23) по двум признакам – производственному стажу и размеру заработной платы провести корреляционно-регрессионный анализ, определить параметры корреляции и детерминации. Построить график корреляционной зависимости между двумя признаками (результативным и факторным). Сделать вывод.

РЕШЕНИЕ

Исходные данные

Производственный стаж

Размер заработной платы

1800

2500

1750

1580

1750

1560

1210

1860

1355

1480

Прямолинейная зависимость

Параметры уравнения определяются по методу наименьших квадратов, по системе нормальных уравнения


Для решения системы используем метод определителей.

Параметры рассчитывает по формулам

2.1 Схема проведения статистического исследования

Системы статистического анализа данных – это современный эффективный инструмент статистического исследования. Широкие возможности для обработки статистических данных имеют специальные системы статистического анализа, а также универсальные средства – Excel, Matlab, Mathcad и др..

Но даже самый совершенный инструмент не может заменить исследователя, который должен сформулировать цель исследования, провести сбор данных, выбрать методы, подходы, модели и средства проведения обработки и анализа данных, а также интерпретировать полученные результаты.

На рисунке 2.1 представлена схема проведения статистического исследования.

Рис.2.1 - Принципиальная схема статистического исследования

Исходным пунктом статистического исследования является формулировка проблемы. При ее определении учитывается цель исследования, определяется, какая информация необходима и как она будет использоваться при принятии решения.

Само статистическое исследование начинается с подготовительного этапа. В ходе подготовительного этапа аналитики изучают техническое задание – документ, составляемый заказчиком исследования. В техническом задании должны быть четко сформулированы цели исследования:

    определен объект исследования;

    перечислены предположения и гипотезы, которые в ходе исследования должны быть подтверждены или опровергнуты;

    описано то, как будут использоваться результаты исследования;

    сроки, в которые исследование должно быть проведено и бюджет исследования.

На основе технического задания разрабатывается структура аналитического отчета - то, в каком виде должны быть представлены результаты исследования, а также программа статистического наблюдения . Программа представляет собой перечень признаков, подлежащих регистрации в процессе наблюдения (или вопросов на которые должны быть получены достоверные ответы по каждой обследуемой единице наблюдения). Содержание программы определяется как особенностями наблюдаемого объекта и целями исследования, так и методами, выбранными аналитиками для дальнейшей обработки собранной информации.

Основной этап статистического исследования включает сбор необходимых данных и их анализ.

Финальным этапом исследования является составление аналитического отчета и предоставление его заказчику.

На рис. 2.2 представлена схема статистического анализа данных.

Рис.2.2 – Основные этапы статистического анализа

2.2 Сбор статистической информации

Сбор материалов подразумевает анализ технического задания исследования, определение источников необходимой информации и (при необходимости) разработку анкет. При исследовании источников информации все требуемые данные разделяют на первичные (данные, которых нет в наличии и которые должны быть собраны непосредственно для данного исследования), и вторичные (собранные ранее для иных целей).

Сбор вторичных данных часто называют "кабинетным" или "библиотечным" исследованием.

Примеры сбора первичных данных: наблюдения за посетителями магазина, анкетирование пациентов больницы, обсуждение проблемы на совещании.

Вторичные данные делят на внутренние и внешние.

Примеры источников внутренних вторичных данных:

    информационная система организации (включающая в себя бухгалтерскую подсистему, подсистему управления продажами, CRM (CRM-система, сокращение от англ. Customer Relationship Management) - прикладное программное обеспечение для организаций, предназначенное для автоматизации стратегий взаимодействия с заказчиками) и другие);

    ранее проведенные исследования;

    письменные отчеты сотрудников.

Примеры источников внешних вторичных данных:

    отчеты органов статистики и других государственных учреждений;

    отчеты маркетинговых агентств, профессиональных ассоциаций и т.п.;

    электронные базы данных (адресные справочники, ГИС и т.п.);

    библиотеки;

    средства массовой информации.

Основными выходными данными на этапе сбора данных являются:

    планируемый объем выборки;

    структура выборки (наличие и размер квот);

    вид статистического наблюдения (сбор данных опрос, анкетирование, измерение, эксперимент, экспертиза, др.);

    информация о параметрах опроса (например, возможность факта фальсификации анкет);

    схема кодировки переменных в базе данных программы, выбранной для обработки;

    план-схема преобразования данных;

    план-схема используемых статистических процедур.

Этот же этап включает непосредственно процедуру анкетирования. Разумеется, анкеты разрабатываются только для получения первичной информации.

Полученные данные должны быть соответствующим образом отредактированы и подготовлены. Каждая анкета или форма наблюдения проверяется и, если нужно, корректируется. Каждому ответу присваиваются числовые или буквенные коды – производится кодировка информации. Подготовка данных включает в себя редактирование, расшифровку и проверку данных, их кодирование и необходимые преобразования.

2.3 Определение характеристик выборки

Как правило, данные, собранные в результате статистического наблюдения для проведения статистического анализа являются выборочной совокупностью. Последовательность преобразования данных в процесс статистического исследования можно схематично представить следующим образом (рис. 2.3)

Рис 2.3 Схема преобразования статистических данных

Анализируя выборку, можно делать выводы о генеральной совокупности, представленной выборкой.

Окончательное определение общих параметров выборки производят, когда все анкеты собраны. Оно включает:

    определение реального количества респондентов,

    определение структуры выборки,

    распределение по месту опроса,

    установление доверительного уровня статистической надежности выборки,

    расчет статистической ошибки и определение репрезентативности выборки.

Реальное количество респондентов может оказаться большим либо меньшим запланированного. Первый вариант лучше для анализа, но невыгоден заказчику исследования. Второй может отрицательно сказаться на качестве исследования, а, следовательно, невыгоден ни аналитикам, ни заказчикам.

Структура выборки может быть случайной или неслучайной (респонденты отбирались на основе заранее известного критерия, например методом квотирования). Случайные выборки априори являются репрезентативными. Неслучайные выборки могут быть намерено нерепрезентативными относительно генеральной совокупности, но давать важную информацию для исследований. В этом случае также следует внимательно отнестись к фильтрационным вопросам анкеты, которые предназначены специально для отсеивания неподходящих под требования респондентов.

Для определения точности оценивания , прежде всего, необходимо установить уровень доверительной вероятности (95% или 99%). Тогда максимальная статистическая ошибка выборки рассчитывается как

или
,

где - объем выборки,- вероятность наступления исследуемого события (попадание респондента в выборку),- вероятность обратного события (непопадания респондента в выборку),- коэффициент доверительной вероятности,
- дисперсия признака.

В таблице 2.4 приведены наиболее употребляемые значения доверительной вероятности и коэффициентов доверительной вероятности.

Таблица 2.4

2.5 Обработка данных на компьютере

Анализ данных с применением компьютера включает выполнение ряда необходимых шагов.

1. Определение структуры исходных данных.

2. Ввод данных в компьютер в соответствии с их структурой и требованиями программы. Редактирование и преобразование данных.

3. Задание метода обработки данных в соответствии с задачами исследования.

4. Получение результата обработки данных. Его редактирование и сохранение в нужном формате.

5. Интерпретация результата обработки.

Шаги 1 (подготовительный) и 5 (заключительный) не способна выполнить ни одна компьютерная программа - их исследователь делает сам. Шаги 2-4 выполняются исследователем с использованием программы, но именно исследователь определяет необходимые процедуры редактирования и преобразования данных, методы обработки данных, а также формат представления результатов обработки. Помощь компьютера (шаги 2–4) заключается, в конечном итоге, в переходе от длинной последовательности чисел к более компактной. На «вход» компьютера исследователь подает массив исходных данных, который недоступен осмыслению, но пригоден для компьютерной обработки (шаг 2). Затем исследователь дает программе команду на обработку данных в соответствии с поставленной задачей и структурой данных (шаг 3). На «выходе» он получает результат обработки (шаг 4) - тоже массив данных, только уже меньший, доступный осмыслению и содержательной интерпретации. При этом исчерпывающий анализ данных обычно требует многократной их обработки с применением разных методов.

2.6 Выбор стратегии анализа данных

Выбор стратегии анализа собранных данных основывается на знании теоретических и практических аспектов исследуемой предметной области, специфики и известных характеристик информации, свойств конкретных статистических методов, а также на опыте и взглядах исследователя.

Необходимо помнить, что анализ данных - это вовсе не конечная цель исследования. Его цель - получить информацию, которая поможет решить определенную проблему и принять адекватные управленческие решения. Выбор стратегии анализа должен начинаться с исследования итогов предыдущих этапов процесса: определение проблемы и разработка плана исследования. В качестве "черновика" используется предварительный план анализа данных, разработанный как один из элементов плана исследования. Затем, в ходе поступления на последующих стадиях процесса исследования дополнительной информации, может понадобиться внесение определенных изменений.

Статистические методы делятся на одно- и многомерные. Одномерные методы(univariatetechniques) используются тогда, когда все элементы выборки оцениваются одним показателем, либо если этих показателей несколько для каждого элемента, но каждая переменная анализируется при этом отдельно ото всех остальных.

Многомерные методы (multivariate techniques) прекрасно подходят для анализа данных, если для оценки каждого элемента выборки используется два или больше показателей и эти переменные анализируются одновременно. Такие методы применяются для определения зависимостей между явлениями.

Многомерные методы отличаются от одномерных прежде всего тем, что при их использовании центр внимания смещается с уровней (средних показателей) и распределений (дисперсий) явлений и сосредотачивается на степени взаимосвязи (корреляции или ковариации) между этими явлениями.

Одномерные методы можно классифицировать на основе того, какие данные анализируются: метрические или неметрические (рис. 3). Метрические данные (metric data) измеряются по интервальной шкале или относительной шкале. Неметрические данные (nonmetric data) оцениваются по номинальной или порядковой шкале

Кроме того, эти методы делят на классы на основе того, сколько выборок - одна, две или более - анализируется в ходе исследований.

Классификация одномерных статистических методов представлена на рис.2.4.

Рис. 2.4 Классификация одномерных статистических методов в зависимости от анализируемых данных

Число выборок определяется тем, как ведется работа с данными для конкретного анализа, а не тем, каким способом собирались данные. Например, данные по лицам мужского и женского пола можно получить в пределах одной выборки, но если их анализ нацелен на выявление разницы в восприятии, основанной на разнице полов, исследователю придется оперировать двумя разными выборками. Выборки считаются независимыми, если они экспериментально не связаны между собой. Измерения, проведенные в одной выборке, не оказывают влияния на значения переменных в другой. Для анализа данные, относящиеся к разным группам респондентов, например собранные от лиц женского и мужского пола, обычно обрабатываются как независимые выборки.

С другой стороны, если данные по двум выборкам относятся к одной и той же группе респондентов, выборки считаются объединенными в пары - зависимыми.

Если существует только одна выборка метрических данных, может использоваться z- и t-критерий. Если же независимых выборок две или больше, в первом случае можно воспользоваться z- и t-критерием для двух выборок, в во втором - методом однофакторного дисперсионного анализа. Для двух связанных выборок используется парный t-критерий. Если речь идет о неметрических данных по одной выборке, исследователь может воспользоваться критериями частотного распределения, хи-квадратом, критерием Колмогорова-Смирнова (K~S), критерием серий и биномиальным критерием. Для двух независимых выборок с неметрическими данными можно прибегнуть к следующим методам анализа: хи-квадрат, Манна-Уитни, медианы, К-С, однофакторным дисперсионным анализом Крускала-Уоллиса (ДА К-У). В отличие от этого, если существует две или больше взаимосвязанных выборок, следует воспользоваться критериями знаков, Мак-Немара и Уилкоксона.

Многомерные статистические методы нацелены на выявление существующих закономерностей: взаимозависимости переменных, взаимосвязи или последовательности событий, межобъектного сходства.

Достаточно условно можно выделить пять стандартных типов закономерностей, исследование которых представляет существенный интерес: ассоциация, последовательность, классификация, кластеризация и прогнозирование

Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 65% купивших кукурузные чипсы берут также и "кока-колу", а при наличии скидки за такой комплект "колу" приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.

Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки дома в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.

С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил.

Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации выделяют различные однородные группы данных.

Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в виде временных рядов. Если удается построить найти закономерности, адекватно отражающие динамику поведения целевых показателей, есть вероятность, что с их помощью можно предсказать и поведение системы в будущем.

Многомерные статистические методы можно разделить на методы анализа взаимосвязи и классификационный анализ (рис. 2.5).

Рис.2.5 – Классификация многомерных статистических методов

Понятие об исследовании количественных сторон объектов и явлений сформировалось давно, с момента развития у человека элементарных навыков работы с информацией. Однако, термин «статистика», дошедший до нашего времени заимствован гораздо позднее из латинского языка и происходит от слова «status», что означает «определенное состояние вещей». «Status» употреблялось также в значении «политическое состояние» и закрепилось почти во всех европейских языках именно в этом смысловом значении: английское «state», немецкое «Staat», итальянское «stato» и производное от него «statistа» - знаток государства.

Широкое применение слово «статистика» получило в XVIII веке и применялось в значение «государствоведение». Статистикой называют отрасль практической деятельности, направленной на собирание, обработку, анализ и предоставление в публичное пользование данных о явлениях и процессах общественной жизни.

Анализ - это метод научного исследования объекта путем рассмотрения его отдельных сторон и составных частей.

Экономико-статистический анализ - это разработка методики, основанной на широком применении традиционных статистических и математико-статистических методов, с целью контроля адекватного отражения исследуемых явлений и процессов.

Этапы статистического исследования. Статистическое исследование проходит в три этапа:

  • 1) статистическое наблюдение;
  • 2) сводка полученных данных;
  • 3) статистический анализ.

На первом этапе с помощью метода массовых наблюдений собирают первичные статистические данные.

На втором этапе статистического исследования собранные данные подвергаются первичной обработки, сводке и группировке. Метод группировок позволяет выделить однородные совокупности, разделить их на группы и подгруппы. Сводка - это получение итогов по совокупности в целом и отдельным ее группам и подгруппам.

Результаты группировки и сводки излагаются в виде статистических таблиц. Основное содержание этого этапа заключается в переходе от характеристик каждой единицы наблюдения к сводным характеристикам совокупности в целом или ее групп.

На третьем этапе полученные сводные данные анализируются методом обобщающих показателей (абсолютные, относительные и средние величины, показатели вариации, индексные системы, методы математической статистики, табличный метод, графический метод и др.).

Основы статистического анализа:

  • 1) утверждение фактов и установление их оценки;
  • 2) выявление характерных особенностей и причин явления;
  • 3) сравнение явления с нормативными, плановыми и другими явлениями, которые приняты за базу сравнения;
  • 4) формулирование выводов, прогнозов, предположений и гипотез;
  • 5) статистическая проверка выдвинутых предположений (гипотез).

Анализ и обобщение статистических данных - заключительный этап статистического исследования, конечной целью которого является получение теоретических выводов и практических заключений о тенденциях и закономерностях изучаемых социально-экономических явлений и процессов. Задачами статистического анализа являются: определение и оценка специфики и особенностей изучаемых явлений и процессов, изучение их структуры, взаимосвязей и закономерностей их развития.

Статистический анализ данных проводится в неразрывной связи теоретического, качественного анализа сущности исследуемых явлений и соответствующего количественного инструментария, изучения их структуры, связей и динамики.

Статистический анализ - исследование характерных особенностей структуры, связи явлений, тенденций, закономерностей развития социально-экономических явлений, для чего используются специфические экономико-статистические и математико-статистические методы. Статистический анализ завершается интерпретаций полученных результатов.

В статистическом анализе признаки подразделяются по характеру влияния друг на друга:

  • 1. Признак-результат - признак, анализируемый в данном исследовании. Индивидуальные размеры такого признака у отдельных элементов совокупности подвержены влиянию одного или нескольких других признаков. Другим словами, признак-результат рассматривается как следствие взаимодействия других факторов;
  • 2. Признак-фактор - признак, оказывающий влияние на исследуемый признак (признак-результат). Причем зависимость между признаком-фактором и признаком-результатом может быть количественно определенна. Синонимами данного термина в статистике являются, «факторный признак», «фактор». Следует различать понятия признака-фактора и признака-веса. Признаком-весом называют такой признак, который необходимо учесть при расчетах. Но, признак-вес не оказывает влияния на исследуемый признак. Признак-фактор может рассматриваться как признак-вес, т. е., учитываться при расчетах, но не всякий признак-вес является признаком-фактором. Например, при исследовании в группе студентов зависимости между временем подготовки к экзамену и количеством баллов, полученных на экзамене должен учитываться и третий признак: «Количество человек, аттестованных на определенный балл». Последний признак не является влияющим на результат, однако, будет включен в аналитические расчеты. Именно такой признак и называется признаком-весом, а не признаком-фактором.

Прежде чем приступить к анализу, необходимо проверить, соблюдены ли условия, обеспечивающие его достоверность и правильность:

  • - Достоверность первичных цифровых данных;
  • - Полнота охвата изучаемой совокупности;
  • - Сопоставимость показателей (по единицам учета, территории, методике подсчета).

Основными понятиями статистического анализа являются:

  • 1. Гипотеза;
  • 2. Решающая функция и решающее правило;
  • 3. Выборка из генеральной совокупности;
  • 4. Оценка характеристик генеральной совокупности;
  • 5. Доверительный интервал;
  • 6. Тренд;
  • 7. Статистическая взаимосвязь.

Анализ является завершающей стадией статистического исследования, сутью которой является выявление взаимосвязей и закономерностей изучаемого явления, формулировка выводов и предложений.

В основе любого статистического исследования лежат три взаимосвязанных этапа работы:

1) статистическое наблюдение;

2) сводка и группировка данных наблюдения;

3) научная обработка и анализ результатов сводки. Каждая последующая стадия статистического исследования может быть проведена при условии, что были осуществлены предшествующие (предшествующая) ей стадии работы.

Статистическое наблюдение – это первая стадия статистического исследования.

Статистическое наблюдение – это планомерное, научно организованное собирание сведений о той или иной совокупности общественных и, в частности, экономических явлений или процессов.

Статистические наблюдения весьма многообразны и различаются характером исследуемых явлений, формой организации, временем наблюдения, полнотой охвата изучаемых явлений. В связи с этим была проведена классификация статистических наблюдений по отдельным признакам .

1. По форме организации статистические наблюдения делятся на отчетность и специально организованные статистические наблюдения.

Отчетность – это основная организационная форма статистического наблюдения, которая сводится к собиранию сведений от предприятий, учреждений и организаций о различных сторонах их деятельности на специальных бланках, называемых отчетами. Отчетность носит обязательный характер. Отчетность делится на основную и текущую в зависимости от продолжительности периода, относительно которого она составляется.

Основная отчетность также называется годовой и содержит наиболее широкий круг показателей, охватывающих все стороны деятельности предприятия.

Текущая отчетность представляется в течение года за различные по продолжительности промежутки времени.

Однако существуют данные, которые принципиально невозможно получить на основе отчетности и данные, которые нецелесообразно включать в нее. Именно для получения этих двух видов данных используются специально организованные статистические наблюдения – различного рода обследования и переписи.

Статистические обследования – это такие специально организованные наблюдения, при которых исследуемая совокупность явлений подвергается наблюдению в течение определенного периода времени.

Перепись – это такая форма специально организованного статистического наблюдения, при котором исследуемая совокупность явлений наблюдается на какую‑либо дату (на некоторый момент).

2. По признаку времени все статистические наблю дения делятся на непрерывные и прерывные.

Непрерывное (текущее) статистическое наблюдение – это наблюдение, которое осуществляется во времени непрерывно. При данном виде наблюдения отдельные явления, факты, события регистрируются по мере их возникновения.


Прерывное статистическое наблюдение – это наблюдение, при котором наблюдаемые явления, факты, события регистрируются не непрерывно, а через периоды времени равной или неравной продолжительности. Различают две разновидности прерывного наблюдения – периодическое и единовременное. Периодическим называется прерывное наблюдение, которое проводится через периоды времени равной продолжительности. Единовременным называется наблюдение, которое проводится через периоды времени неравной продолжительности или имеющие разовый характер.

3. По признаку полноты охвата изучаемой массы явлений, фактов, событий статистические наблюдения делятся на сплошные и несплошные, или частичные.

Сплошное наблюдение имеет целью учет всех без исключения явлений, фактов, событий, образующих исследуемую совокупность.

Несплошное наблюдение имеет целью учет лишь некоторой части явлений, фактов, событий, образующих исследуемую совокупность.