Графические методы представления статистических данных. Основные понятия статистики

:

Текстовая форма

Табличная форма

Статистическая таблица

Статистические графики – это условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков или географических карт-схем. Графическая форма облегчает рассмотрение статистических данных, делает их наглядными, выразительными, обозримыми. Однако графики имеют определенные ограничения: прежде всего, график не может включить столько данных, сколько может войти в таблицу; кроме того, на графике показываются всегда округленные данные – не точные, а приблизительные. Таким образом, график используется только для изображения общей ситуации, а не деталей. Последний недостаток – трудоемкость построения графиков. Он может быть преодолен использованием персонального компьютера (например, «Мастером диаграмм» из пакета Microsoft Office Excel).

Определение эмпирической функции распределения.

Выборочная (эмпири́ческая) фу́нкция распределе́ния в математической статистике - это приближение теоретической функции распределения, построенное с помощью выборки из него.

Определение

Пусть - выборка из распределения случайной величины , задаваемого функцией распределения . Будем считать, что , где , - независимые случайные величины, определённые на некотором пространстве элементарных исходов . Пусть . Определим случайную величину следующим образом:

где - индикатор события , - функция Хевисайда. Таким образом, выборочная функция распределения в точке равна относительной частоте элементов выборки, не превосходящих значение . Случайная величина называется выборочной функцией распределения случайной величины и является аппроксимацией для функции . Существует результат, показывающий, что при функция равномерно сходится к , и указывающий скорость сходимости.

Гистограмма

Гистограмма используется для графического представления распределений непрерывно варьирующих признаков и состоит из примыкающих друг к другу прямоугольников, как показано на рис. 2.1. Основание каждого прямоугольника равно ширине интервала группировки, а высота его такова, что площадь прямоугольника пропорциональна частоте (или частости) попадания в данный интервал. Если ряд безинтервальный, то ширина всех столбцов выбирается произвольной, но одинаковые. Таким образом, высоты прямоугольников должны быть пропорциональны величинам

где n i - частота i -го интервала группировки; h i - ширина i -го интервала группировки.

На графике гистограммы основание прямоугольников откладывается по оси абсцисс (x ), а высота - по оси ординат (у ) прямоугольной системы координат.

Однако в тех случаях, когда ширина всех интервалов группировки одинакова, вид гистограммы не изменится, если по оси ординат откладывать не величины р i , а частоты интервалов n i .

Рис. 2.1. Гистограмма распределения результатов в предыдущем примере (когда ширина некоторых интервалов группировки неодинакова).

В этом случае чтобы не нарушить принцип построения гистограммы (площади прямоугольников пропорциональны частотам интервалов), по оси ординат уже нельзя откладывать частоты, а надо – высоты прямоугольников (которые должны быть пропорциональны отношениям ).

Полигон частот

Другим распространенным способом графического представления является полигон частот.

Полигон частот образуется ломаной линией, соединяющей точки, соответствующие срединным значениям интервалов группировки и частотам этих интервалов, срединные значения откладываются по оси х , а частоты – по оси у .

Из сравнения двух рассмотренных способов графического представления эмпирических распределений следует, что для получения полигона частот из построенной гистограммы нужно середины вершин прямоугольников, образующих гистограмму, соединить отрезками прямых. Пример полигона частот представлен на рис. 2.2.

Рис. 2.2. Полигон частот

Полигон частот используется для представления распределений как непрерывных, так и дискретных признаков. В случае непрерывного распределения полигон частот является более предпочтительным способом графического представления, чем гистограмма, если график эмпирического распределения описывается плавной зависимостью.

21.Гипо́теза (др.-греч. ὑπόθεσις - предположение; от ὑπό - снизу, под + θέσις - тезис) - предположение или догадка; утверждение, предполагающее доказательство, в отличие отаксиом

Постулатов, не требующих доказательств. Гипотеза считается научной, если она удовлетворяет критерию Поппера, т.е. потенциально может быть проверена критическим экспериментом, а так же если она соответствует другим критериям, отличающим науку от не науки.

Статистическая гипотеза – это предположение о свойствах случайных величин или событий, которое мы хотим проверить по имеющимся данным. Примеры статистических гипотез в педагогических исследованиях :

Гипотеза 1. Успеваемость класса стохастически (вероятностно) зависит от уровня обучаемости учащихся.

Гипотеза 2. Усвоение начального курса математики не имеет существенных различий у учащихся, начавших обучение с 6 или 7 лет.

Гипотеза 3. Проблемное обучение в первом классе эффективнее по сравнению с традиционной методикой обучения в отношении общего развития учащихся.

Пример 1. Процесс производства некоторого медицинского препарата весьма сложен. Несущественные на первый взгляд отклонения от технологии вызывают появление высокотоксичной побочной примеси. Токсичность этой примеси может оказаться столь высокой, что даже такое ее количество, которое не может быть обнаружено при обычном химическом анализе, может оказаться опасным для человека, принимающего это лекарство. В результате, прежде чем выпускать в продажу вновь произведенную партию, ее подвергают исследованию на токсичность биологическими методами. Малые дозы лекарства вводятся некоторому количеству подопытных животных, например, мышей, и результат регистрируют. Если лекарство токсично, то все или почти все животные гибнут. В противном случае норма выживших велика.

Исследование лекарства может привести к одному из возможных способов действия: выпустить партию в продажу (а 1), вернуть партию поставщику для доработки или, может быть, для уничтожения (а 2).

Ошибки двух видов, связанные с действиями а 1 и а 2 совершенно различны, различна и важность избежания их. Сначала рассмотрим случай, когда применяется действие а 1 , в то время когда предпочтительнее а 2 . Лекарство опасно для пациента, в то время как оно признано безопасным. Ошибка этого вида может вызвать смерть пациентов, употребляющих этот препарат. Это ошибка первого рода, так как нам важнее ее избежать.

Рассмотрим случай когда предпринимается действие а 2 , в то время когда а 1 является более предпочтительным. Это означает, что вследствие неточностей в проведении эксперимента партия нетоксичного лекарства классифицировалась как опасная. Последствия ошибки могут выражаться в финансовом убытке и в увеличении стоимости лекарства. Однако случайное отвержение совершенно безопасного лекарства, очевидно, менее нежелательно, чем, пусть даже изредка происходящие гибели пациентов. Отвержение нетоксичной партии лекарства – ошибка второго рода.

Допустимая вероятность ошибки первого рода (Ркр) может быть равна 5% или 1% (0.05 или 0.01).

22. Проверка статистической гипотезы (testing statistical hypotheses) - это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.

Статистический тест или статистический критерий - строгое математическое правило, по которому принимается или отвергается статистическая гипотеза .

· 23.классификация гипотез

· простая – указано одно обстоятельство, при наличии или отсутствии которого действует юридическая норма;

· сложная – наличие в гипотезе одновременно двух или более обстоятельств, в совокупности обусловливающих действие нормы;

· альтернативная – указано несколько вариантов обстоятельств (альтернативных), при которых возможно действие нормы. В этом случае при наступлении одного из них норма является действующей;

Параметрической гипотезой называется гипотеза о значениях параметров распределения или о сравнительной величине параметров двух распределений. Примером параметрической статистической гипотезы является гипотеза оравенстве математических ожиданий двух нормальных совокупностей.

Непараметрическими гипотезами называются гипотезы о виде распределенияслучайной величины.

Нулевой, основной или проверяемой гипотезой называется первоначально выдвинутая гипотеза, которая обозначается Н0 .

Статистическая гипотеза представляет собой некоторое предположение о законе распределения случайной величины или о параметрах этого закона, формулируемое на основе выборки . Примерами статистических гипотез являются предположения: генеральная совокупность распределена по экспоненциальному закону; математические ожидания двух экспоненциально распределенных выборок равны друг другу. В первой из них высказано предположение о виде закона распределения, а во второй – о параметрах двух распределений. Гипотезы, в основе которых нет никаких допущений о конкретном виде закона распределения, называют непараметрическими , в противном случае – параметрическими .

Гипотезу, утверждающую, что различие между сравниваемыми характеристиками отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями в выборках, на основании которых производится сравнение, называют нулевой (основной) гипотезой и обозначают Н 0 . Наряду с основной гипотезой рассматривают и альтернативную (конкурирующую, противоречащую) ей гипотезу Н 1 . И если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная гипотеза.

Различают простые и сложные гипотезы. Гипотезуназывают простой , если она однозначно характеризует параметр распределения случайной величины. Например, если  является параметром экспоненциального распределения, то гипотеза Н 0 о равенстве  = 10–простая гипотеза. Сложной называют гипотезу, которая состоит из конечного или бесконечного множества простых гипотез. Сложная гипотеза Н 0 о неравенстве  > 10 состоит из бесконечного множества простых гипотез Н 0 о равенстве  =b i , где b i – любое число, большее 10. Гипотеза Н 0 о том, что математическое ожидание нормального распределения равно двум при неизвестной дисперсии, тоже является сложной. Сложной гипотезой будет предположение о распределении случайной величины Х по нормальному закону, если не фиксируются конкретные значения математического ожидания и дисперсии.

Проверка гипотезы основывается на вычислении некоторой случайной величины – критерия, точное или приближенное распределение которого известно. Обозначим эту величину через z , ее значение является функцией от элементов выборки z =z (x 1 , x 2 , …, x n ). Процедура проверки гипотезы предписывает каждому значению критерия одно из двух решений – принять или отвергнуть гипотезу. Тем самым все выборочное пространство и соответственно множество значений критерия делятся на два непересекающихся подмножества S 0 и S 1 . Если значение критерия z попадает в область S 0 , то гипотеза принимается, а если в область S 1 , – гипотеза отклоняется. Множество S 0 называется областью принятия гипотезы или областью допустимых значений , а множество S 1 – областью отклонения гипотезы или критической областью . Выбор одной области однозначно определяет и другую область.

Принятие или отклонение гипотезы Н 0 по случайной выборке соответствует истине с некоторой вероятностью и, соответственно, возможны два рода ошибок. Ошибка первого рода возникает с вероятностью  тогда, когда отвергается верная гипотеза Н 0 и принимается конкурирующая гипотеза Н 1 . Ошибка второго рода возникает с вероятностью  в том случае, когда принимается неверная гипотеза Н 0 , в то время как справедлива конкурирующая гипотеза Н 1 . Доверительная вероятность – это вероятность не совершить ошибку первого рода и принять верную гипотезу Н 0 . Вероятность отвергнуть ложную гипотезу Н 0 называется мощностью критерия . Следовательно, при проверке гипотезы возможны четыре варианта исходов, табл. 3.1.

Таблица 3.1.

Например, рассмотрим случай, когда некоторая несмещенная оценка параметра  вычислена по выборке объема n , и эта оценка имеет плотность распределения f (), рис. 3.1.

Рис. 3.1. Области и отклонения гипотезы

Предположим, что истинное значение оцениваемого параметра равно Т . Если рассматривать гипотезу Н 0 о равенстве  =Т , то насколько велико должно быть различие между  и Т , чтобы эту гипотезу отвергнуть. Ответить на данный вопрос можно в статистическом смысле, рассматривая вероятность достижения некоторой заданной разности между  и Т на основе выборочного распределения параметра  .

Целесообразно полагать одинаковыми значения вероятности выхода параметра  за нижний и верхний пределы интервала. Такое допущение во многих случаях позволяет минимизировать доверительный интервал, т.е. повысить мощность критерия проверки. Суммарная вероятность того, что параметр  выйдет за пределы интервала с границами  1– /2 и   /2 , составляет величину  . Эту величину следует выбрать настолько малой, чтобы выход за пределы интервала был маловероятен. Если оценка параметра попала в заданный интервал, то в таком случае нет оснований подвергать сомнению проверяемую гипотезу, следовательно, гипотезу равенства  =Т можно принять. Но если после получения выборки окажется, что оценка выходит за установленные пределы, то в этом случае есть серьезные основания отвергнуть гипотезу Н 0 . Отсюда следует, что вероятность допустить ошибку первого рода равна  (равна уровню значимости критерия).

Если предположить, например, что истинное значение параметра в действительности равно Т +d , то согласно гипотезе Н 0 о равенстве  =Т – вероятность того, что оценка параметра  попадет в область принятия гипотезы, составит  , рис. 3.2.

При заданном объеме выборки вероятность совершения ошибки первого рода можно уменьшить, снижая уровень значимости  . Однако при этом увеличивается вероятность ошибки второго рода  (снижается мощность критерия). Аналогичные рассуждения можно провести для случая, когда истинное значение параметра равно Т d .

Единственный способ уменьшить обе вероятности состоит в увеличении объема выборки (плотность распределения оценки параметра при этом становится более "узкой"). При выборе критической области руководствуются правилом Неймана – Пирсона: следует так выбирать критическую область, чтобы вероятность  была мала, если гипотеза верна, и велика в противном случае. Однако выбор конкретного значения  относительно произволен. Употребительные значения лежат в пределах от 0,001 до 0,2. В целях упрощения ручных расчетов составлены таблицы интервалов с границами  1– /2 и   /2 для типовых значений  и различных способов построения критерия.

При выборе уровня значимости необходимо учитывать мощность критерия при альтернативной гипотезе. Иногда большая мощность критерия оказывается существеннее малого уровня значимости, и его значение выбирают относительно большим, например 0,2. Такой выбор оправдан, если последствия ошибок второго рода более существенны, чем ошибок первого рода. Например, если отвергнуто правильное решение "продолжить работу пользователей с текущими паролями", то ошибка первого рода приведет к некоторой задержке в нормальном функционировании системы, связанной со сменой паролей. Если же принято решения не менять пароли, несмотря на опасность несанкционированного доступа посторонних лиц к информации, то эта ошибка повлечет более серьезные последствия.

В зависимости от сущности проверяемой гипотезы и используемых мер расхождения оценки характеристики от ее теоретического значения применяют различные критерии. К числу наиболее часто применяемых критериев для проверки гипотез о законах распределения относят критерии хи-квадрат Пирсона, Колмогорова, Мизеса, Вилкоксона, о значениях параметров – критерии Фишера, Стьюдента.

25. КРИТИЧЕСКАЯ ОБЛАСТЬ - часть выборочного пространства такая, что попадание в нее наблюденного значения случайной величины, с распределением к-рой связана проверяемая гипотеза, влечет отказ от этой гипотезы

Критическими точками (границами) k кр называют точки, отделяющие критическую область от области принятия гипотезы.
Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.

Случайная погрешность измерения образуется под влиянием большого числа факторов , сопутствующих процессу измерения. В каждой конкретной ситуации работает свой механизм образования погрешности. Поэтому естественно предположить, что каждой ситуации должен соответствовать свой тип распределения погрешности. Однако во многих случаях имеются возможности еще до проведения измерений сделать некоторые предположения о форме функции распределения, так что после проведения измерений остается только определить значения некоторых параметров, входящих в выражение для предполагаемой функции распределения.

Случайная погрешность характеризует неопределенность наших знаний об истинном значении измеряемой величины, полученных в результате проведенных наблюдений. Согласно К. Шеннону мерой неопределенности ситуации, описываемой случайной величиной X, является энтропия


являющаяся функционалом дифференциальной функции распределения . Можно предположить, что любой процесс измерения формируется таким образом, что неопределенность результата наблюдений оказывается наибольшей в некоторых пределах, определяемых допускаемыми значениями погрешности. Поэтому наиболее вероятными должны быть такие распределения , при которых энтропия обращается в максимум.

Для выявления вида наиболее вероятных распределений рассмотрим несколько наиболее типичных случаев .

1. В классе распределений результатов наблюдений , обладающих определенной зоной рассеивания между значениями х = b и х = а шириной b-а =, найдем такое, которое обращает в максимум энтропию при наличии ограничивающих условий:
, , ,
где - математическое ожидание результатов наблюдений. Решение поставленной задачи находится методом множителей Лагранжа.

Искомая плотность распределения результатов наблюдений описывается выражением

Определим числовые характеристики равномерного распределения. Математическое ожидание случайной погрешности находим по формуле (10):

Дисперсию случайной равномерно распределенной погрешности можно найти по формуле (18):

В силу симметрии распределения относительно математического ожидания коэффициент асимметрии должен равняться нулю:

Для определения эксцесса найдем вначале четвертый момент случайной погрешности:

Поэтому

В заключение найдем веро-ятность попадания случайной погрешности в заданный интервал , равный заштрихованной площади на рис.7

2. В классе распределений результатов наблюдений , обладающих определенной дисперсией , найдем такое, которое обращает в максимум энтропию при наличии ограничений:

, , , .

Решение этой задачи также находится методом множителей Лагранжа. Искомая плотность распределения результатов наблюдений описывается выражением

Распределение, описываемое уравнениями (25) и (26), называется нормальным или распределением Гаусса .

На рис.8 изображены кривые нормального распределения случайных погрешностей для различных значений среднеквадратического отклонения .

Из рисунка видно, что по мере увеличения среднеквадратического отклонения распределение все более и более расплывается, вероятность появления больших значений погрешностей возрастает, а вероятность меньших погрешностей сокращается, т.е. увеличивается рассеивание результатов наблюдений.

Вычислим вероятность попадания результата наблюдения в некоторый заданный интервал :

Заменим переменные:

После чего получим следующее выражение для искомой вероятности:

Интегралы, стоящие в квадратных скобках, не выражаются в элементарных функциях, поэтому их вычисляют с помощью так называемого нормированного нормального распределения с дифференциальной функцией

С помощью функции Ф(z ) вероятность находят как

(29)

При использовании данной формулы следует иметь в виду тождество

Вытекающее непосредственно из определения функции Ф(z ).

Широкое распространение нормального распределения погрешностей в практике измерений объясняется центральной предельной теоремой теории вероятностей, являющейся одной из самых замечательных математических теорем, в разработке которой принимали участие многие крупнейшие математики - Муавр, Лаплас, Гаусс, Чебышев и Ляпунов. Центральная предельная теорема утверждает, что распределение случайных погрешностей будет близко в нормальному всякий раз, когда результаты наблюдения формируются под влиянием большого числа независимо действующих факторов, каждый из которых оказывает лишь незначительное действие по сравнению с суммарным действием всех остальных.

3. Предположим, что результаты наблюдений распределены нормально, но их среднеквадратическое отклонение является величиной случайной, изменяющейся от опыта к опыту. Такое предположение более осторожное, чем предположение о неизменности в течение всего времени измерений. В этом случае, рассуждая таким же образом, как и прежде, легко найти, что энтропия обращается в максимум, если результаты наблюдений имеют распределение Лапласа с плотностью

(30)

где - математическое ожидание, - среднеквадратическое отклонение результатов наблюдения. Распределением Лапласа следует пользоваться в тех случаях, когда точностные характеристики заранее неизвестны или нестабильны во времени.

Дифференциальная функция распределения случайных погрешностей получается подстановкой и в выражение (30):

Асимметрия распределения равна нулю, поскольку распределение симметрично относительно нуля, а эксцесс в соответствии с формулой (22) составляет

Таким образом, по сравнению с нормальным распределением (Ех = 0) равномерное распределение является более плосковершинным (Ех = -1.2), а распределение Лапласа - более островершинным (Ех = 3).

Формы представления статистических данных.

Статистические данные должны быть представлены так, чтобы ими можно было пользоваться. Существует 3 основных формы представления статистических данных :

Текстовая – включение данных в текст;

Табличная – представление данных в таблицах;

Графическая – выражение данных в виде графиков.

Текстовая форма применяется при малом количестве цифровых данных.

Табличная форма применяется чаще всего, так как является более эффективной формой представления статистических данных. В отличие от математических таблиц, которые по начальным условиям позволяют получить тот или иной результат, статистические таблицы рассказывают языком цифр об изучаемых объектах.

Статистическая таблица – это система строк и столбцов, в которых в определенной последовательности и связи излагается статистическая информация о социально-экономических явлениях.

Различают подлежащее и сказуемое статистической таблицы. В подлежащем указывается характеризуемый объект – либо единицы совокупности, либо группы единиц, либо совокупность в целом. В сказуемом дается характеристика подлежащего, обычно в числовой форме. Обязателен заголовок таблицы, в котором указывается к какой категории и к какому времени относятся данные таблицы.

По характеру подлежащего статистические таблицы подразделяются на простые, групповые и комбинационные. В подлежащем простой таблицы объект изучения не подразделяется на группы, а дается либо перечень всех единиц совокупности, либо указывается совокупность в целом. В подлежащем групповой таблицы объект изучения подразделяется на группы по одному признаку, а в сказуемом указываются число единиц в группах (абсолютное или в процентах) и сводные показатели по группам. В подлежащем комбинационной таблицы совокупность подразделяется на группы не по одному, а по нескольким признакам.

При построении таблиц необходимо руководствоваться следующими общими правилами.

Подлежащее таблицы располагается в левой (реже – верхней) части, а сказуемое – в правой (реже – нижней).

Заголовки столбцов содержат названия показателей и их единицы измерения.

Итоговая строка завершает таблицу и располагается в ее конце, но иногда бывает первой: в этом случае во второй строке делается запись «в том числе», и последующие строки содержат составляющие итоговой строки.

Цифровые данные записываются с одной и той же степенью точности в пределах каждого столбца, при этом разряды чисел располагаются под разрядами, а целая часть отделяется от дробной запятой.

В таблице не должно быть пустых клеток: если данные равны нулю, то ставится знак «–» (прочерк); если данные не известны, то делается запись «сведений нет» или ставится знак «…» (троеточие). Если значение показателя не равно нулю, но первая значащая цифра появляется после принятой степени точности, то делается запись 0,0 (если, скажем, была принята степень точности 0,1).

Иногда статистические таблицы дополняются графиками, когда ставится цель подчеркнуть какую-то особенность данных, провести их сравнение. Графическая форма является самой эффективной формой представления данных с точки зрения их восприятия. С помощью графиков достигается наглядность характеристики структуры, динамики, взаимосвязи явлений, их сравнения.

Статистические данные должны быть представлены так, чтобы ими можно было пользоваться. Существует 3 основных формы представления статистических данных :

  1. Текстовая – включение данных в текст;
  2. Табличная – представление данных в таблицах;
  3. Графическая – выражение данных в виде графиков.

Текстовая форма применяется при малом количестве цифровых данных.

Табличная форма применяется чаще всего, так как является более эффективной формой представления статистических данных. В отличие от математических таблиц, которые по начальным условиям позволяют получить тот или иной результат, статистические таблицы рассказывают языком цифр об изучаемых объектах.

Статистическая таблица – это система строк и столбцов, в которых в определенной последовательности и связи излагается статистическая информация о социально-экономических явлениях.

Например, в следующей таблице представлена информация о внешней торговле России, выражать которую в текстовой форме было бы неэффективным.

1995 2000 2001 2002 2003 2004 2005 2006 2007
Миллиардов долларов США
Внешнеторговый оборот 145,0 149,9 155,6 168,3 212,0 280,6 369,2 468,6 578,2
Экспорт 82,4 105,0 101,9 107,3 135,9 183,2 243,8 303,9 355,2
Импорт 62,6 44,9 53,8 61,0 76,1 97,4 125,4 164,7 223,1
Сальдо торгового баланса 19,8 60,1 48,1 46,3 59,9 85,8 118,4 139,2 132,1
со странами дальнего зарубежья
экспорт 65,4 90,8 86,6 90,9 114,6 153,0 210,2 260,6 301,5
импорт 44,3 31,4 40,7 48,8 61,0 77,5 103,5 140,1 191,2
сальдо торгового баланса 21,2 59,3 45,9 42,1 53,6 75,5 106,7 120,4 110,3
со странами СНГ
экспорт 17,0 14,3 15,3 16,4 21,4 30,2 33,5 43,4 53,7
импорт 18,3 13,4 13,0 12,2 15,1 19,9 21,9 24,6 31,9
сальдо торгового баланса -1,4 0,8 2,2 4,2 6,3 10,3 11,7 18,8 21,9

Различают подлежащее и сказуемое статистической таблицы. В подлежащем указывается характеризуемый объект – либо единицы совокупности, либо группы единиц, либо совокупность в целом. В сказуемом дается характеристика подлежащего, обычно в числовой форме. Обязателен заголовок таблицы, в котором указывается к какой категории и к какому времени относятся данные таблицы.

По характеру подлежащего статистические таблицы подразделяются на простые, групповые и комбинационные. В подлежащем простой таблицы объект изучения не подразделяется на группы, а дается либо перечень всех единиц совокупности, либо указывается совокупность в целом. В подлежащем групповой таблицы объект изучения подразделяется на группы по одному признаку, а в сказуемом указываются число единиц в группах (абсолютное или в процентах) и сводные показатели по группам. В подлежащем комбинационной таблицы совокупность подразделяется на группы не по одному, а по нескольким признакам.

При построении таблиц необходимо руководствоваться следующими общими правилами.

  1. Подлежащее таблицы располагается в левой (реже – верхней) части, а сказуемое – в правой (реже – нижней).
  2. Заголовки столбцов содержат названия показателей и их единицы измерения.
  3. Итоговая строка завершает таблицу и располагается в ее конце, но иногда бывает первой: в этом случае во второй строке делается запись «в том числе», и последующие строки содержат составляющие итоговой строки.
  4. Цифровые данные записываются с одной и той же степенью точности в пределах каждого столбца, при этом разряды чисел располагаются под разрядами, а целая часть отделяется от дробной запятой.
  5. В таблице не должно быть пустых клеток: если данные равны нулю, то ставится знак «–» (прочерк); если данные не известны, то делается запись «сведений нет» или ставится знак «…» (троеточие). Если значение показателя не равно нулю, но первая значащая цифра появляется после принятой степени точности, то делается запись 0,0 (если, скажем, была принята степень точности 0,1).

Иногда статистические таблицы дополняются графиками, когда ставится цель подчеркнуть какую-то особенность данных, провести их сравнение. Графическая форма является самой эффективной формой представления данных с точки зрения их восприятия. С помощью графиков достигается наглядность характеристики структуры, динамики, взаимосвязи явлений, их сравнения.

Статистические графики – это условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков или географических карт-схем. Графическая форма облегчает рассмотрение статистических данных, делает их наглядными, выразительными, обозримыми. Однако графики имеют определенные ограничения: прежде всего, график не может включить столько данных, сколько может войти в таблицу; кроме того, на графике показываются всегда округленные данные – не точные, а приблизительные. Таким образом, график используется только для изображения общей ситуации, а не деталей. Последний недостаток – трудоемкость построения графиков. Он может быть преодолен использованием персонального компьютера (например, «Мастером диаграмм» из пакета Microsoft Office Excel).

Для наглядного и компактного представления статистической информации используют статистические таблицы и графики (включая диаграммы, картограммы и картодиаграммы).

Результаты сводки и группировки материалов статистического наблюдения, как правило, оформляются в виде таблиц.

Таблица - наиболее рациональная, наглядная и компактная форма представления статистического материала.

Статистической называется таблица, которая содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой экономического анализа.

Основные элементы статистической таблицы, показанной на рис. 5.1, составляют ее макет:

Рис. 5.1. Статистическая таблица

При построении таблицы числовая информация располагается на пересечении строк и граф. Таким образом, внешне таблица пред­ставляет собой совокупность граф и строк, которые формируют ее

остов. Размер таблицы определяется произведением числа строк на число граф.

Статистическая таблица содержит три вида заголовков: общий, верхние и боковые. Общий заголовок отражает содержание всей таблицы, располагается над ее макетом по центру и является внеш­ним заголовком. Верхние заголовки (заголовки сказуемого) харак­теризуют содержание граф, а боковые (заголовки подлежащего) - содержание строк. Они являются внутренними заголовками.

Остов таблицы, заполненный заголовками, образует ее макет. Если на пересечении граф и строк записать цифры, то получается полная статистическая таблица. Цифровой материал может быть пред­ставлен абсолютными, относительными (индексы цен на продоволь­ственные товары) и средними величинами. В случае необходимости таблицы могут сопровождаться примечанием, используемым с це­лью пояснения заголовков, методики расчета некоторых показате­лей, источников информации и т. д.

По логическому содержанию таблица представляет собой «стати­стическое предложение», основными элементами которого являются подлежащее и сказуемое.

Подлежащее статистической таблицы содержит перечень показа­телей, характеризующийся цифрами. Это могут быть одна или не­сколько совокупностей, отдельные единицы совокупностей (фир­мы, объединения) в порядке их перечня или сгруппированные по каким-либо признакам (отдельные территориальные единицы, вре­менные периоды в хронологических таблицах и т. д.). Обычно под­лежащее таблицы дается в левой части, в наименовании строк.

Сказуемое статистической таблицы образует система показате­лей, которыми характеризуется объект изучения, т. е. подлежащее таблицы. Сказуемое формирует верхние заголовки и составляет со­держание граф с логически последовательным расположением пока­зателей слева направо.

Расположение подлежащего и сказуемого может меняться места­ми, что зависит от выбора исследователя. В зависимости от структу­ры подлежащего и группировки единиц в нем различают статисти­ческие таблицы простые и сложные, а последние в свою очередь подразделяются на групповые и комбинационные.

В простой таблице в подлежащем дается простой перечень ка­ких-либо объектов или территориальных единиц совокупности. Про­стые таблицы бывают монографические и перечневые. Монографи­ческие характеризуют не всю совокупность единиц изучаемого объема, а только одну какую-либо группу из него, выделенную по опреде­ленному, заранее сформулированному признаку. Таким образом, простыми перечневыми таблицами называются таблицы, подлежа­щее которых содержит перечень единиц изучаемой совокупности.

Подлежащее простой таблицы может быть сформировано по следу­ющим принципам: видовому, территориальному (численность населе­ния по странам СНГ); временному и т. д. Простые таблицы не дают возможности выявить социально-экономические типы изучаемых яв­лений, их структуру, а также взаимосвязи и взаимозависимости между характеризующими их признаками. Эти задачи более полно решаются с помощью сложных таблиц: групповых и особенно комбинационных.

Групповыми называются статистические таблицы, подлежащее которых содержит группировку единиц совокупности по одному количественному или атрибутивному признаку. Сказуемое в груп­повых таблицах состоит из показателей, необходимых для характе­ристики подлежащего.

Простейшим видом групповых таблиц являются атрибутивные и вариационные ряды распределения. Групповая таблица может быть более сложной, если в сказуемом приводятся не только число еди­ниц в каждой группе, но и ряд других важных показателей, количе­ственно и качественно характеризующих группы подлежащего. Та­кие таблицы часто используются в целях сопоставления обобщающих показателей по группам, что позволяет делать определенные прак­тические выводы. Групповые таблицы позволяют выявить и оха­рактеризовать социально-экономические типы явлений, их струк­туру в зависимости только от одного признака.

Комбинационными называются статистические таблицы, подле­жащее которых содержит группировку единиц совокупности одно­временно по двум и более признакам: каждая из групп, построенная по одному признаку, разбивается на подгруппы по какому-либо другому признаку и т. д.

Комбинационные таблицы позволяют характеризовать типичес­кие группы, выделенные по нескольким признакам, и связь между последними. Последовательность разбиения единиц совокупности на однородные группы по признакам определяется либо важностью одного из них в их комбинации, либо порядком их изучения.

Сложная разработка сказуемого предполагает деление признака, формирующего его, на подгруппы. При этом получается более пол­ная и подробная характеристика объекта. В таком случае каждая группа предприятий или каждое из них в отдельности могут быть охарактеризованы различной комбинацией признаков, формирую­щих сказуемое.

УО ФПБ МИТСО

Кафедра логистики

СУРС №1

по дисциплине Статистика на тему: «Методы и формы представления статистической информации»

Выполнила

Студентка 2 курса

Ф-та МЭОиМ д/о

группы 916

Верина Е. А.

Проверил преподаватель

Бондарь С.В.

Минск, 2010

Трактовка графического метода представления статистических данных как особой знаковой системы - искусственного знакового языка - связана с развитием семиотики, науки о знаках и знаковых системах.

Статистический график - это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков. Представление данных таблицы в виде графика производит более сильное впечатление, чем цифры, позволяет лучше осмыслить результаты статистического наблюдения, правильно их истолковать, значительно облегчает понимание статистического материала, делает его наглядным и доступным. Это, однако, вовсе не означает, что графики имеют лишь иллюстративное значение. Они дают новое знание о предмете исследования, являясь методом обобщения исходной информации.

При построении графического изображения следует соблюдать ряд требований. Прежде всего график должен быть достаточно наглядным, так как весь смысл графического изображения как метода анализа в том и состоит, чтобы наглядно изобразить статистические показатели. Кроме того, график должен быть выразительным, доходчивым и понятным.

График состоит из графического образа и вспомогательных элементов. Графический образ - это совокупность линий, фигур, точек, которыми изображены статистические данные. Диаметрические знаки, рисунки или образы, применяемые в статистических графиках, многообразны. Это точки, отрезки прямых линий, знаки в виде фигур различной формы, штриховки или окраски (круги, квадраты, прямоугольники и др.). Эти знаки применяются для сравнения статистических величин, изображающих абсолютные и относительные размеры сравниваемых совокупностей. Сравнение на графике производится по некоторым измерениям: площади или длине одной из сторон фигуры, местонахождению точек, их густоте, густоте штриховке, интенсивности или цвету окраски.

Вспомогательные элементы включают общий заголовок, условные обозначения, оси координат, шкалы с масштабами и числовую сетку.

Словесные пояснения (экспликация графика) помещенных на графике геометрических образов, различных по их конфигурации, штриховке или цвету, позволяют мысленно перейти от геометриче­ских образов к явлениям и процессам, изображенным на графике.

В статистических графиках чаще всего применяется система прямоугольных координат, но есть и графики, построенные по принципу полярных координат (круговые графики).

Когда график строится в прямоугольных координатах, на горизонтальной оси абсцисс и вертикальной оси ординат в определенном порядке располагаются характеристики статистических признаков изображаемых явлений или процессов, а в поле графика размещаются геометрические знаки, составляющие сам график. Поле графика - это пространство, в котором располагаются геометрические знаки, образующие график.

Признаки, располагаемые на осях координат, могут быть качественными и количественными.

Одна из важных задач статистического графика - это его композиция: отбор статистического материала, выбор способа изображения, т.е. формата графика. Размер графика должен соответствовать его назначению.

В заголовке (названий) графика определяется задача, которая решается при помощи графика, дается характеристика места и времени, к которому относится график.

Надписи вдоль масштабных шкал указывают, в каких единицах измеряются признаки. Цифры значений каждого параметра проставляются у пограничных отметок масштабных шкал.

Масштабная шкала - линия (на статистическом графике обычно прямая) , несущая на себе масштабные отметки с их числовыми обозначениями. Лучше делать эти обозначения только на отметках, соответствующих круглым числам: в таком случае промежуточные отметки читают путем отсчета от ближайшего числа, обозначенного на масштабной шкале. Согласно масштабным отметкам на диаграммном поле откладывают размеры изображаемых явлений или процесс. Масштабные отметки располагаются на шкале равномерно (шкала равномерная, арифметическая) или неравномерная (шкала функциональная, шкала логарифмическая).

Шкала функциональная - масштабная шкала, где числовые значения помеченных точек выражают значения аргумента, а расположение этих точек соответствует равномерно распределенным значениям некоторой функции того же аргумента. Из шкал функциональных в статистических графиках применяют главным образом шкалу логарифмическую. При этом, если рассматриваются две величины, то такая шкала может быть применима к обеим или только к одной из них (“полулогарифмический” график или масштаб). Расстояния между точками, нанесенными по числовым отметкам логарифмической шкалы, отвечают разности логарифмов соответствующих чисел и, следовательно, характеризуют соотношения между числами.

Классификация видов графиков.

Существует множество видов графических изображений. Их классификация основана на ряде признаков:

а) способ построения графического образа;

б) геометрические знаки, изображающие статистические показатели и отношения;

в) задачи, решаемые с помощью графического изображения.

Статистические графики по форме графического образа:

1. Линейные: статистические кривые.

2. Плоскостные: столбиковые, полосовые, квадратные, круговые, секторные, фигурные, точечные, фоновые.

3. Объемные: поверхности распределения.

Статистические графики по способу построения и задачам изображения:

1. Диаграммы: диаграммы сравнения, диаграммы динамики, структурные диаграммы.

2. Статистические карты: картограммы, картодиаграммы.

По способу построения статистические графики делятся на диаграммы и статистические карты. Диаграммы - наиболее распространенный способ графических изображений. Это графики количественных отношений. Виды и способы их построения разнообразны. Диаграммы применяются для наглядного сопоставления в различных аспектах (пространственном, временном и др.) независимых друг от друга величин: территорий, населения и т. д. При этом сравнение исследуемых совокупностей производится по какому-либо существенному варьирующему признаку. Статистические карты - графики количественного распределения по поверхности. По своей основной цели они близко примыкают к диаграммам и специфичны лишь в том отношении, что представляют собой условные изображения статистических данных на контурной географической карте, т. е. показывают пространственное размещение или пространственную распространенность статистических данных. Геометрические знаки, как было сказано выше, - это либо точки, либо линии или плоскости, либо геометрические тела. В соответствии с этим различают графики точечные, линейные, плоскостные и пространственные (объемные).

При построении точечных диаграмм в качестве графических образов применяются совокупности точек; при построении линейных - линии. Основной принцип построения всех плоскостных диаграмм сводится к тому, что статистические величины изображаются в виде геометрических фигур и, в свою очередь, подразделяются на столбиковые, полосовые, круговые, квадратные и фигурные.

Статистические карты по графическому образу делятся на картограммы и картодиаграммы.

В зависимости от круга решаемых задач выделяются диаграммы сравнения, структурные диаграммы и диаграммы динамики.

Наиболее употребительными графиками для изображения вариационных рядов, т. е. соотношений между значениями признака и соответствующими частотами или относительными частотами, являются полигон, гистограмма и кумулята.

Полигон чаще всего используют для изображения дискретных рядов. Для построения полигона в прямоугольной системе координат на оси абсцисс в произвольно выбранном масштабе откладывают значения аргумента, т. е. варианты, а на оси ординат также в произвольно выбранном масштабе - значения частот или относительных частот. Масштаб выбирают такой, чтобы была обеспечена необходимая наглядность, и чтобы рисунок имел желательный размер. Далее в этой системе координат строят точки, координатами которых являются пары соответствующих чисел из вариационного ряда. Полученные точки последовательно соединяют отрезками прямой. Крайнюю "левую" точку соединяют с точкой оси абсцисс, абсцисса которой находится слева от рассматриваемой точки на таком же расстоянии, как абсцисса ближайшей справа точки. Аналогично крайнюю "правую" точку также соединяют с точкой оси абсцисс.

Учебные достижения учащихся некоторого класса по математике характеризуются данными, представленными в таблице.

Построить полигон частот.

Статистические данные должны быть представлены так, чтобы ими можно было пользоваться. Существует 3 основных формы представления статистических данных:

1) текстовая – включение данных в текст;

2) табличная – представление данных в таблицах;

3) графическая – выражение данных в виде графиков.

Текстовая форма применяется при малом количестве цифровых данных.

Табличная форма применяется чаще всего, так как является более эффективной формой представления статистических данных. В отличие от математических таблиц, которые по начальным условиям позволяют получить тот или иной результат, статистические таблицы рассказывают языком цифр об изучаемых объектах.

Статистическая таблица – это система строк и столбцов, в которых в определенной последовательности и связи излагается статистическая информация о социально-экономических явлениях.

Таблица 2. Внешняя торговля РФ за 2000 – 2006 годы, млрд.долл.

Показатель 2000 2001 2002 2003 2004 2005 2006
Внешнеторговый оборот 149,9 155,6 168,3 280,6 368,9 468,4
Экспорт 101,9 107,3 135,9 183,2 243,6 304,5
Импорт 44,9 53,8 76,1 97,4 125,3 163,9
Сальдо торгового баланса 60,1 48,1 46,3 59,9 85,8 118,3 140,7
в том числе:
со странами дальнего зарубежья
экспорт 90,8 86,6 90,9 114,6 210,1 261,1
импорт 31,4 40,7 48,8 77,5 103,5 138,6
сальдо торгового баланса 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Например, в табл. 2 представлена информация о внешней торговле России, выражать которую в текстовой форме было бы неэффективным.

Различают подлежащее и сказуемое статистической таблицы. В подлежащем указывается характеризуемый объект – либо единицы совокупности, либо группы единиц, либо совокупность в целом. В сказуемом дается характеристика подлежащего, обычно в числовой форме. Обязателен заголовок таблицы, в котором указывается к какой категории и к какому времени относятся данные таблицы.

По характеру подлежащего статистические таблицы подразделяются на простые , групповые и комбинационные . В подлежащем простой таблицы объект изучения не подразделяется на группы, а дается либо перечень всех единиц совокупности, либо указывается совокупность в целом (например, табл. 11). В подлежащем групповой таблицы объект изучения подразделяется на группы по одному признаку, а в сказуемом указываются число единиц в группах (абсолютное или в процентах) и сводные показатели по группам (например, табл. 4). В подлежащем комбинационной таблицы совокупность подразделяется на группы не по одному, а по нескольким признакам (например, табл. 2).

При построении таблиц необходимо руководствоваться следующими общими правилами .

1. Подлежащее таблицы располагается в левой (реже – верхней) части, а сказуемое – в правой (реже – нижней).

2. Заголовки столбцов содержат названия показателей и их единицы измерения.

3. Итоговая строка завершает таблицу и располагается в ее конце, но иногда бывает первой: в этом случае во второй строке делается запись «в том числе», и последующие строки содержат составляющие итоговой строки.

4. Цифровые данные записываются с одной и той же степенью точности в пределах каждого столбца, при этом разряды чисел располагаются под разрядами, а целая часть отделяется от дробной запятой.

5. В таблице не должно быть пустых клеток: если данные равны нулю, то ставится знак «–» (прочерк); если данные не известны, то делается запись «сведений нет» или ставится знак «…» (троеточие). Если значение показателя не равно нулю, но первая значащая цифра появляется после принятой степени точности, то делается запись 0,0 (если, скажем, была принята степень точности 0,1).

Иногда статистические таблицы дополняются графиками, когда ставится цель подчеркнуть какую-то особенность данных, провести их сравнение. Графическая форма является самой эффективной формой представления данных с точки зрения их восприятия. С помощью графиков достигается наглядность характеристики структуры, динамики, взаимосвязи явлений, их сравнения.

Статистические графики – это условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков или географических карт-схем. Графическая форма облегчает рассмотрение статистических данных, делает их наглядными, выразительными, обозримыми. Однако графики имеют определенные ограничения: прежде всего, график не может включить столько данных, сколько может войти в таблицу; кроме того, на графике показываются всегда округленные данные – не точные, а приблизительные. Таким образом, график используется только для изображения общей ситуации, а не деталей. Последний недостаток – трудоемкость построения графиков. Он может быть преодолен использованием персонального компьютера (например, «Мастером диаграмм» из пакета Microsoft Office Excel ).

По способу построения графики делятся на диаграммы , картограммы и картодиаграммы .

Наиболее распространенным способом графического изображения данных являются диаграммы, которые бывают следующих видов: линейные, радиальные, точечные, плоскостные, объемные, фигурные. Вид диаграмм зависит от вида представляемых данных и задачи построения. В любом случае график обязательно сопровождается заголовком – над или под полем графика. В заголовке указывается, какой показатель изображен, по какой территории и за какое время.

Линейные графики используются для представления количественных переменных: характеристики вариации их значений, динамики, взаимосвязи между переменными. Вариация данных анализируется с помощью полигона распределения , кумуляты (кривой «меньше, чем») и огивы (кривой «больше, чем»). Полигон распределения рассматривается в теме 4 (напр., рис. 5.). Для построения кумуляты значения варьирующего признака откладываются по оси абсцисс, а на оси ординат помещаются накопленные итоги частот или частостей (от f 1 до ∑f ). Для построения огивы на оси ординат помещаются накопленные итоги частот в обратном порядке (от ∑f до f 1 ). Кумуляту и огиву по данным табл. 4. изобразим на рис. 1.

Рис. 1. Кумулята и огива распределения товаров по величине таможенной стоимости

Применение линейных графиков в анализе динамики рассматривается в теме 5 (напр., рис. 13), а использование их для анализа связей – в теме 6 (напр., рис.21). В теме 6 также рассмотрено использование точечных диаграмм (напр., рис. 20).

Линейные графики подразделяются на одномерные , используемые для представления данных по одной переменной, и двумерные – по двум переменным. Примером одномерного линейного графика является полигон распределения, а двумерного – линия регрессии (напр., рис. 21).

Иногда при больших изменениях показателя прибегают к логарифмической шкале. Например, если значения показателя изменяются от 1 до 1000, то это может вызвать затруднения при построении графика. В таких случаях переходят к логарифмам значений показателя, которые не будут столь сильно различаться: lg 1 = 0, lg 1000 = 3.

Среди плоскостных диаграмм по частоте использования выделяются столбиковые диаграммы (гистограммы), на которых показатель представляется в виде столбика, высота которого соответствует значению показателя (напр., рис. 4).

Пропорциональность площади той или иной геометрической фигуры величине показателя лежит в основе других видов плоскостных диаграмм: треугольных , квадратных , прямоугольных . Можно использовать и сравнение площадей круга – в этом случае задается радиус окружности.

Ленточная диаграмма представляет показатели в виде горизонтально вытянутых прямоугольников, а в остальном не отличается от столбиковой диаграммы.

Из плоскостных диаграмм часто используется секторная диаграмма , которая применяется для иллюстрации структуры изучаемой совокупности. Вся совокупность принимается за 100%, ей соответствует общая площадь круга, площади секторов соответствуют частям совокупности. Построим секторную диаграмму структуры внешней торговли РФ в 2006 году по данным табл. 2 (см. рис. 2). При использовании компьютерных программ секторные диаграммы строятся в объемном виде, то есть не в двух, а в трех плоскостях (см. рис. 3).

Рис. 2. Простая секторная диаграмма Рис. 3. Объемная секторная диаграмма

Фигурные (картинные) диаграммы усиливают наглядность изображения, так как включают рисунок изображаемого показателя, размер которого соответствует размеру показателя.

При построении графика одинаково важно все – правильный выбор графического изображения, пропорций, соблюдение правил оформления графиков. Подробнее эти вопросы освещаются в и .

Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений. Они показывают размещение изучаемого явления, его интенсивность на определенной территории – в республике, области, экономическом или административном округе и т.д.. Построение картограмм и картодиаграмм рассматривается в специальной литературе, например .

Конец работы -

Эта тема принадлежит разделу:

Понятие о статистике. Предмет и метод статистики

Понятие о статистике.. предмет и метод статистики.. статистическое наблюдение..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Предмет и метод статистики
В научный обиход термин «статистика» ввел немецкий ученый Готфрид Ахенваль в 1746 году, предложив заменить название курса «Государствоведение», преподававшегося в университетах Германии, на «Ста

Статистическое наблюдение
Люди по-разному относятся к статистической информации: одни не воспринимают ее, другие безоговорочно верят, а третьи согласны с мнением английского политика Дизраэли: «Существует 3 типа лжи: ложь,

Сводка и группировка статистических данных
Сводка – научно организованная обработка материалов наблюдения (по заранее разработанной программе), включающая в себя кроме обязательного контроля собранных данных, систематизацию, группиро

Абсолютные величины
Для характеристики массовых явлений статистика использует статистические величины (показатели), которые характеризуют группы единиц или совокупность (явление) в целом. Статистические величин

Относительные величины
Относительная величина – это результат деления (сравнения) двух абсолютных величин. В числителе дроби стоит величина, которую сравнивают, а в знаменателе – величина, с которой сравнивают (ба

Средние величины
Как уже неоднократно было сказано ранее, статистика изучает массовые явления и процессы. Каждое из таких явлений обладает как общими для всей совокупности, так и особенными, индивидуальными свойств

Построение ряда распределения
Признаки, изучаемые статистикой, варьируются (отличаются друг от друга) у различных единиц совокупности в один и тот же период или момент времени. Например, величина внешнеторгового оборота варьиру

Расчет структурных характеристик ряда распределения
При изучении вариации применяются такие характеристики ряда распределения, которые описывают количественно его структуру, строение. Такова, например, медиана – величина варьирующего признака

Расчет показателей размера и интенсивности вариации
Простейшим показателем является размах вариации – абсолютная разность между максимальным и минимальным значениями признака из имеющихся в изучаемой совокупности значений (24):

Расчет моментов распределения и показателей его формы
Для дальнейшего изучения характера вариации используются средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Эти показатели называются

Проверка соответствия ряда распределения нормальному
Под теоретической кривой распределения понимается графическое изображение ряда в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариантов, другим

Проверка соответствия ряда распределения закону Пуассона
Таможенная инспекция провела проверку после выпуска товаров. В результате получен следующий дискретный ряд распределения числа нарушений, выявленных в каждой проверке (табл. 16). Таблица 1

Абсолютные и относительные показатели изменения структуры
Развитие статистической совокупности проявляется не только в количественном росте или уменьшении элементов системы, но также и в изменении ее структуры. Структура – это строение совокупности

Ранговые показатели изменения структуры
Для измерения различий структуры часто используют менее точные, но более простые по расчету показатели, которые основаны на оценки различий не самих значений долей, а их рангов, то есть порядковых

Понятие выборочного наблюдения
Выборочный метод используется, когда применение сплошного на­блюдения физически невозможно из-за огромного массива данных или экономически нецелесообразно. Физическая невозможность имеет ме­сто, на

Способы формирования выборки
1. Собственно случайный отбор: все единицы ГС нумеруются, а выпавшие в результате жеребьевки номера соответствуют единицам, попавшим в выборку, причем число номеров равно запланированному об

Средняя ошибка выборки
После завершения отбора необходимого числа единиц в выборку и регистрации предусмотренных программой наблюдения изучаемых признаков этих единиц, переходят к расчету обобщающих показателей. К ним от

Предельная ошибка выборки
Учитывая, что на основе выборочного обследования нельзя точно оценить обобщающую характеристику ГС, необходимо найти пределы, в которых он находится. В конкретной выборке разность

Необходимая численность выборки
Разрабатывая программу выборочного наблюдения, задаются конкретным значением предельной ошибки и уровнем вероятности. Не­известной остается минимальная численность выборки, обеспечиваю­щая заданную

Методические указания
Задача. На предприятии в порядке случайной бесповторной выборки было опрошено 100 рабочих из 1000 и получены следующие данные об их доходе за месяц (таблица 24): Та

Понятие о рядах динамики
Одной из важнейших задач статистики является изучение изменений анализируемых показателей во времени, то есть их динамика. Эта задача решается при помощи анализа рядов динамики (временных рядов).

Показатели изменения уровней ряда динамики
Анализ рядов динамики начинается с определения того, как именно изменяются уровни ряда (увеличиваются, уменьшаются или остаются неизменными) в абсолютном и относительном выражении. Чтобы проследить

Средние показатели ряда динамики
Каждый ряд динамики можно рассматривать как некую совокупность n меняющихся во времени показателей, которые можно обобщить в виде средних величин. Такие обобщенные (средние) показатели особенно нео

Методы выявления основной тенденции (тренда) в рядах динамики
Одна из основных задач изучения рядов динамики – выявить основную тенденцию (закономерность) в изменении уровней ряда, именуемую трендом. Закономерность в изменении уровней ряда в одних случ

Оценка адекватности тренда и прогнозирование
Для найденного уравнения тренда необходимо провести оценку его надежности (адекватности), что осуществляется обычно с помощью критерия Фишера, сравнивая его расчетное значение Fр

Анализ сезонных колебаний
В рядах динамики, уровни которых являются месячными или квартальными показателями, наряду со случайными колебаниями часто наблюдаются сезонные колебания, под которыми понимаются периодически

Методические указания
По данным ФСГС сальдо внешней торговли (СВТ) России за период 2000-2006 гг. характеризуется рядом динамики, представленным в табл. 36. Таблица 36. Сальдо внешней торговли (СВТ) России за п

Понятие корреляционной зависимости
Один из наиболее общих законов объективного мира – закон всеобщей связи и зависимости между явлениями. Естественно, что, исследуя явления в самых различных областях, статистика неизбежно сталкивает

Методы выявления и оценки корреляционной связи
Для выявления наличия и характера корреляционной связи между двумя признаками в статистике используется ряд методов. 1. Рассмотрение параллельных данных (зна

Коэффициенты корреляции рангов
Коэффициенты корреляции рангов – это менее точные, но более простые по расчету непараметрические показатели для измерения тесноты связи между двумя коррелируемыми признаками. К ним относятся

Особенности коррелирования рядов динамики
Во многих исследованиях приходится изучать динамику нескольких показателей одновременно, т.е. рассматривать параллельно несколько рядов динамики. В этом случае возникает необходимость измерить зави

Показатели тесноты связи между качественными признаками
Метод корреляционных таблиц применим не только к количественным, но и к описательным (качественным) признакам, взаимосвязи между которыми часто приходится изучать при проведении различных социологи

Множественная корреляция
При решении практических задач исследователи сталкиваются с тем, что корреляционные связи не ограничиваются связями между двумя признаками: результативным y и факторным x. В действите

Назначение и виды индексов
Индекс – относительная величина, показывающая во сколько раз уровень изучаемого явления в данных условиях отличается от уровня того же явления в других условиях. Различие условий может прояв

Индивидуальные индексы
Относительная величина, получаемая при сравнении уровней, называется индивидуальным индексом, если не имеет значения структура изучаемого явления. Индивидуальные индексы обозначаются i

Общие индексы
Если изучаемое явление неоднородно и сравнение уровней можно провести только после приведения их к общей мере, экономический анализ выполняют посредством общих индексов. Индекс становится общим

Индексы средних величин
При изучении качественных показателей часто приходится рассматривать изменение во времени (или пространстве) средней величины индексируемого показателя для определенной однородной совкупност

Территориальные индексы
Территориальные индексы применяются для пространственных, межрегиональных сопоставлений различных показателей. Их расчет более сложен, чем расчет традиционных (динамических) индексов, рассмотренных



Понравилась статья? Поделиться с друзьями: