чем определяется величина интервала

Статистика

Этапы группировки данных

1 этап. Выбор основания группировки

Все многообразие признаков, на основе которых могут производиться статистические группировки, можно соответствующим образом классифицировать.

1. По форме выражения группировочные признаки могут быть атрибутивными, не имеющими количественного значения (профессия, образование и т.д.), и количественными, принимающими различные цифровые характеристики у отдельных единиц совокупности (число работающих, величина дохода и т.д.). При этом количественные признаки могут быть дискретными и непрерывными.

2. По характеру колеблемости группировочные признаки могут быть альтернативными, которыми одни единицы обладают, а другие – нет (поставка товаров в магазин может быть качественной или некачественной), и имеющими множество количественных значений (размер торговой площади, средний заработок и т.д.).

3. По той роли, которые играют признаки во взаимосвязи изучаемых явлений, их подразделяют на факторные, воздействующие на другие признаки, и результативные, испытывающие на себе влияние других. Причем, в зависимости от сложившихся объективных условий и цели исследования признаки могут меняться ролями. В одних случаях они являются факторными признаками, в других – результативными. Так, с одной стороны, величина прибыли предприятий торговли зависит от качества деятельности их коллективов, с другой – является основным источником дальнейшего расширения всего торгового потенциала. Первый случай – результативный, второй – факторный.

2 этап. Определение интервала группировки

В зависимости от степени колеблемости группировочного признака, характера распределения статистической совокупности устанавливаются интервалы равные и неравные. При более или менее равномерной разности между верхней и нижней границами интервалов устанавливают одинаковые границы во всех группах.

Число групп связано с объемом совокупности. Строгих научных приемов нет, все зависит от конкретных обстоятельств, однако при равенстве интервалов для ориентировки существует формула, предложенная американским ученым-статистиком Стерджессом, с помощью которой можно наметить число групп n при известной численности совокупности N:

Например, если число единиц равно N = 200, то число групп:

Зная размах колеблемости значений изучаемого признака во всей совокупности и число групп, величина равного интервала определяется по формуле

где n – число групп.

3 этап. Определение границ каждого интервала.

Источник

Тема 4 Статистическая сводка и группировка.Ряды распределения.

Сводка представляет собой комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Результатом сводки являются подробные данные, отражающие в целом всю совокупность.

По глубине обработки материала сводка бывает простая и сложная. Простой сводкой называется операция по подсчету общих итогов по совокупности единиц наблюдения. Сложная сводка – комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических таблиц.

Разработка программы сводки состоит из следующих этапов:

По форме обработки материала сводка бывает децентрализованная (обработка материала производится этапами: например, отчеты предприятий сводятся статистическими органами субъектов РФ, а уже итоги по региону поступают в Госкомстат России) и централизованная (весь первичный материал поступает в одну организацию, где и подвергается обработке от начала до конца).

Группировкой называется расчленение множества единиц изучаемой совокупности на группы по определенным существенным для них признакам. Статистические группировки по задачам, решаемым с их помощью, делятся на: типологические, структурные и аналитические. Типологическая группировка – это разделение исследуемой качественно разнородной совокупности на классы, социально-экономические типы, однородные группы единиц в соответствии с правилами научной группировки. Примером является группировка промышленных предприятий по формам собственности.При проведении типологической группировки основное внимание должно быть уделено идентификации типов социально-экономических явлений.

Структурной называется группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку.

Аналитическая группировка выявляет взаимосвязи между изучаемыми явлениями и их признаками.

Процесс построения группировок состоит из следующих этапов.

Определение группировочного признака. Группировочным признаком называется признак, по которому проводится разбивка единиц совокупности на отдельные группы. Его часто называют основанием группировки. В основание группировки могут быть положены как количественные, так и качественные признаки. Первые имеют числовое выражение (объем торгов, возраст человека и т.д.), а вторые отражают состояние единицы совокупности (пол человека, национальность, и т.д.) Всю совокупность признаков можно разделить на две группы: факторные и результативные. Факторными называются признаки, под воздействием которых изменяются другие признаки и образуют группу результативных признаков.

Определение количества групп. Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности. Степени вариации признака. При построении группировки по качественному признаку групп будет столько, сколько имеется градаций, видов, состояний у этого признака (пол – 2, регионов России – 89 и т.д.). Если группировка проводится по количественному признаку, то необходимо обратить внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака. Чем больше колеблемость группировочного признака, тем больше следует образовать групп. Если распределение признака условно равномерно, то для определения количества групп используется формула Стерджесса:

Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному.

Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения (крайние точки). Полученная величина является шагом интервала.

Открытые интервалы – те, у которых указана только одна граница. Закрытые интервалы – те, у которых обозначены обе границы.

Ширина открытого интервала принимается равной ширине соседнего с ним закрытого интервала.

Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку. В зависимости от признака, положенного в основу группировки различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды, построенные по качественным признакам. Вариационными рядами называют ряды распределения, построенные по количественному признаку. Каждый вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду, т.е. конкретное значение варьирующего признака. Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, показывающие, как часто встречается та или иная варианта в ряду. Частостями называют частоты, выраженные в процентах или долях единицы.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды. В случае дискретной вариации величина количественного признака принимает только целые значения. В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения.

Ряды распределения анализируются с помощью графического изображения. Полигон используется при изображении дискретных вариационных рядов. При этом, на оси абсцисс откладываются значения признака, а на оси ординат – частоты. Гистограмма применяется для изображения интервальных рядов. При этом, на оси абсцисс откладываются интервалы признака, на оси ординат – частоты. В случае, если интервальный ряд построен с неравными интервалами, то вместо частот на ось ординат наносится плотность распределения признака в соответствующих интервалах. Плотность распределения – это частота, рассчитанная на единицу ширины интервала.

Для изображения вариационных рядов может также использоваться кумулятивная кривая. При помощи кумуляты (кривая сумм) изображается ряд накопленных частот, которые определяются последовательным суммированием частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение. На ось абсцисс наносятся значения признака, а на оси ординат откладываются накопленные частоты. Если при графическом изображении кумуляты поменять местами оси, то в результате получится график, который называется огива.

Вторичная группировка – операция по образованию новых групп на основе ранее осуществленной группировки. Применяют два способа для образования новых групп:

Статистической называется таблица, которая содержит числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой экономического анализа. По логическому содержанию таблица представляет собой статистическое предложение. Подлежащим статистической таблицы называется объект, характеризующийся цифрами. Обычно подлежащее располагается в левой части таблицы, в наименовании строк. Сказуемое статистической таблицы образует система показателей, которыми характеризуется подлежащее (объект изучения). Сказуемое формирует верхние заголовки и составляет содержание граф. По характеру подлежащего различают простые и сложные таблицы. Простые таблицы бывают монографические и перечневые. Сложные таблицы, в свою очередь, делятся на групповые и комбинационные.

Если в подлежащем представлена только одна группа или один объект, то таблица называется простой монографической. Если в подлежащем представлен несгруппированный перечень единиц, то таблица называется простой перечневой.

Если в подлежащем представлена группировка единиц совокупности по одному признаку, то таблица называется сложной групповой. Если же в подлежащем представлена группировка единиц по нескольким признакам, то таблица называется сложной комбинационной.

По разработке сказуемого различают таблицы с простой и сложной разработкой сказуемого. При простой разработке сказуемого показатель, определяющий его, не подразделяется на подгруппы, и итоговые значения получаются путем простого суммирования значений по каждому признаку отдельно, независимо друг от друга. Сложная разработка сказуемого предполагает деление признака на формирующие его подгруппы.

Существует множество видов графических изображений. Классификация видов графиков представлена на рисунке.

Источник

Лекция 5 Статистическая сводка и группировка

чем определяется величина интервала. Смотреть фото чем определяется величина интервала. Смотреть картинку чем определяется величина интервала. Картинка про чем определяется величина интервала. Фото чем определяется величина интервала

Статистическая сводка и группировка. В результате проведения статистического наблюдения получают данные о признаках каждой обследованной единицы статистической совокупности. Однако эти массивы данных, содержащие подробные сведения о каждой единице совокупности, собирают не для того, чтобы получить характеристики каждой из них, а с целью изучить совокупность в целом, выявить ее характерные группы и закономерности. Для этого необходимо обобщить и систематизировать сведения, полученные в ходе статистического наблюдения.

Обобщение и систематизация первичных статистических данных – это самостоятельный этап статистического исследования, основная задача которого получить полную и всестороннюю характеристику как совокупности в целом, так и отдельных ее частей и представить полученную информацию об изучаемой совокупно­сти в наиболее удобной для пользователей форме. В статистической практике данный этап статистического исследования называют этапом сводки и группировки статистических данных.

Статистическая сводка

Сводка это научная обработка первичных данных с целью получения обобщенных характеристик изучаемого социально-экономического явления по ряду существенных для него признаков с целью выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

По глубине и точности обработки материала различают простую сводку и сложную сводку.

Простая сводка это операция по подсчету общих итогов по совокупности единиц наблюдения и оформление этого материала в статистических таблицах.

Сложная сводка это комплекс последовательных операций, включающих группировку полученных при наблюдении материалов, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов по каждой группе и подгруппе, и по всему объекту и представление результатов в виде статистических таблиц.

Этапы проведение сводки

Статистическая группировка

Группировка – разбиение общей совокупности единиц объекта наблюдения по одному или нескольким существенным признакам на однородные группы, раз­личающиеся между собой в количественном и качественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности и проанализи­ровать связи между отдельными признаками.

Задачи, решаемые с помощью метода группировок:

Виды группировок. В соответствии с познавательными задачами, решаемыми в ходе построения стати­стических группировок, различают следующие их виды: типологические, структурные, аналитические.

Типологическая группировка – это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на этой основе социально-экономических типов явлений. При построении группировки этого вида основное внимание должно быть уделено идентификации типов и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемого социально-экономического явления.

Структурная группировка – предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку, а также структуры и структурных сдвигов, происходящих в нем.

Аналитическая группировка – выявляет взаимосвязи между изучаемыми явлениями и признаками, их характеризующими.

. В статистике при изучении связей социально-экономических явлений признаки подразделяют на факторные и результативные.

Особенности построения аналитической группировки:

По способу построения группировки бывают простые и комбинационные.

Простая группировка – группы образованы только по одному признаку.

Комбинационная группировка – разбиение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации).

Сначала группы формируются по одному признаку, затем группы делятся на подгруппы по другому признаку, а эти в свою очередь делятся по третьему и так далее. Таким образом, комбинационные группировки дают возможность изучить единицы совокупности одновременно по нескольким взаимосвязанным признакам.

При построении комбинационной группировки возникает вопрос о последователь­ности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала производить группировку по атрибутивным признакам, значения которых имеют ярко выраженные качественные различия.

Этапы построения статистических группировок

При небольшом объеме совокупности (n

Определение числа групп можно осуществить несколькими способами. Формально-математический способ предполагает использование формулы Стерджесса (формула 5.2): чем определяется величина интервала. Смотреть фото чем определяется величина интервала. Смотреть картинку чем определяется величина интервала. Картинка про чем определяется величина интервала. Фото чем определяется величина интервала(5.2)

где n – число групп; N – число единиц совокупности.

Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.

Применение данной формулы дает хорошие результаты в том случае, если сово­купность состоит из большого числа единиц наблюдения (n>50).

Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения (σ). Если величина интервала равна 0,5σ, то совокуп­ность разбивается на 12 групп, а когда величина интервала равна 2/3σ и σ, то совокуп­ность делится, собственно, на 9 и 6 групп. Однако при определении групп данными методами существует большая вероятность получения «пустых» или малочисленных групп, характеристики изучаемого явления на основе которых будут недостаточно типичными для выделенной группы и изучаемой совокупности в целом.

Когда определено число групп, то следует определить интервалы группировки.

Интервал это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки бывают: равные и неравные; открытые и закрытые.

Ширина равного интервала определяется по (формуле 5.3):

чем определяется величина интервала. Смотреть фото чем определяется величина интервала. Смотреть картинку чем определяется величина интервала. Картинка про чем определяется величина интервала. Фото чем определяется величина интервала(5.3)

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (5.3) величину округляют и она будет являться шириной интервала.

Существуют следующие правила определения ширины интервала.

Если величина интервала, рассчитанная по формуле (5.3) представляет собой величину, которая имеет один знак до запятой (например: 0,67; 1,487; 3,82), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала. В приведенном выше примере это будут соответственно значения: 0,7; 1,5; 3,8.

Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой (например, 14,876), то это значение необходимо округлит до целого числа (15).

В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.

Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то надо использовать группировку с неравными интервалами.

Неравные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если после построения равных интервалов по изучаемому признаку образуются группы, содержащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необхо­димость в увеличении интервалов группировки.

Также неравные интервалы могут быть прогрессивно-возрастающие или прогрес­сивно-убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической и геометрической прогрессии, определяется следующим образом:hi+1=hi+а,

а – константа: для прогрессивно-возрастающих интервалов имеет знак «+», а при прогрессивно-убывающих – знак «-».

q — константа: для прогрессивно-возрастающих – больше «1»; для прогрессивно-убывающих ‑ меньше «1».

Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.

Например, при построении группировки строительных компаний города по показателю численности работающих, который варьирует от 500 человек до 3500 человек, нецелесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и крупнейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500–1000, 1000–2000, 2000–3500, т.е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии. Выбор исследователя в построении равных или неравных интервалов зависит от степени заполнения каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала существенна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае – объединять.

Интервалы статистической группировки

Интервалы группировок могут быть закрытыми и открытыми.

Закрытые интервалы это интервалы, у которых есть и верхняя и нижняя границы.

Открытые интервалы – это интервалы, у которых указана только одна граница: как правило, верхняя – у первого интервала и нижняя – у последнего.

Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50–100, 100–150, 150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупно­сти встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех остальных значений изучаемого признака.

Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему строительно-монтажных работ, выполненных собственными силами (тыс. руб.): 1200–1400, 1400–1600, 1600–1800, 1800–2000), то одно и то же значение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. ‑ соответственно второго и третьего и т.д., т.е. верхняя граница i-го интервала равна нижней границе (i+1)-го интервала.

При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы наблюдения, значения признака у которых совпадают с границами интервалов.

Например, во вторую или третью группу должна войти строительная фирма с объемом строительно-монтажных работ 1600 тыс. рублей? Если верхняя граница формируется по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в противном случае – ко второй. Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно ориентироваться на открытые интервалы (по нашему примеру группы строительных фирм по объему строительно-монтажных работ преобразуются в следующие: до 1400, 1400–1600, 1600–1800, 1800 и более). В данном случае, вопрос отнесения отдельных единиц совокупности, значения которых являются граничными, к той или иной группе решается на основе анализа последнего открытого интервала. Возможны два случая обозначения последнего открытого интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае, строительные фирмы с объемом строительно-монтажных работ 1600 тыс. руб. попадут в третью группу; во втором случае – во вторую группу.

Если в основании группировки лежит дискретный признак, то нижняя граница 1-го интервала равна верхней границе i-1-го интервала, увеличенной на 1.

Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид: 100–150, 151–200, 201–300.

Строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами.

Специализированные интервалы – применяются дли выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрессивно-убывающими. Такие интервалы называются произвольными и, как правило, используются при группировке предприятий, например, по уровню рентабельности.

Пример. Далее на примере данных приведенных в табл. 5.1. произведем аналитическую группировку совокупности, включающей 30 банков.

Таблица 5.1 ‑ Совокупность 30 банков Российской Федерации

(на 01.01.19 г., цифры условные)

Номер банкаКапитал, млн. руб.Активы, млн. руб.
1234
1207,72,481,14
2200,32,401,10
3190,22,281,05
4323,23,881,88
5247,12,961,36
6177,72,120,97
7242,52,901,33
8182,92,180,99
9315,63,781,73
10183,22,201,01
11320,23,841,76
12207,32,481,14
13181,02,170,99
14172,42,060,94
15234,32,811,29
16189,52,271,04
17187,82,241,03
18166,91,990,91
19157,71,880,86
20168,32,020,93
21224,42,691,23
22166,51,990,91
23198,52,381,09
24240,42,881,32
25229,32,751,26
26175,22,100,96
27156,01,870,86
28160,11,920,88
29178,72,140,98
30171,62,050,94

По данным табл.5.1 группировочным (факторным) признаком является капитал, результативным – прибыль. Группировку производим по факторному признаку. Зададим количество групп (условно) – 4, а величину интервала определим по формуле (5.3).

Обозначим границы групп:

1-я группа – 156,0-197,8;

2-я группа – 197,8-239,6;

3-я группа – 239,6-281,4;

4-я группа – 281,4-323,2.

После того, как определен группировочный признак – капитал, задано число групп – 4 и образованы сами группы, необходимо отобрать показатели, которые характеризуют группы, и определить их величины по каждой группе.

Далее показатели, характеризующие банки, разносятся по четырем указанным группам и подсчитываются групповые итоги. Результаты группировки заносятся в таблицу и определяются общие итоги по совокупности единиц наблюдения по каждому показателю.

Таблица 5.2 ‑ Группировка коммерческих банков по величине капитала

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *