Определить м среднюю арифметическую по способу моментов. Исчисление средней арифметической взвешенной по способу моментов

При большом числе наблюдений или при большом числовом значении вариант применяют

упрощенный способ вычисления средней арифметической- способ моментов.

М = А+ iSар

где М - средняя арифметическая; А - условная средняя; i - интервал между группами вариант;

S - знак суммирования.; а- условное отклонение каждой варианты от условной средней;

р - частота встречаемости вариант; n - число наблюдений.

Пример вычисления средней арифметической по способу моментов (средней массы тела

юношей в возрасте 18 лет)

V(n в кг) Р а (V-А) а. Р
+2 +4
+1 +3
М о =62
-1 -6
-2 -8
-3 -3
п = 25 Sар = - 10кг

Этапы расчета средней по способу моментов:

2) определяем "а" - условное отклонение варианты от условной средней, для этого из каждой варианты вычитаем условную среднюю: а = V - А, (например, а = 64 - 62 = +2 и т.д.).

3) умножаем условное отклонение "а" на частоту "р" каждой варианты и получаем произведение а р;

4) находим сумму Sа. р = - 10кг

5) рассчитываем среднюю арифметическую по способу моментов:

М = А + i SаР = 62 - 1×0,4 = 61,6кг

Таким образом, можно сделать вывод, что в изучаемой нами группе юношей средняя масса тела

Средняя арифметическая сама по себе ничего не говорит о том вариационном ряде, из которого

она была вычислена. На ее типичность (достоверность) влияет однородность рассматриваемого

материала и колеблемость ряда.

Пример: даны два одинаковых по числу наблюдений вариационных ряда, в которых

представлены данные измерений окружности головы детей в возрасте от 1 года до 2-х лет

Имея одинаковое число наблюдений и одинаковые средние арифметические (М= 46 см), ряды

имеют различия в распределении внутри. Так варианты первого ряда отклоняются в целом от

средней арифметической с меньшим значением, чем варианты второго ряда, что дает

возможность предположить, что средняя арифметическая (46 см) более типична для первого

ряда, чем для второго.

В статистике для характеристики разнообразия вариационного ряда употребляют среднее

квадратическое отклонение (s)

Существует два способа расчета среднего квадратического отклонения: среднеарифметический

способ и способ моментов. При среднеарифметическом способе расчета применяют формулу:

где d истинное отклонение каждой варианты от истиной средней М. Формула используется при

небольшом числе наблюдений (п <30)

Формула для определения s по способу моментов:

где а - условное отклонение варианты от условной средней ;

Момент второй степени, а момент первой степени, возведенный в квадрат.

Теоретически и практически доказано, что если при большом числе наблюдений к средней

арифметической прибавить и отнять от нее 1s (М ± 1s), то в пределах полученных величин

будет находится 68,3% всех вариант вариационного ряда. Если к средней арифметической

прибавить и отнять 2s (М± 2s), то в пределах полученных величин будет находиться 95,5%

всех вариант. М ±3s включает в себя 99,7% всех вариант вариационного ряда.

Исходя из этого положения можно проверить типичность средней арифметической для

вариационного ряда, из которого она была вычислена. Для этого надо к средней

арифметической прибавить и от нее отнять утроенную s (М± 3s). Если в полученные пределы

данный вариационный ряд укладывается, то средняя арифметическая типична, т.е. она

выражает основную закономерность ряда и ей можно пользоваться.

Указанное положение широко применяется при выработке различных стандартов (одежды,

обуви, школьной мебели и т.д).

Степень разнообразия признака в вариационном ряду можно оценить по коэффициенту

вариации (отношение среднего квадратического отклонения к средней арифметической,

умноженное на 100%)

С v = s х 100

При С v менее 10% отмечается слабое разнообразие, при С v 10-20% - среднее, а при более 20% -

сильное разнообразие признака.

Оценка достоверности реультатов статистического исследования

Как мы уже говорили, самые надежные результаты можно получать при применении

сплошного метода т.е. при изучении генеральной совокупности.

Между тем изучение генеральной совокупности связано со значительной трудоемкостью.

Поэтому в медико-биологических исследованиях, как правило, проводятся выборочные

наблюдения. С тем, чтобы полученные при изучении выборочной совокупности данные можно

было перенести на генеральную совокупность, необходимо провести оценку достоверности

результатов статистического исследования. Выборочная совокупность может недостаточно

полно представлять генеральную совокупность, поэтому выборочным наблюдениям всегда

сопутствует ошибка репрезентативности. По размерам средней ошибки (m) можно судить,

насколько найденная выборочная средняя величина отличается от средней генеральной

совокупности. Малая ошибка указывает на близость этих показателей, большая ошибка такой

уверенности не дает.

На величину средней ошибки средней арифметической влияют следуюие два обстоятельства.

Во-первых, однородность собранного материала: чем меньше разбросанность вариант вокруг

своей средней, тем меньше ошибка репрезентативности. Во-вторых, число наблюдений:

средняя ошибка будет тем меньше, чем больше число наблюдений.

Средняя ошибка средней арифметической вычисляетсяя по следующей формуле:

Средняя ошибка (ошибка репрезентативности) для относительных величин определяется по

формуле:

где m p - средняя ошибка показателя;

р - показатель в % или в % о

q - (100 -р), (1000 -р)

n - общее число наблюдений

Из лечебного учреждения выбыло 289 больных, из них умерло 12.

Относительная величина (показатель летальности) р = (12:289)х100 = 4,1%; q=100 -р =

100-4,1 =95,9, откуда

m p = ±

Таким образом, относительная величина при повторном исследовании будет соответствовать

Доверительные границы - это максимальное и минимальное значение в пределах которого

при заданной степени вероятности безошибочного прогноза может находиться относительный

показатель или средняя величина в генеральной совокупности

Доверительные границы относительной величины в генеральной совокупности определяют по

Р ген = Р выб ± tm m

Доверительные границы средней арифметической в генеральной совокупности определяется по формуле:

М ген = М выб ± tm m

где Р ген и М ген - значения относительной и средней величины, полученные для генеральной

совокупности.

Р выб и М выб - значения относительной и средней величины, полученные для выборочной совокупности.

m р и m m - ошибка репрезентативности для средних и относительных величин.

t - критерий достоверности.

Установлено, что если t= 1, достоверность не превышает 68%; если t=2 -95%; если t=3- 99%

При медицинских и биологических исследованиях считается достаточным, если критерий

достоверности t ³ 2(достоверность 95%)

Чтобы найти критерий t при числе наблюдений £ 30 необходимо воспользоваться специальной

таблицей

С уменьшением величины ошибки репрезентативности уменьшаются доверительные границы

средних и относительных величин, т.е.уточняются результаты исследования, приближаясь к

соответствующим величинам генеральной совокупности. Если ошибка репрезентативности

большая, то получают большие доверительные границы, которые могут противоречить

логической оценке искомой величины в генеральной совокупности. Доверительные границы

зависят также от избранной исследователем степени вероятности безошибочного прогноза. При

большой степени вероятности безошибочного прогноза размах доверительных границ

М ср - рассчитанная при помощи метода моментов = 61,6 кг

Средняя арифметическая величина обладает тремя свой­ствами.

1. Средняя занимает серединное положение в вариационном ряду . В строго симметричном ряду: М = М 0 =М е.

2. Средняя является обобщающей величиной и за средней не видны случайные колебания, различия в индивидуальных данных, она вскрывает то типичное, что характерно для всей совокуп­ности . К средней обращаются всякий раз, когда надо исклю­чить случайное влияние от­дельных факторов, выявить об­щие черты, существующие за­кономерности, получить полное и глубокое представление о наиболее общих и характерных особенностях всей группы.

3. Сумма отклоне­ний всех вариант от средней равна нулю : S (V-M)= 0 . Это происходит потому, что средняя величина превышает размеры одних вариант и мень­ше размеров других вариант.

Иначе говоря, истинное отклонение вариант от истинной средней (d =v-М) может быть положительной и отрицательной величи­ной, поэтому сумма S всех "+"d и "-"d равна нулю.

Данное свойство средней используется при проверке правильности расчетов М. Если сумма отклонений вариант от средней равна нулю, то можно сделать вывод, что средняя вычислена правильно. На этом свойстве основан способ моментов для определения М. Ведь если условная средняя А будет равна истинной М, то сумма отклонений вариант от условной средней будет равна нулю.

Роль средних величин в биологии чрезвычайно велика. С одной стороны их используют для характеристики явлений в целом, с другой - они необходимы для оценки отдельных величин. При сравнении отдельных величин со средними получают ценные харак­теристики для каждой из них. Использование средних величин требует строгого соблюдения принципа однородности совокупности. Нарушение этого принципа искажает представление о реальных процессах.

Вычисление средних из неоднородной в социально-экономическом отношении совокупности делает их фик­тивными, искаженными. Следовательно, для того чтобы правильно использовать средние величины, надо быть уверенным в том, что они характеризуют однородные статистические совокупности.

ХАРАКТЕРИСТИКА РАЗНООБРАЗИЯ ПРИЗНАКА В

СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ

Величина того или иного признака неодинакова у всех членов совокупности, несмотря на ее относительную однородность. Напри­мер, в группе детей, однородной по возрасту, полу и месту житель­ства, рост каждого ребенка отличается от роста сверстников. То же можно сказать о числе посещений, сделанных отдельными лицами в поликлинику, об уровне белка крови у каждого больного ревматизмом, об уровне артериального давления у отдельных лиц, больных гипертонической болезнью и т. п. В этом проявляется разнообразие, колеблемость признака в изучаемой совокупности. Вариабельность демонстративно можно представить на примере роста в группах подростков.



Статистика позволяет охарактеризовать это специальными крите­риями, определяющими уровень разнообразия каждого признака в той или иной группе. К таким критериям относятся лимит (lim), амплитуда ряда (Am), среднее квадратическое отклонение (s) и коффициент вариации (C v). Так как каждый из этих крите­риев имеет свое самостоятельное значение, то следует остановиться на них отдельно.

Лимит - опреде­ляется крайними значе­ниями вариант в вариа­ционном ряду

Амплитуда (Am) - разность край­них вариант

Лимит и амплитуда - дают определен­ную информацию о степени разнообразия роста в каждой группе. Однако как лимит, так и амплитуда ряда обладает одним существенным недостатком. Они учитывают только разно­образие крайних вариант и не позволяют получить информацию о разнообразии признака в совокупности с учетом ее внутренней структуры. Дело в том, что разнообразие проявляется не столько в крайних вариантах, сколько при анализе всей внутренней структуры группы. Поэтому этими критериями можно пользоваться для при­ближенной характеристики разнообразия, особенно при малом чис­ле наблюдений (n<30).

Наиболее полную характеристику разноо­бразию признака в совокупности дает так называемое среднее квадратическое отклоне­ние , обозначаемое греческой буквой "сигма" - s.

Существует два способа расчета среднего квадратического отклонения : среднеарифметический и способ моментов .

При сред­неарифметическом способе расчета применяют формулу, где d - истинное отклонение вариант от истинной средней (V-M).

Формула используется при небольшом числе наблюдений (n<30), когда в вариационном ряду все частоты р= 1.

При р > 1 используют формулу такого вида:

При наличии вычислительной техники эту формулу приме­няют и при большом количестве наблюдений.

Эта формула предназначена для определения "сигмы" по способу моментов:

где: a - условное отклонение от условной средней (V-A ); p - частота встречаемости для варианты; n - число вариант; i - величина интервала между группами.

Этот способ применяется в тех случаях, когда нет вычислитель­ной техники, а вариационный ряд громоздкий как за счет большого числа наблюдений, так и за счет вариант, выраженных многознач­ными числами. При числе наблюдений, равном 30 и менее, в момен­те второй степени п заменяют за (п -1).

Как видно из формулы среднего квадратичного отклонения (4), в знаменателе стоит (п -1), т.е. при числе наблюдений, равном или меньшем 30 (n£30), необходимо в знаменатель формулы брать (п -1). Если при определении средней арифметической М учиты­вают все элементы ряда, то, рассчитывая а, надо брать не все случаи, а на единицу меньше (п-1).

При большом числе наблюдений (n>30) в знаменатель формулы берут п, так как единица не изменяет результаты расчета и поэтому автоматически опускается.

Следует обратить внимание на то, что среднее квадратическое отклонение - именованная величина , поэтому оно должно иметь обозначение, общее для вариант и средней арифметической вели­чины (размерность – кг, см. км и др).

Расчет среднего квадратического отклонения по способу момен­тов производится после расчета средней величины.

Существует еще один критерий, характеризующий уровень раз­нообразия величин признака в совокупности, - коэффициент ва­риации .

Коэффициент вариации (Сv) - является относительной мерой разнообразия, так как исчисляется как процентное отноше­ние среднего квадратического отклонения (а) к средней арифме­тической величине (М). Формула коэффициента вариации такова:

Для ориентировочной оценки степени разнообразия признака пользуются следующими градациями коэффициента вариации. Если коэффициент составляет более 20%, то отмечают сильное разно­образие; при 20-10% - среднее, и если коэффициент менее 10%, то считают, что разнообразие слабое.

Коэффициент вариации применяют при сравнении степени раз­нообразия признаков, имеющих различия в величине признаков или неодинаковую их размерность. Допустим, необходимо сравнить степень разнообразия массы тела у новорожденных и 5-летних детей. Понятно, что у новорожденных "сигма" всегда будет меньше, чем у семилетних детей, так как меньше их индивидуальная масса. Среднее квадратическое отклонение будет меньше там, где меньше величина самого признака. В этом случае для определения различия в степени разнообразия необходимо ориентироваться не на среднее квадратическое отклонение, а на относительную меру разнообразия - коэффициент вариации Сv.

Большое значение коэффициент вариации также имеет для оцен­ки и сопоставления степени разнообразия нескольких признаков с разной размерностью. По среднему квадратическому отклонению нельзя еще судить о различии в сте­пени разнообразия указанных признаков. Для этого необходимо использовать коэффициент вариации – Сv.

Среднее квадратическое отклонение связано со структурой ряда распределения признака. Схематич­но это можно изобразить следующим образом.

Теорией статистики доказано, что при нормальном распределе­нии в пределах М±s находится 68% всех случаев, в пределах М±2s - 95,5% всех случаев, а в пределах М±3s - 99,7% всех случаев, составляющих совокупность. Таким образом, М±3s охва­тывает почти весь вариационный ряд.

Это теоретическое положение статистики о закономерностях структуры ряда имеет огромное значение для практического при­менения среднего квадратического отклонения. Можно восполь­зоваться этим правилом для выяснения - вопроса о типичности средней величины. Если 95% всех вариант находятся в пределах М±2s, то средняя - является характерной для данного ряда и не требуется увеличивать число наблюдений в совокупности. Для опре­деления типичности средней сравнивается фактическое распреде­ление с теоретическим, путем расчета сигмальных отклонений.

Практическое значение среднего квадратического отклонения заключается также в том, что зная М и s , можно построить необходимые вариационные ряды для практического использования. Сигму (s ) также используют для сравнения степени разнообразия однород­ных признаков, например при сравнении колебаний (вариабель­ности) роста детей в городе и селе местности. Зная сигму (s ), можно рассчитать коэффициент вариации (Сv), необходимой для сравнения степени разнообразия признаков, выраженных в различных единицах измерения (сантиметрах, килограммах и др.). Это позволяет выявить более устойчивые (постоянные) и менее устойчивые признаки в совокупности.

Сравнивая коэффициенты вариации (C v), можно сделать выводы о том, что является наиболее устойчивым признаком в совокупности признаков. Среднее квадратическое отклонение (s) используется также для оценки отдельных признаков у одного объекта. Стандартное отклонение указывает, на сколько сигм (s ) от средней (М) отклоняются индивидуальные измерения.

Среднее квадратическое отклонение (s) может быть исполь­зовано в биологии и экологии при разработке проблем нормы и патологии.

Наконец, среднее квадратическое отклонение является важным компонентом формулы т м - сред­ней ошибки средней арифметической (ошибки ре­презентативности):

где т м - средняя ошибка средней арифметической величины (ошибка репрезентативности), п - число наблюдений.

Репрезентативность. Важнейшие теоретические основы репрезентативности были освещены выше в разделе, посвященном выборочной и генеральной совокупности. Репрезентативность означает представительность в выборочной совокупности всех учитываемых признаков (пол, возраст, профессия, стаж и др.) единиц наблюдения, составляющих генеральную совокупность. Достигается эта репрезентативность выборочной совокупности по отношению к генеральной с помощью специальных методов отбора, которые излагаются ниже.

Оценка достоверности результатов исследования базируется на теоретических основах репрезентативности.

ОЦЕНКА ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ

Под достоверностью статистических показа­телей следует понимать степень их соответствия отображаемой ими действительности. Достоверными результатами считаются те, которые не искажают и правильно отражают объективную реальность.

Оценить достоверность результатов исследования означает определить, с какой вероятностью возможно перенести результаты, полученные на выборочной совокупности, на всю генеральную совокупность.

В большинстве исследований исследователю приходится, как правило, иметь дело с частью изучаемого явления, а выводы по результатам такого исследования переносить на все явление в целом - на генеральную совокупность.

Таким образом, оценка достоверности необходима для того, чтобы по части явления должно было бы судить о явлении в целом, о его закономерностях.

Оценка достоверности результатов исследования предусматривает определение:

1) ошибок репрезентативности (средних ошибок средних арифметических и относительных величин) - т ;

2) доверительных границ средних (или относительных) величин;

3) достоверности разности средних (или относительных) величин
(по критерию
t );

4) достоверности различия сравниваемых групп по критерию c 2 .

1. Определение средней ошибки средней (или относительной) величины (ошибки репре­зентативности) - т.

Ошибка репрезентативности (m ) является важнейшей стати­стической величиной, необходимой для оценки достоверности ре­зультатов исследования. Эта ошибка возникает в тех случаях, когда требуется по части охарактеризовать явление в целом. Эти ошибки неизбежны. Они проистекают из сущности выбороч­ного исследования; генеральная совокупность может быть охарак­теризована по выборочной совокупности только с некоторой по­грешностью, измеряемой ошибкой репрезентативности.

Ошибки репрезентативности нельзя смешивать с обычным пред­ставлением об ошибках: методических, точности измерения, ариф­метических и др.

По величине ошибки репрезентативности определяют, насколько результаты, полученные при выборочном наблюдении, отличаются от результатов, которые могли бы быть получены при проведении сплошного исследования всех без исключения элементов генераль­ной совокупности.

Этот единственный вид ошибок, учитываемых статистическими методами, которые не могут быть устранены, если не осуществлен переход на сплошное изучение. Ошибки репрезентативности можно свести к достаточно малой величине, т. е. к величине допустимой погрешности. Делается это путем привлечения в выборку достаточ­ного количества наблюдений (п).

Каждая средняя величина - М (средняя длительность лечения, средний рост, средняя масса тела, средний уровень белка крови и др.), а также каждая относительная величина - Р (уровень ле­тальности, заболеваемости и др.) должны быть представлены со своей средней ошибкой - т. Так, средняя арифметическая вели­чина выборочной совокупности (М) имеет ошибку репрезентатив­ности, которая называется средней ошибкой средней арифметической (m м) и определяется по формуле:

Как видно из этой формулы, величина средней ошибки средней арифметической прямо пропорциональна степени разнообразия признака и обратно пропорциональна корню квадратному из числа наблюдений. Следовательно, уменьшение величины этой ошибки при определении степени разнообразия (s ) возможно путем увели­чения числа наблюдений.

На этом принципе основан метод определения достаточного числа наблюдений для выборочного исследования.

Относительные величины (Р), полученные при выборочном исследовании, также имеют свою ошибку репрезентативности, которая называется средней ошибкой относительной величины и обозначается m р

Для определения средней ошибки относительной величины (Р) используется следующая формула:

где Р - относительная величина. Если показатель выражен в про­центах, то q=100-P, если Р- в промиллях, то q=1000-P, если Р- в продецимиллях, то q= 10000-Р и т.д.; п - число наблю­дений. При числе наблюдений менее 30 в знаменатель следует взять (п – 1 ).

Каждая средняя арифметическая или относительная величина, полученная на выборочной совокупности, должна быть представ­лена со своей средней ошибкой. Это дает возможность" рассчи­тать доверительные границы средних и относительных величин, а также определить достоверность разности сравниваемых пока­зателей (результатов исследования).

Различают три вида средних величин: мода (М0), медиана (Ме), сред­няя арифметическая (М).

Они не могут подменить друг друга и лишь в со­вокупности достаточно полно и в сжатой форме представляют собой осо­бенности вариационного ряда.

Мода (Мо) - наиболее часто встречающаяся в ряду распределения варианта. Она дает представление о центре распределения вариационного ряда. Используется:

Для определения центра распределения в открытых вариационных рядах

Для определения среднего уровня в рядах с резко асимметричным рас­пределением

Медиана - это серединная варианта, центральный член ранжирован­ного ряда. Название медиана взято из геометрии, где так именуется линия, делящая сторону треугольника на две равные части.

Медиана применяется:

Для определения среднего уровня признака в числовых рядах с нерав­ными интервалами в группах

Для определения среднего уровня признака, когда исходные данные представлены в виде качественных признаков и когда единственным способом указать некий центр тяжести совокупности является указа­ние варианты (группы вариант), которая занимает центральное поло­жение

При вычислении некоторых демографических показателей (средней продолжительности предстоящей жизни)

При определении наиболее рационального места расположения учре­ждений здравоохранения, коммунальных учреждений и т. п. (имеется в виду учет оптимальной удаленности учреждений от всех объектов обслуживания)

В настоящее время очень распространены различные опросы (марке­тинговые, социологические и др.), в которых опрашиваемых просят выста­вить баллы изделиям, политикам и т. п. Затем из полученных оценок рас­считывают средние баллы и рассматривают их как интегральные оценки, выставленные коллективом опрошенных. При этом обычно для определе­ния средних показателей применяют среднее арифметическое. Однако та­кой способ на самом деле применять нельзя. Обоснованным в этом случае является использование в качестве средних баллов медианы или моды.

Для характеристики среднего уровня признака наиболее часто ис­пользуется в медицине средняя арифметическая величина (М).

Средняя арифметическая величина - это общая количественная характеристика определенного признака изучаемых явлений, составляю­щих качественно однородную статистическую совокупность.

Различают среднюю арифметическую простую и взвешенную.

Средняя арифметическая простая вычисляется для не сгруппиро­ванного вариационного ряда путем суммирования всех вариант и делением этой суммы на общее количество вариант, входящих в вариационный ряд.

Вычисляется средняя арифметическая простая по формуле:

М - средняя арифметическая взвешенная,

∑Vp - сумма произведений вариант на их частоты,

n - число наблюдений.

Помимо указанного метода прямого расчета средней арифметической взвешенной, существуют другие методы, в частности, способ моментов при котором несколько упрощены арифметические расчеты.

Расчет средней арифметической способом моментов проводится по формуле:

М = А + ∑dp
n

А - условная средняя (чаще всего в качестве условной средней берет­ся мода М0)

d - отклонение каждой варианты от условной средней (V-A)

∑dp - сумма произведений отклонений на их частоту.

Порядок вычисления представлен в таблице (за условную среднюю принимаем М0 = 76 ударам в минуту).

частота пульса V Р d (V-A) dp
-16 -16
-14 -28
-12 -36
-10 -30
-8 -24
-6 -54
-4 -24
-2 -14
n= 54 | ∑dp= -200

где i - интервал между группами.

Порядок вычисления представлен в табл. (за условную среднюю при­нимаем М 0 = 73 ударам в минуту, где i = 3)

Определение средней арифметической способом моментов

n = 54 ∑dp = -13

М = А + ∑dp = 73+ -13*3 = 73 - 0,7=72,3 (ударов в минуту
n

Таким образом, полученное значение средней арифметической вели­чины по способу моментов идентично таковому, найденному обычным способом.

Методы вычисления средней арифметической (средней арифметической простой и взвешенной, по способу моментов)

Определяем средние величины:

Мода (Мо) =11, т.к. данная варианта встречается в вариационном ряду наиболее часто (р=6).

Медиана (Ме) - порядковый номер варианты занимающей срединное положение = 23, это место в вариационном ряду занимает варианта равная 11. Средняя арифметическая (М) позволяет наиболее полно охарактеризовать средний уровень изучаемого признака. Для вычисления средней арифметической используется два способа: среднеарифметический способ и способ моментов.

Если частота встречаемости каждой варианты в вариационном ряду равна 1, то рассчитывают среднюю арифметическую простую, используя среднеарифметический способ: М = .

Если частота встречаемости вариант в вариационном ряду отличается от 1, то рассчитывают среднюю арифметическую взвешенную, по среднеарифметическому способу:

По способу моментов: А - условная средняя,

М = A + =11 += 10.4 d=V-A, A=Mo=11

Если число вариант в вариационном ряду более 30, то строится сгруппированный ряд. Построение сгруппированного ряда:

1) определение Vmin и Vmax Vmin=3, Vmax=20;

2) определение количества групп (по таблице);

3) расчет интервала между группами i = 3;

4) определение начала и конца групп;

5) определение частоты вариант каждой группы (таблица 2).

Таблица 2

Методика построения сгруппированного ряда

Длительность

лечения в днях

n=45 p=480 p=30 2 p=766

Преимущество сгруппированного вариационного ряда заключается в том, что исследователь работает не с каждой вариантой, а только с вариантами, являющимися средними для каждой группы. Это позволяет в значительной степени облегчить расчеты средней.

Величина того или иного признака неодинакова у всех членов совокупности, несмотря на ее относительную однородность. Данную особенность статистической совокупности характеризует одно из групповых свойств генеральной совокупности - разнообразие признака . Например, возьмем группу мальчиков 12 лет и измерим их рост. После проведенных расчетов средний уровень данного признака составит 153 см. Но средняя характеризует общую меру изучаемого признака. Среди мальчиков данного возраста есть мальчики, рост которых составляет 165 см или 141 см. Чем больше мальчиков будут иметь рост отличный от 153 см, тем больше будет разнообразие этого признака в статистической совокупности.

Статистика позволяет охарактеризовать данное свойство следующим критериями:

лимит (lim),

амплитуда (Amp),

среднеквадратическое отклонение (у),

коэффициент вариации (Сv).

Лимит (lim) определяется крайними значениями вариант в вариационном ряду:

lim=V min /V max

Амплитуда (Amp) - разность крайних вариант:

Amp=V max -V min

Данные величины учитывают только разнообразие крайних вариант и не позволяют получить информацию о разнообразии признака в совокупности с учетом ее внутренней структуры. Поэтому данными критериями можно пользоваться для приближенной характеристики разнообразия, особенно при малом числе наблюдений (n<30).

вариационный ряд медицинская статистика

Расчеты средней арифметической могут быть громоздкими, если варианты (значения признака) и веса имеют очень большие или очень малые значения и затрудняется сам процесс подсчета. Тогда для простоты счета используется ряд свойств средней арифметической:

1) если уменьшить (увеличить) все варианты на какое-либо произвольное число А , то новая средняя уменьшится (увеличится) на то же число А , т. е. изменится на ±А ;

2) если уменьшить все варианты (значения признака) в одинаковое число раз (К ), то средняя уменьшится во столько же раз, а при увеличении в (К ) раз – увеличится в (К ) раз;

3) если уменьшить или увеличить веса (частоты) всех вариант на какое-либо постоянное число А , то средняя арифметическая не изменится;

4) сумма отклонений всех вариант от общей средней равна нулю.

Перечисленные свойства средней арифметической позволяют в случае необходимости упрощать расчеты путем замены абсолютных частот относительными, уменьшать варианты (значения признака) на какое-либо число А , сокращать их в К раз и рассчитывать среднюю арифметическую из уменьшенных вариант, а затем переходить к средней первоначального ряда.

Способ исчисления средней арифметической с использованием ее свойств известен в статистике как «способ условного нуля» , или «условной средней» , или как «способ моментов».

Кратко этот способ можно записать в виде формулы

Если уменьшенные варианты (значения признака ), обозначить через , то приведенную выше формулу можно переписать в виде .

При использовании формулы для упрощения исчисления средней арифметической взвешенной интервального ряда при определении величины какого-либо числа А используют такие приемы его определения.

Величина А равна величине:

1) первого значения средней величины интервала (продолжим на примере задачи, где млн дол., а .

Расчет средней из уменьшенных вариант

Интервалы Среднее значение интервала Число заводов, f Произведение
До 2 1,5 0 (1,5–1,5)
2–3 2,5 1 (2,5–1,5)
3–4 3,5 2 (3,5–1,5)
4–5 4,5 3 (4,5–1,5)
5–6 5,5 4 (5,5–1,5)
Свыше 6 6,5 5 (6,5–1,5)
Итого: 3,7

,

2) величину А берем равной величине среднего значения интервала с наибольшей частотой повторений, в данном случае А = 3,5 при (f = 30), или значение серединной варианты, или наибольшей варианты (в данном случае наибольшее значение признака Х = 6,5) и деленное на размер интервала (в данном примере 1).

Расчет средней при А = 3,5, f = 30, К = 1 на том же примере.

Расчет средней способом моментов

Интервалы Среднее значение интервала Число заводов, f Произведение
До 2 1,5 (1,5 – 3,5) : 1 = –2 –20
2–3 2,5 (2,5 – 3,5) : 1 = –1 –20
3–4 3,5 (3,5 – 3,5) : 1 = 0
4–5 4,5 (4,5 – 3,5) : 1 = 1
5–6 5,5 (5,5 – 3,5) : 1 = 2
Свыше 6 6,5 (6,5 – 3,5) : 1 = 3
Итого: 3,7

; ; ;

Способ моментов, условного нуля или условной средней заключается в том, что при сокращенном способе расчета средней арифметической мы выбираем такой момент, чтобы в новом ряду одной из значений признака , т. е. приравниваем и отсюда выбираем величину А и К .

Надо иметь в виду, что если (Х А ) : К , где К – равная величина интервала, то полученные новые варианты образуют в равноинтервальном ряду ряды натуральных чисел (1, 2, 3 и т. д.) положительных вниз и отрицательных вверх от нуля. Среднюю арифметическую из этих новых вариант называют моментом первого порядка и выражают формулой

.

Чтобы определить величину средней арифметической, нужно величину момента первого порядка умножить на величину того интервала (К ), на который делим все варианты, и прибавить к полученному произведению величину варианты (А ), которую вычитали.

;

Таким образом, способом моментов или условного нуля рассчитать среднюю арифметическую из вариационного ряда, если ряд равноинтервальный, значительно легче.

Мода

Мода – есть величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности.

Для дискретных рядов распределения модой будет значение варианты с наибольшей частотой.

Пример. При определении плана по производству мужских туфлей фабрикой было произведено изучение покупательского спроса по результатам продажи. Распределение проданной обуви характеризовалось следующими показателями:

Наибольшим спросом пользовалась обувь 41 размера и составила 30% от проданного количества. В этом ряду распределения М 0 = 41.

Для интервальных рядов распределения с равными интервалами мода определяется по формуле

.

Прежде всего, необходимо найти интервал, в котором находится мода, т. е. модальный интервал.

В вариационном ряду с равными интервалами модальный интервал определяется по наибольшей частоте, в рядах с неравными интервалами – по наибольшей плотности распределения, где: – величина нижней границы интервала, содержащего моду; – частота модального интервала; – частота интервала, предшествующего модальному, т. е. предмодального; – частота интервала, следующего за модальным, т. е. послемодального.

Пример расчета моды в интервальном ряду

Дана группировка предприятий по численности промышленно-про­из­вод­ственного персонала. Найти моду. В нашей задаче наибольшее число предприятий (30) имеет группировка с численностью работающих от 400 до 500 человек. Следовательно, этот интервал является модальным интервалом ряда распространения с равными интервалами. Введем следующие обозначения:

Подставим эти значения в формулу вычисления моды и произведем расчет:

Таким образом, мы определили значение модальной величины признака, заключенного в этом интервале (400–500), т. е. М 0 = 467 чел.

Во многих случаях при характеристике совокупности в качестве обобщающего показателя отдается предпочтение моде , а не средней арифметической. Так, при изучении цен на рынке фиксируется и изучается в динамике не средняя цена на определенную продукцию, а модальная. При изучении спроса населения на определенный размер обуви или одежды представляет интерес определение модального номера, а не средний размер, который вообще не имеет значения. Если средняя арифметическая близка по значению к моде, значит она типична.

ЗАДАЧИ ДЛЯ РЕШЕНИЯ

Задача 1

На сортосеменной станции при определении качества семян пшеницы было получено следующее определение семян по проценту всхожести:

Определить моду.

Задача 2

При регистрации цен в часы наиболее оживленной торговли у отдельных продавцов были зарегистрированы следующие цены фактической продажи (дол. за кг):

Картофель: 0,2; 0,12; 0,12; 0,15; 0,2; 0,2; 0,2; 0,15; 0,15; 0,15; 0,15; 0,12; 0,12; 0,12; 0,15.

Говядина: 2; 2,5; 2; 2; 1,8; 1,8; 2; 2,2; 2,5; 2; 2; 2; 2; 3; 3; 2,2; 2; 2; 2; 2.

Какие цены на картофель и говядину являются модальными?

Задача 3

Имеются данные о заработной плате 16 слесарей цеха. Найти модальную величину заработной платы.

В долларах: 118; 120; 124; 126; 130; 130; 130; 130; 132; 135; 138; 140; 140; 140; 142; 142.

Расчет медианы

Медианой в статистике называется варианта, расположенная в середине вариационного ряда. Если дискретный ряд распределения имеет нечетное число членов ряда, то медианой будет варианта, находящаяся в середине ранжированного ряда, т. е. к сумме частот прибавить 1 и все разделить на 2 – результат и даст порядковый номер медианы.

Если в вариационном ряду четное число вариант, тогда медианой будет половина суммы двух серединных вариант.

Для нахождения медианы в интервальном вариационном ряду определяем сначала медианный интервал по накопленным частотам. Таким интервалом будет такой, кумулятивная (накопленная) частота которого равна или превышает половину суммы частот. Накопленные частоты образуются путем постепенного суммирования частот, начиная от интервала с наименьшим значением признака.

Расчет медианы в интервальном вариационном ряду

Интервалы Частоты (f ) Кумулятивные (накопленные) частоты
60–70 10 (10)
70–80 40 (10+30)
80–90 90 (40+50)
90–100 15 (90+60)
100–110 295 (150+145)
110–120 405 (295+110)
120–130 485 (405+80)
130–140 500 (485+15)
Сумма: f = 500

Половина суммы накопленных частот в примере равна 250 (500: 2). Следовательно, медианным интервалом будет интервал со значением признака 100–110.

До этого интервала сумма накопленных частот составила 150. Следовательно, чтобы получить значение медианы, необходимо прибавить еще 100 единиц (250 – 150). При определении значения медианы предполагается, что значение признака в границах интервала распределяется равномерно. Следовательно, если 145 единиц, находящихся в этом интервале, распределить равномерно в интервале, равно 10, то 100 единицам будет соответствовать величина:

10: 145 ´ 100 = 6,9.

Прибавив полученную величину к минимальной границе медианного интервала, получим искомое значение медианы:

Или медиану в вариационном интервальном ряду можно исчислить по формуле:

,

где – величина нижней границы медианного интервала (); – величина медианного интервала ( =10); – сумма частот ряда (численность ряда 500); – сумма накопленных частот в интервале, предшествующем медианному ( = 150); – частота медианного интервала ( = 145).