Содержащий признаки статистические характеристики. Основные статистические характеристики ИСД. I. Организационный момент

Тема 2.1. Основы статистической обработки опытных данных в агрономических исследованиях. Статистические характеристики количественной и качественной изменчивости

План.

  1. Основы статистики
  2. Статистические характеристики количественной изменчивости
  3. Типы статистического распределения
  4. Методы проверки статистических гипотез

1. Основы статистики

Окружающий нас мир насыщен информацией - разнообразные потоки данных окружают нас, захватывая в поле своего действия, лишая правильного восприятия действительности. Не будет преувеличением сказать, что информация становится частью действительности и нашего сознания.

Без адекватных технологий анализа данных человек оказывается беспомощным в жестокой информационной среде и скорее напоминает броуновскую частицу, испытывающую жесткие удары со стороны и не имеющую возможности рационально принять решение.

Статистика позволяет компактно описать данные, понять их структуру, провести классификацию, увидеть закономерности в хаосе случайных явлений. Даже простейшие методы визуального и разведочного анализа данных позволяют существенно прояснить сложную ситуацию, первоначально поражающую нагромождением цифр.

Статистическое описание совокупности объектов занимает промежуточное положение между индивидуальным описанием каждого из объектов совокупности, с одной стороны, и описанием совокупности по её общим свойствам, совсем не требующим её расчленения на отдельные объекты, - с другой. По сравнению с первым способом статистические данные всегда в большей или меньшей степени обезличены и имеют лишь ограниченную ценность в случаях, когда существенны именно индивидуальные данные (например, учитель, знакомясь с классом, получит лишь весьма предварительную ориентировку о положении дела из одной статистики числа выставленных его предшественником отличных, хороших, удовлетворительных и неудовлетворительных оценок). С другой стороны, по сравнению с данными о наблюдаемых извне суммарных свойствах совокупности статистические данные позволяют глубже проникнуть в существо дела. Например, данные гранулометрического анализа породы (то есть данные о распределении образующих породу частиц по размерам) дают ценную дополнительную информацию по сравнению с испытанием нерасчленённых образцов породы, позволяя в некоторой мере объяснить свойства породы, условия её образования и прочее.

Метод исследования, опирающийся на рассмотрение статистических данных о тех или иных совокупностях объектов, называется статистическим. Статистический метод применяется в самых различных областях знания. Однако черты статистического метода в применении к объектам различной природы столь своеобразны, что было бы бессмысленно объединять, например, социально-экономическую статистику, физическую статистику.

Общие черты статистического метода в различных областях знания сводятся к подсчёту числа объектов, входящих в те или иные группы, рассмотрению распределения количеств, признаков, применению выборочного метода (в случаях, когда детальное исследование всех объектов обширной совокупности затруднительно), использованию теории вероятностей при оценке достаточности числа наблюдений для тех или иных выводов и т. п. Эта формальная математическая сторона статистических методов исследования, безразличная к специфической природе изучаемых объектов, и составляет предмет математическая статистика

Связь математической статистики с теорией вероятностей имеет в разных случаях различный характер. Теория вероятностей изучает не любые явления, а явления случайные и именно «вероятностно случайные», то есть такие, для которых имеет смысл говорить о соответствующих им распределениях вероятностей. Тем не менее, теория вероятностей играет определённую роль и при статистическом изучении массовых явлений любой природы, которые могут не относиться к категории вероятностно случайных. Это осуществляется через основанные на теории вероятностей теорию выборочного метода и теорию ошибок измерений. В этих случаях вероятностным закономерностям подчинены не сами изучаемые явления, а приёмы их исследования.

Более важную роль играет теория вероятностей при статистическом исследовании вероятностных явлений. Здесь в полной мере находят применение такие основанные на теории вероятностей разделы математической статистики, как теория статистической проверки вероятностных гипотез, теория статистической оценки распределений вероятностей и входящих в них параметров и так далее. Область же применения этих более глубоких статистических методов значительно уже, так как здесь требуется, чтобы сами изучаемые явления были подчинены достаточно определённым вероятностным закономерностям.

Вероятностные закономерности получают статистическое выражение (вероятности осуществляются приближённо в виде частот, а математические ожидания - в виде средних) в силу больших чисел закона.

Чтобы выявить и оценить лучшие агротехнические приемы и сорта, изучаемые в полевом опыте, применяют статистическую обработку данных опыта, представленных в виде поделяночных числовых показателей урожайности и других свойств и качеств подопытных растений. Эти показатели характеризуют изучаемое явление и отражают результат действия исследуемых факторов, проявившихся в конкретном месте за определенный период времени, со всеми искажениями, отступлениями от истинных данных вследствие различных причин, наблюдавшихся во время проведения опыта.

Статистика в широком понимании может быть определена как наука о количественном анализе массовых явлений природы и общества, служащем для выявления их качественных своеобразий.

Статистикой называется отрасль знаний, объединяющая принципы и методы с числовыми данными, характеризующими массовые явления. В этом смысле статистика включает в себя нескольких самостоятельных дисциплин: общую теорию статистики как вводный курс, теорию вероятностей и математическую статистику как науки об основных категориях и математических свойствах генеральной совокупности и их выборочных оценках.

Слово «статистика» происходит от латинского слова status - состояние, положение вещей. Первоначально оно употребляется в значении «политическое состояние». Отсюда итальянское слово stato – государство и statista – знаток государства. В научный обиход слово «статистика» вошло в 18 веке и первоначально употреблялось как «государствоведение».

В настоящее время статистика может быть определена как собирание массовых данных, их обобщение, представление, анализ и интерпретация. Это особый метод, который используется в различных сферах деятельности, в решении разнообразных задач.

Статистика позволяет выявить и измерить закономерности развития социально-экономических явлений и процессов, взаимосвязи между ними. Познание закономерностей возможно только в том случае, если изучаются не отдельные явления, а совокупности явлений, поскольку закономерности проявляются в полной мере, лишь в массе явлений. В каждом отдельном явлении необходимое – то, что присуще всем явлениям данного вида, проявляется в единстве со случайным, индивидуальным, присущим лишь этому конкретному явлению.

Закономерности, в которых необходимость неразрывно связана в каждом отдельном явлении со случайностью и лишь во множестве явлений проявляет себя закон, называются статистическими.

Соответственно предметом статистического изучения всегда выступают совокупности тех или иных явлений, включающие все множество проявлений исследуемой закономерности. В большой совокупности индивидуальные разнообразия взаимнопогашаются, и на первый план выходят закономерные свойства. Поскольку статистика призвана выявлять закономерное, она, опираясь на данные о каждом отдельном проявлении изучаемой закономерности, обобщает их и таким образом получает количественное выражение этой закономерности.

Каждый шаг исследования завершается интерпретацией полученных результатов: какое заключение можно сделать исходя из проведенного анализа, что говорят цифры – подтверждают ли они исходные предположения или открывают что-то новое? Интерпретация данных ограничена исходным материалом. Если заключения основаны на данных выборки, то она должна быть репрезентативной, чтобы выводы были отнесены к совокупности в целом. Статистика позволяет выяснить все то полезное, что содержится в исходных данных и определить, что и как можно использовать в принятии решений.

Термин вариационная статистика был введен в 1899году Дункером для обозначения методов математической статистики, применяемых при изучении некоторых биологических явлений. Несколько ранее, в 1889 году, Ф. Гальтоном был введен другой термин – биометрия (от греческих слов «биос» - жизнь и «метрейн» - измерять), обозначавший применение некоторых методов математической статистики при изучении наследственности, изменчивости и других биологических явлений. Основываясь на теории вероятностей, вариационная статистика позволяет правильно подойти к анализу количественного выражения изучаемых явлений, дать критическую оценку достоверности полученных количественных показателей, установить характер связи между изучаемыми явлениями, а, следовательно, понять их качественное своеобразие.

Важно помнить, что всякий биологический объект обладает изменчивостью. Т.е. каждый из признаков (высота растений, число зерен в колосе, содержание элементов питания) у различных особей может иметь различную степень выраженности, что свидетельствует о колеблемости или варьировании признака.

При статистическом методе исследования внимание сосредоточено не на отдельном объекте, а на группе однородных объектов, т.е. на некоторой их совокупности, объединенных для совместного изучения. Некоторое количество однородных единиц, расположенных по какому-либо одному или нескольким изменяющимся признакам, называется статистической совокупностью.

Статистические совокупности делятся на:

  1. генеральные
  2. выборочные

Генеральная совокупность объединяет все возможные изучаемые однородные единицы, например, растения на поле, популяции вредителей на поле, возбудители болезней растений. Выборочная совокупность представляет собой некоторую часть единиц, взятых из общей совокупности и попавших на проверку. При изучении, например, урожайности яблонь определенного сорта генеральную совокупность представляют все деревья данного сорта, возраста, произрастающие в определенных однородных условиях. Выборочная совокупность состоит из некоторого количества деревьев яблони, взятых на пробных площадках в изучаемых насаждениях.

Совершенно очевидно, что при статистических исследованиях приходится иметь дело исключительно с выборочными совокупностями. Правильность суждений о свойствах генеральной совокупности на основании анализа выборочной совокупности, прежде всего, зависит от ее типичности. Таким образом, чтобы выборка действительно отражала характерные свойства генеральной совокупности, выборочная совокупность должна объединять достаточное количество однородных единиц, обладающих свойством репрезентативности . Репрезентативность достигается случайным отбором вариант из генеральной совокупности, что обеспечивает равную возможность для всех членов генеральной совокупности попасть в состав выборки.

Статистическое изучение тех или иных явлений в своей основе имеет анализ изменчивости показателей или величин, входящих в состав статистических совокупностей. Статистические величины могут принимать разные значения, обнаруживая при этом в своей изменчивости некоторую закономерность. В связи с этим статистические величины можно определить как величины, принимающие различные значения с определенными вероятностями.

В процессе наблюдений или проведения опытов мы сталкиваемся с различными по своему роду изменчивыми показателями. Одни из них носят ярко выраженный количественный характер и легко поддаются измерениям, другие же не могут быть выражены обычным количественным путем и носят типичный качественный характер.

В связи с этим различают два типа изменчивости или варьирования:

  1. количественная
  2. качественная

2. Статистические характеристики количественной изменчивости

В качестве примера количественной изменчивости следует отнести: изменчивость количества колосков в колосе пшеницы, изменчивость размеров и веса семян, содержания в них жиров, белков и т.д. Примером качественного варьирования служат: изменение окраски или опушенности различных органов растения, гладкий и морщинистый горох, обладающий зеленой или желтой окраской, различная степень пораженности растений болезнями и вредителями.

Количественное варьирование в свою очередь может быть разделено на два рода: варьирование непрерывное и прерывистое .

Непрерывное варьирование объединяет случаи, когда изучаемые совокупности состоят из статистических единиц, определяемых измерениями или вычислением на основе этих измерений. Примером непрерывного варьирования можно выразить: вес и размеры семян, длина междоузлий, урожайность сельскохозяйственных культур. Во всех этих случаях изучаемые количественные показатели теоретически могут принимать все возможные значения, как целые, так и дробные между крайними своими пределами. Переход от крайнего минимального значения к максимальному теоретически является постепенным и может быть представлен сплошной линией.

При прерывистом варьировании отдельные статистические величины представляют собой совокупность отдельных элементов, выражаемую уже не измерением и не вычислением, а счетом. Примером такого варьирования могут служить изменение числа семян в плодах, числа лепестков в цветке, числа деревьев на единице площади, числа початков кукурузы на одном растении. Такого типа прерывистые варьирования называются также иногда целыми, потому, что отдельные статистические величины приобретают вполне определенные целые значения, в то время как при непрерывном варьировании эти величины могут выражаться и целыми, и дробными значениями.

Основными статистическими характеристиками количественной изменчивости являются следующие:

1.Средняя арифметическая;

Показатели изменчивости признака:

2. дисперсия;

3. стандартное отклонение;

4. коэффициент вариации;

5. Стандартная ошибка средней арифметической;

6. Относительная ошибка.

Cреднее арифметическое . При изучении варьирущих количественных показателей основной сводной величиной является их среднее арифметическое значение. Среднее арифметическое служит как для суждения об отдельных изучаемых совокупностях, так и для сравнения соответствующих совокупностей друг с другом. Полученные средние значения являются основой для построения выводов и для разрешения тех или иных практических вопросов.

Для вычисления среднего арифметического используют следующую формулу: если сумму всех вариант (x 1 + x 2 + … + x n) обозначить через Σ x i , число вариантов - через n, то средняя арифметическая определяется:

x ср. =Σ x i / n)

Среднее арифметическое дает первую общую количественную характеристику изучаемой статистической совокупности. При разрешении ряда теоретических и практических вопросов, наряду со знанием среднего значения анализируемого показателя, возникает необходимость в дополнительном установлении характера распределения вариант около этого среднего.

Объктам сельскохозяйственных и биологических исследований свойственна изменчивость признаков и свойств во времени и в пространстве. Причинами ее являются как внутренние, наследственные особенности организмов, так и различная норма их реакции на условия внешней среды.

Выявление характера рассеяния – одна из основных задач статистического анализа опытных данных, который позволяет не только оценить степень разброса наблюдений, но и использовать эту оценку для анализа и интерпретации результатов исследования.

Характер группировки вариант около их среднего значения, называемый также рассеянием, может служить показателем степени изменчивости изучаемого материала. Показатели изменчивости. Лимиты (размах варьирования) – это минимальное и максимальное значения признака в совокупности. Чем больше разность между ними, тем изменчивее признак.

Дисперсия S 2 и стандартное отклонение S . Эти статистические характеристики являются основными мерами вариации (рассеяния) изучаемого признака. Дисперсия (средний квадрат) – это частное от деления суммы квадратов отклонений Σ (x –x) 2 на число всех измерений без единицы:

Σ (x – x) 2 / n -1

Стандартное, или среднее квадратическое, отклонение получают путем извлечения квадратного корня из дисперсии:

S = √ S 2

Стандартное отклонение характеризует собой степень изменчивости изучаемого материала, меру степени влияния на признак различных второстепенных причин его варьирования, выраженных в абсолютных мерах, т.е. в тех же единицах измерения, что и отдельные значения вариант. В связи с этим стандартное отклонение может быть использовано только при сравнении изменчивости статистических совокупностей, варианты которых выражены в одинаковых единицах измерения.

В статистике принято считать, что диапазон изменчивости в совокупностях достаточно большого объема, которые находятся под постоянным влиянием множества разнообразных и разнонаправленных факторов (биологические явления), не выходят за пределы 3S от среднего арифметического значения. О таких совокупностях говорят, что они подчиняются нормальному распределению вариант.

Ввиду того, что диапазон изменчивости для каждой исследуемой биологической совокупности находится в пределах 3S от среднего арифметического, то чем больше величина стандартного отклонения, тем больше изменчивость признака в исследуемых совокупностях. Стандартное отклонение используется как самостоятельный показатель, так и в качестве основы для вычисления других показателей.

При сравнении изменчивости разнородных совокупностей необходимо пользоваться мерой варьирования, представляющей собой отвлеченное число. Для этой цели в статистике введен коэффициент вариации , под которым понимают стандартное отклонение, выраженное в процентах к средней арифметической данной совокупности:

V = S / x × 100%.

Коэффициент вариации позволяет дать объективную оценку степени варьирования при сравнении любых совокупностей. При изучении количественных признаков он позволяет выделить из них наиболее устойчивые. Изменчивость считают незначительной, если коэффициент вариации не превышает 10%, средней – если он от 10% до 20%, и значительной – если он более 20%.

На основании рассмотренных показателей приходим к суждению о качественном своеобразии всей генеральной совокупности. Очевидно, что степень надежности наших суждений о генеральной совокупности будет зависеть, прежде всего, от того, насколько в той или иной части выборочной совокупности ее индивидуальные, а также случайные особенности не мешают проявлению общих закономерностей и свойств изучаемого явления.

В связи с тем, что при проведении опытных работ и научных исследований в большинстве случаев мы не можем оперировать с очень большими по численному составу выборками, то возникает необходимость определения возможных ошибок в наших характеристиках изучаемого материала на основе этих выборок. Необходимо отметить, что под ошибками в данном случае следует понимать не погрешности в вычислениях тех или иных статистических показателей, а пределы возможных колебаний их значений по отношению ко всей совокупности .

Сопоставление отдельных найденных значений статистических показателей с возможными пределами их отклонений и служит, в конечном счете, критерием оценки надежности для полученных выборочных характеристик. Разрешение этого важного как в теоретическом, так и в практическом отношениях вопроса дает теория статистических ошибок.

Подобно тому, как распределяются варианты вариационного ряда около своего среднего, так же будут распределяться и частные значения средних, полученных из отдельных выборок. Т. е., чем сильнее будут варьировать изучаемые объекты, тем сильнее будут варьировать и частные значения. Вместе с тем, чем на большем числе вариант будут получены частные значения средних, тем ближе они будут к истинному значению среднего арифметического всей статистической совокупности. На основании выше изложенного ошибка выборочной средней (стандартная ошибка) является мерой отклонения выборочной средней от средней генеральной совокупности. Ошибки выборки возникают в результате неполной репрезентативности выборочной совокупности, а также при перенесении данных, полученных при изучении выборки, на всю генеральную совокупность. Величина ошибки зависит от степени изменчивости изучаемого признака и объема выборки.

Стандартная ошибка прямо пропорциональна выборочному стандартному отклонению и обратно пропорциональна корню квадратному из числа измерений:

S X = S / √ n

Ошибки выборки выражают в тех же единицах измерения, что и варьирующий признак и показывает те пределы, в которых может заключаться истинное значение среднего арифметического изучаемой генеральной совокупности. Абсолютная ошибка выборочной средней используется для установления доверительных границ в генеральной совокупности, достоверности выборочных показателей и разности, а также для установления объема выборки в научно-исследовательской работе.

Ошибка среднего может быть использована для получения показателя точности исследования - относительной ошибки выборочной средней. Это ошибка выборки, выраженная в процентах от соответствующей средней:

S X , % = S x / x ср × 100

Результаты считаются вполне удовлетворительными, если величина относительной ошибки не превышает 3-5% и соответствует удовлетворительному уровню, при 1-2% - очень высокая точность, 2-3% - высокая точность.

3. Типы статистического распределения

Частота проявления определенных значений признака в совокупности называется распределением. Различают эмпирические и теоретические распределения частот совокупности результатов наблюдений. Эмпирическое распределение – это распределение результатов измерений, полученных при изучении выборки. Теоретическое распределение предполагает распределение измерений на основании теории вероятностей. К их числу относятся: нормальное (Гауссово) распределение, распределение Стьюдента (t – распределение), F – распределение, распределение Пуассона, биноминальное.

Наибольшее значение в биологических исследованиях имеет нормальное или Гауссово распределение – это совокупность измерений, в котором варианты группируются вокруг центра распределения и их частоты равномерно убывают вправо и влево от центра распределения (x). Отдельные варианты отклоняются от средней арифметической симметрично, и размах вариации в обе стороны не превышает 3 σ . Нормальное распределение характерно для совокупностей, на членов которых суммарно влияет бесконечно большое количество разнообразных и разнонаправленных факторов. Каждый фактор вносит определенную часть в общую изменчивость признака. Бесконечные колебания факторов обусловливают изменчивость отдельных членов совокупностей.

Данный критерий был разработан Уильямом Госсеттом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны (а руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсетта вышла в журнале «Биометрика» под псевдонимом «Student» (Студент).

Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение. В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий. Существуют, однако, альтернативы критерию Стьюдента для ситуации с неравными дисперсиями.

В реальных исследованиях некорректное использование критерия Стьюдента осложняется также и тем, что подавляющее большинство исследователей не только не проверяют гипотезу о равенстве генеральных дисперсий, но не выполняют проверку и первого ограничения: нормальности в обеих сравниваемых группах. В итоге авторы таких публикаций вводят в заблуждение относительно истинных результатов проверки равенства средних как себя, так и своих читателей. Добавим к этому ещё и игнорирование проблемы множественных сравнений, когда авторы проводят попарные сравнения для трёх и большего числа сравниваемых групп. Отметим, что подобной статистической неряшливостью страдают не только начинающие аспиранты и соискатели, но и специалисты облечённые различными академическими и руководящими регалиями: академики, ректоры университетов, доктора и кандидаты наук, и многие другие учёные.

Результатом игнорирования ограничений для t-критерия Стьюдента является заблуждение авторов статей и диссертаций, а далее и читателей этих публикаций, относительно истинного соотношения генеральных средних сравниваемых групп. Так в одном случае принимается вывод о значимом различии средних, когда они на самом деле не различаются, в другом – наоборот, принимается вывод об отсутствии значимого различия средних, когда такое различие имеется.

Почему важно Нормальное распределение? Нормальное распределение важно по многим причинам. Распределение многих статистик является нормальным или может быть получено из нормальных с помощью некоторых преобразований. Рассуждая философски, можно сказать, что нормальное распределение представляет собой одну из эмпирически проверенных истин относительно общей природы действительности и его положение может рассматриваться как один из фундаментальных законов природы. Точная форма нормального распределения (характерная «колоколообразная кривая») определяется только двумя параметрами: средним и стандартным отклонением.

Характерное свойство нормального распределения состоит в том, что 68% всех его наблюдений лежат в диапазоне ± 1 стандартное отклонение от среднего, а диапазон; ± 2 стандартных отклонения содержит 95% значений. Другими словами, при нормальном распределении, стандартизованные наблюдения, меньшие -2 или большие +2, имеют относительную частоту менее 5% (Стандартизованное наблюдение означает, что из исходного значения вычтено среднее и результат поделен на стандартное отклонение (корень из дисперсии)). Если у вас имеется доступ к пакету STATISTICA, Вы можете вычислить точные значения вероятностей, связанных с различными значениями нормального распределения, используя Вероятностный калькулятор; например, если задать z-значение (т.е. значение случайной величины, имеющей стандартное нормальное распределение) равным 4, соответствующий вероятностный уровень, вычисленный STATISTICA будет меньше.0001, поскольку при нормальном распределении практически все наблюдения (т.е. более 99,99%) попадут в диапазон ± 4 стандартных отклонения.

Графическое выражение этого распределения называется Гауссовой кривой, или кривой нормального распределения. Опытным путем установлено, что такая кривая часто повторяет форму гистограмм, получающихся при большом числе наблюдений.

Форма кривой нормального распределения и ее положение определяются двумя величинами: генеральной средней и стандартным отклонением.

В практических исследованиях непосредственно формулой не пользуются, а прибегают к помощи таблиц.

Максимум, или центр, нормального распределения лежит в точке x = μ точка перегиба кривой находится при x1= μ - σ и x2= μ + σ , при n = ± ∞ кривая достигает нулевого значения. Размах колебаний от μ вправо и влево зависит от величины σ и укладывается в пределах трех стандартных отклонений:

1. В области пределов μ + σ находится 68,26% всех наблюдений;

2. Внутри пределов μ + 2 σ находится 95,46% всех значений случайной величины;

3. В интервале μ + 3σ находится 99,73%, практически все значения признака.

Все ли статистики критериев нормально распределены? Не все, но большинство из них либо имеют нормальное распределение, либо имеют распределение, связанное с нормальным и вычисляемое на основе нормального, такое как t, F или хи-квадрат. Обычно эти критериальные статистики требуют, чтобы анализируемые переменные сами были нормально распределены в совокупности. Многие наблюдаемые переменные действительно нормально распределены, что является еще одним аргументом в пользу того, что нормальное распределение представляет "фундаментальный закон". Проблема может возникнуть, когда пытаются применить тесты, основанные на предположении нормальности, к данным, не являющимся нормальными. В этих случаях вы можете выбрать одно из двух. Во-первых, вы можете использовать альтернативные "непараметрические" тесты (так называемые "свободно распределенные критерии", см. раздел Непараметрическая статистика и распределения). Однако это часто неудобно, потому что обычно эти критерии имеют меньшую мощность и обладают меньшей гибкостью. Как альтернативу, во многих случаях вы можете все же использовать тесты, основанные на предположении нормальности, если уверены, что объем выборки достаточно велик. Последняя возможность основана на чрезвычайно важном принципе, позволяющем понять популярность тестов, основанных на нормальности. А именно, при возрастании объема выборки, форма выборочного распределения (т.е. распределение выборочной статистики критерия, этот термин был впервые использован в работе Фишера, Fisher 1928a) приближается к нормальной, даже если распределение исследуемых переменных не является нормальным. Этот принцип иллюстрируется следующим анимационным роликом, показывающим последовательность выборочных распределений (полученных для последовательности выборок возрастающего размера: 2, 5, 10, 15 и 30), соответствующих переменным с явно выраженным отклонением от нормальности, т.е. имеющих заметную асимметричность распределения.

Однако по мере увеличения размера выборки, используемой для получения распределения выборочного среднего, это распределение приближается к нормальному. Отметим, что при размере выборки n=30, выборочное распределение "почти" нормально (см. на близость линии подгонки).

Статистическая надежность, или уровень вероятности – это площадь под кривой, ограниченная от среднего на t стандартных отклонений, выраженная в процентах от всей площади. Иными словами, это вероятность появления значения признака, лежащего в области μ + t σ. Уровень значимости – это вероятность того, что значение изменяющегося признака находится вне пределов μ + t σ, то есть, уровень значимости указывает вероятность отклонения случайной величины от установленных пределов варьирования. Чем больше уровень вероятности, тем меньше уровень значимости.

В практике агрономических исследований считается возможным пользоваться вероятностями 0,95 – 95% и 0,99 – 99%, которым называют доверительными, то есть такие, которым можно доверять и уверенно пользоваться. Так, при вероятности 0,95 – 95% возможность сделать ошибку 0,05 – 5%, или 1 на 20; при вероятности 0,99 – 99% - соответственно 0,01 – 1%, или 1 на 100.

Аналогичный подход применим и к распределению выборочных средних, так как всякое исследование сводится к сравнению средних величин, подчиняющихся закону нормального распределения. Средняя μ, дисперсия σ 2 и стандартное отклонение σ – параметры генеральной совокупности при n > ∞. Выборочные наблюдения позволяют получить оценки этих параметров. Для больших выборок (n>20-30, n>100) закономерности нормального распределения объективны для их оценок, то есть в области x ± S находится 68,26%, x ± 2S - 95,46%, x ± 3S – 99,73% всех наблюдений. Средняя арифметическая и стандартное отклонение причисляют к основным характеристикам, при помощи которых задается эмпирическое распределение измерений.

4. Методы проверки статистических гипотез

Выводы из любого сельскохозяйственного или биологического эксперимента нужно оценить с учетом их значимости, или существенности. Такую оценку проводят путем сравнения вариантов опыта друг с другом, либо с контролем (стандартом), или с теоретически ожидаемым распределением.

Статистическая гипотеза – научное предположение о тех или иных статистических законах распределения рассматриваемых случайных величин, которое может быть проверено на основе выборки. Сравнивают совокупности путем проверки нулевой гипотезы – об отсутствии реального различия между фактическими и теоретическими наблюдениями, пользуясь наиболее подходящим статистическим критерием. Если в результате проверки различия между фактическими и теоретическими показателями близки к нулю или находятся в области допустимых значений, то нулевая гипотеза не опровергается. Если же различия оказываются в критической для данного статистического критерия области, невозможны при нашей гипотезе и поэтому несовместимы с ней, нулевая гипотеза опровергается.

Принятие нулевой гипотезы означает, что данные не противоречат предположению об отсутствии различий между фактическими и теоретическими показателями. Опровержение гипотезы означает, что эмпирические данные несовместимы с нулевой гипотезой и верна другая, альтернативная гипотеза. Справедливость нулевой гипотезы проверяется вычислением статистических критериев проверки для определенного уровня значимости.

Уровень значимости характеризует, в какой мере мы рискуем ошибиться, отвергая нулевую гипотезу, т.е. какова вероятность отклонения от установленных пределов варьирования случайной величины. Поэтому, чем больше уровень вероятности, тем меньше уровень значимости.

Понятие о вероятности неразрывно связано с понятием о случайном событии. В сельскохозяйственных и биологических исследованиях вследствие присущей живым организмам изменчивости под влиянием внешних условий появление события может быть случайным либо неслучайным. Неслучайными будут такие события, которые выходят за пределы возможных случайных колебаний выборочных наблюдений. Это обстоятельство позволяет определить вероятность появления как случайных, так и неслучайных событий.

Таким образом, вероятность – мера объективной возможности события, отношение числа благопрятных случаев к общему числу случаев. Уровень значимости показывает вероятность, с которой проверяемая гипотеза может дать ошибочный результат. В практике сельскохозяйственных исследований считается возможным пользоваться вероятностями 0,95 (95%) и 0.99 (99%), которым соответствуют следующие уровни значимости 0,05 – 5% и 0,01 – 1%. Эти вероятности получили название доверительных вероятностей, т.е. таких, которым можно доверять.

Статистические критерии, используемые для оценки расхождения между статистическими совокупностями, бывают двух видов:

1) параметрические (для оценки совокупностей, имеющих нормальное распределение);

2) непараметрические (применяют к распределениям любой формы).

В практике сельскохозяйственных и биологических исследований встречаются два типа опытов.

В некоторых опытах варианты связаны друг с другом одним или несколькими условиями, контролируемыми исследователем. Вследствие этого опытные данные варьируют не независимо, а сопряженно , так как влияние условий, связывающих варианты, проявляется, как правило, однозначно. К такого типа опытам относятся, например, полевое испытание с повторностями, каждая из которых располагается на участке сравнительно одинакового плодородия. В таком опыте сопоставлять варианты друг с другом можно только в пределах повторения. Другой пример связанных наблюдений – изучение фотосинтеза; здесь объединяющим условием являются особенности каждого подопытного растения.

Наряду с этим часто сравнивают совокупности, варианты которых изменяются независимо друг от друга. Несопряженными, независимыми являются варьирование признаков растений, выращенных в разных условиях; в вегетационных опытах повторностями служат сосуды одноименных вариантов, и любой сосуд одного варианта можно сравнивать с любым сосудом другого.

Статистическая гипотеза - некоторое предположение о законе распределения случайной величины или о параметрах этого закона в рамках данной выборки.

Пример статистической гипотезы: "генеральная совокупность распределена по нормальному закону", "различие между дисперсиями двух выборок незначимо" и т.д.

При аналитических расчетах часто необходимо выдвигать и проверять гипотезы. Проверка статистической гипотезы осуществляется с помощью статистического критерия в соответствии со следующим алгоритмом:

Гипотеза формулируется в терминах различия величин. Например, есть случайная величина x и константа a. Они не равны (арифметически), но нужно установить, значимо ли статистически между ними различие?

Существует два типа критериев:

Необходимо отметить, что знаки ≥, ≤, = здесь используются не в арифметическом, а в «статистическом» смысле. Их необходимо читать «значимо больше», «значимо меньше», «различие незначимо».

Метод по критерию t-Стъюдента

При сравнении средних двух независимых выборок применяют метод по t – критерию Стьюдента , предложенный английским ученым Ф. Госсетом. С помощью данного метода оценивается существенность разности средних (d = x 1 – x 2). Он основан на расчете фактических и табличных значений и их сравнении.

В теории статистики ошибка разности или суммы средних арифметических независимых выборок при одинаковом числе наблюдений (n 1 + n 2) определяется по формуле:

S d = √ S X1 2 + S X2 2 ,

где S d - ошибка разности или суммы;

S X1 2 и S X2 2 - ошибки сравниваемых средних арифметических.

Гарантией надежности вывода о существенности или несущественности различий между средними арифметическими служит отношение разницы к ее ошибке. Это отношение получило название критерия существенности разности:

t = x 1 – x 2 / "√ S X1 2 + S X2 2 = d / S d .

Теоретическое значение критерия t находят по таблице, зная число степеней свободы Y = n 1 + n 2 – 2 и принятый уровень значимости.

Если t факт ≥ t теор, нулевая гипотеза об отсутствии существенности различий между средними опровергается, а если различия находятся в пределах случайных колебаний для принятого уровня значимости – не опровергается.

Метод интервальной оценки

Интервальная оценка характеризуется двумя числами – концами интервала, покрывающего оцениваемый параметр. Для этого следует определить доверительные интервалы для возможных значений средней генеральной совокупности. При этом, x является точечной оценкой генеральной средней, тогда точечную оценку генеральной средней можно записать так: x ± t 0,5 *S X , где t 0,5 *S X предельная ошибка выборочной средней при данном числе степеней свободы и принятом уровне значимости.

Доверительный интервал – это такой интервал, который с заданной вероятностью покрывает оцениваемый параметр. Центр интервала – выборочная оценка точки. Пределы, или доверительные границы, определяются средней ошибкой оценки и уровнем вероятности – x - t 0,5 *S X и x + t 0,5 *S X . Значение критерия Стьюдента для различных уровней значимости и числа степеней свободы приводятся в таблице.

Оценка разности средних сопряженных рядов

Оценку разности средних для сопряженных выборок вычисляют разностым методом. Сущность состоит в том, что оценивается существенность средней разности путем попарного сравнения вариантов опыта. Для нахождения S d разностным методом вычисляют разность между сопряженными парами наблюдений d, определяют значение средней разности (d = Σ d / n) и ошибку средней разности по формуле:

S d = √ Σ (d - d) 2 / n (n – 1)

Критерий существенности вычисляют по формуле: t = d / S d . Число степеней свободы находят по равенству Y= n-1, где n-1 – число сопряженных пар.

Контрольные вопросы

  1. Что такое вариационная статистика (математическая, биологическая статистика, биометрия)?
  2. Что называется совокупностью? Виды совокупностей.
  3. Что называется изменчивостью, вариацией? Виды изменчивости.
  4. Дайте определение вариационного ряда.
  5. Назовите статистические показатели количественной изменчивости.
  6. Расскажите о показателях изменчивости признака.
  7. Как вычисляется дисперсия, ее свойства?
  8. Какие вы знаете теоретические распределения?
  9. Что такое среднее квадратическое отклонение, его свойства?
  10. Какие вы знаете закономерности нормального распределения?
  11. Назовите показатели качественной изменчивости и формулы их вычисления.
  12. Что такое доверительный интервал и статистическая надежность?
  13. Что такое абсолютная и относительная ошибка выборочной средней, как их вычислить?
  14. Коэффициент вариации и его вычисление при количественной и качественной изменчивости.
  15. Назовите статистические методы проверки гипотез.
  16. Дайте определение статистической гипотезы.
  17. Что такое нулевая и альтернативная гипотеза?
  18. Что такое доверительный интервал?
  19. Что такое сопряженные и независимые выборки?
  20. Как вычисляется интервальная оценка параметров генеральной совокупности?

Предварительная информация по МЕТОДАМ ОБРАБОТКИ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА

ПОДГОТОВКА ПЕРВИЧНЫХ ДАННЫХ К АНАЛИЗУ

Наблюдая и измеряя характеристики объекта, экспериментатор собирает первичный статистический материал. Дальнейшая задача состоит в такой обработке и представлении первичных данных, которые позволили бы оценить и сопоставить результаты для проверки гипотез, для выявления существенных свойств и закономерностей изучаемого процесса. В основе методов обработки лежит предварительное упорядочение, cиcтeмaтизaция первичных данных и вычисление их статистических характеристик.

Обобщенный алгоритм подготовки данных может быть представлен следующим операциями:
а) все данные формулируются и записываются в необходимой краткой форме;
б) проводится группировка данных, то есть распределение их на однородные группы в соответствии с интересующими экспериментатора признаками. Данные в каждой группе упорядочиваются - классифицируются, сортируются, структурируются в соответствии с той моделью, которая разрабатывалась при составлении плана-программы устанавливаются характеристики (признаки, параметры каждой группы данных и производится подсчет абсолютного числа факторов, характеризующих группуг) данные внутри каждой сформированной группы располагаются в ряд (вариационный ряд) по убыванию или возрастанию признака. Определяется наибольшее и наименьшее значения признака;
д) вариационные ряды данных, полученных в номинальной или порядковой шкале, ранжируются. Интервалы группировки по рангам выбираются оптимальными (слишком крупные интервалы скрывают нюансы явлений, слишком дробные - затрудняют o6pаботку). В результате этой операции появляются новые количественные данные;
е) проводится статистическая обработка полученных количественных данных, заключающаяся в вычислении некоторых статистических характероистик и оценок, позволяющих глубже понять особенности экспериментальных явлений;
ж) составляются наглядные материалы, отображающие полученную информацию: таблицы, графики, диаграммы, схемы и др., по которым в дальнейшем устанавливаются и анализируются связи между параметрами экспериментальных объектов.

СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ

Экспериментатору необходимо знание ряда простейших понятий математической статистики и умение с ними работать.
Все множество интересующих исследователя однородных явлений, событий или их показателей называется генеральной совокупностью данных объектов. Та часть последней, которая подвергается экспериментальному изучению, называется выборочными совокупностью или выборкой.
Величина (объем) выборки представляет собой абсолютное (счетное) количество однородных объектов исследования (явлений, событий или их характеристик).
Выборка характеризуется рядом статистических характеристик, наиболее употребительными из которых являются: среднее арифметическое значение, дисперсия, среднее квадратичное отклонение среднего арифметического.

Среднее значение данного показателя выборочной совокупности (арифметическое среднее, выборочное среднее ) - это отношение суммы всех измеренных значений показателя к величине выборки.

Если в выборке есть повторяющиеся значения, то составляется таблица сгруппированных данных, следующего вида:

Тогда = , где n= .

Среднее значение недостаточно полно характеризует выборку; за ним скрывается “поведение” самого показателя явления-“разброс”, различное распределение его значений около среднего (так называемая “функция распределения”).

Выборочной дисперсией (s 2) статистического показателя называется среднее значение квадратов отклонений отдельных его значений от среднего выборочного; дисперсия определяется по формуле:

S 2 = (2)

Для сгруппированных данных S 2 = .

Выборочнымсредним квадратическим отклонением называется корень квадратный из выборочной дисперсии.

Выборочные дисперсия и среднее квадратичное отклонение играют большую роль при определении степени достоверности результатов.
Генеральная совокупность также обладает всеми вышеперечисленными статистическими характеристиками, которые в общем случае не совпадают с характеристиками выборки. Для эксперимента особое значение, имеет оценка той ошибки, которая допускается, если по выборочным характеристикам судить о генеральной совокупности.
В практике вычислений величина расхождения средних значений генеральной и выборочной совокупностей определяется средней квадратической ошибкой выборочного среднего, которая вычисляется по формуле

Мода - это наиболее часто встречающеесязначение в выборке. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей. Модой для дискретного ряда является значение, обладающая наибольшей частотой.

Медиана - это значение признака, которое лежит в основе ранжированного ряда и делит этот ряд на две равные по численности части.

Для определения медианы в дискретном ряду при наличии частот сначала вычисляют полусумму частот , а затем определяют, какое значение признака приходится на нее. (Если отсортированный ряд содержит нечетное число признаков, то значение среднего в упорядоченном ряду будет медианой, порядковый номер медианы вычисляют по формуле:

(n + 1)/2,

в случае четного числа признаков медиана будет равна среднему арифметическому из двух признаков находящихся в середине ряда.

Основные статистические характеристики делят на две основные группы: меры центральной тенденции и характеристики вариации.

Центральную тенденцию выборки позволяют оценить такие статистические характеристики, как среднее арифметическое значение, мода, медиана.

Наиболее просто получаемой мерой центральной тенденции является мода. Мода (Мо) – это такое значение в множестве наблюдений, которое встречается наиболее часто. В совокупности значений (2, 6, 6, 8, 7, 33, 9, 9, 9, 10) модой является 9, потому что оно встречается чаще любого другого значения. В случае, когда все значения в группе встречаются одинаково часто, считают, что эта группа не имеет моды.

Когда два соседних значения в ранжированном ряду имеют одинаковую частоту и они больше частоты любого другого значения, мода есть среднее этих двух значений.

Если два несмежных значения в группе имеют равные частоты, и они больше частот любого значения, то существуют две моды (например, в совокупности значений 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 модами являются 11 и 14); в таком случае группа измерений или оценок является бимодальной .

Наибольшей модой в группе называется единственное значение, которое удовлетворяет определению моды. Однако во всей группе может быть несколько меньших мод. Эти меньшие моды представляют собой локальные вершины распределения частот.

Медиана (Me) – середина ранжированного ряда результатов измерений. Если данные содержат четное число различных значений, то медиана есть точка, лежащая посередине между двумя центральными значениями, когда они упорядочены.

Среднее арифметическое значение для неупорядоченного ряда измерений вычисляют по формуле:

где . Например, для данных 4,1; 4,4; 4,5; 4,7; 4,8 вычислим :

.

Каждая из выше вычисленных мер центра является наиболее пригодной для использования в определенных условиях.

Мода вычисляется наиболее просто – ее можно определить на глаз. Более того, для очень больших групп данных это достаточно стабильная мера центра распределения.

Медиана занимает промежуточное положение между модой и средним с точки зрения ее вычисления. Эта мера получается особенно легко в случае ранжированных данных.

Среднее множество данных предполагает в основном арифметические операции.

На величину среднего влияют значения всех результатов. Медиана и мода не требуют для определения всех значений. Посмотрим, что произойдет со средним, медианой и модой, когда удвоится максимальное значение в следующем множестве:

Множество 1: 1, 3, 3, 5, 6, 7, 8 33/7 5 3

Множество 2: 1, 3, 3, 5, 6, 7, 16 41/7 5 3

На величину среднего особенно влияют результаты, которые называют “выбросами”, т.е. данные, находящиеся далеко от центра группы оценок.

Вычисление моды, медианы или среднего – чисто техническая процедура. Однако выбор из этих трех мер и их интерпретация зачастую требуют определенного размышления. В процессе выбора следует установить следующее:

– в малых группах мода может быть совершенно нестабильной. Например, мода группы: 1, 1, 1, 3, 5, 7, 7, 8 равна 1; но если одна из единиц превратится в нуль, а другая – в два, то мода будет равна 7;

– на медиану не влияют величины “больших” и “малых” значений. Например, в группе из 50 значений медиана не изменится, если наибольшее значение утроится;

– на величину среднего влияет каждое значение. Если одно какое-нибудь значение меняется на c единиц, изменится в том же направлении на c/n единиц;

– некоторые множества данных не имеют центральной тенденции, что часто вводит в заблуждение при вычислении только одной меры центральной тенденции. Особенно это справедливо для групп, имеющих более чем одну моду;

– когда считают, что группа данных является выборкой из большой симметричной группы, среднее выборки, вероятно, ближе к центру большой группы, чем медиана и мода.

Все средние характеристики дают общую характеристику ряда результатов измерений. На практике нас часто интересует, как сильно каждый результат отклоняется от среднего значения. Однако легко можно представить, что две группы результатов измерений имеют одинаковые средние, но различные значения измерений. Например, для ряда 3, 6, 3 – среднее значение = 4; для ряда 5, 2, 5 – также среднее значение = 4, несмотря на существенное различие этих рядов.

Поэтому средние характеристики всегда необходимо дополнять показателями вариации, или колеблемости.

К характеристикам вариации , или колеблемости , результатов измерений относят размах варьирования, дисперсию, среднее квадратическое отклонение, коэффициент вариации, стандартную ошибку средней арифметической.

Самой простой характеристикой вариации является размах варьирования . Его определяют как разность между наибольшим и наименьшим результатами измерений. Однако он улавливает только крайние отклонения, но не отражает отклонений всех результатов.

Чтобы дать обобщающую характеристику, можно вычислить отклонения от среднего результата. Например, для ряда 3, 6, 3 значения будут следующими: 3 – 4 = – 1; 6 – 4 = 2; 3 – 4 = – 1. Сумма этих отклонений (– 1) + 2 + (– 1) всегда равна 0. Чтобы избежать этого, значения каждого отклонения возводят в квадрат: (– 1) 2 + 2 2 + (– 1) 2 = 6.

Значение делает отклонения от средней более явственными: малые отклонения становятся еще меньше (0,5 2 =0,25), а большие – еще больше (5 2 = 25). Получившуюся сумму называют суммой квадратов отклонений . Разделив эту сумму на число измерений, получают средний квадрат отклонений, или дисперсию . Она обозначается s 2 и вычисляется по формуле:

.

Если число измерений не более 30, т.е. n ≤ 30, используется формула:

.

Величина n – 1 = k называется числом степеней свободы , под которым подразумевается число свободно варьирующих членов совокупности. Установлено, что при вычислении показателей вариации один член эмпирической совокупности всегда не имеет степени свободы.

Эти формулы применяются, когда результаты представлены неупорядоченной (обычной) выборкой.

Из характеристик колеблемости наиболее часто используется среднее квадратическое отклонение , которое определяется как положительное значение корня квадратного из значения дисперсии, т.е.:

.

Среднее квадратическое отклонение или стандартное отклонение характеризует степень отклонения результатов от среднего значения в абсолютных единицах и имеет те же единицы измерения, что и результаты измерения.

Однако для сравнения колеблемости двух и более совокупностей, имеющих различные единицы измерения, эта характеристика не пригодна.

Коэффициент вариации определяется как отношение среднего квадратического отклонения к среднему арифметическому, выраженное в процентах. Вычисляется он по формуле:

.

В спортивной практике колеблемость результатов измерений в зависимости от величины коэффициента вариации считают небольшой
(0 – 10 %), средней (11 – 20 %) и большой (V > 20 %).

Коэффициент вариации имеет большое значение в статистической обработке результатов измерений, т. к., будучи величиной относительной (измеряется в процентах), позволяет сравнивать между собой колеблемость результатов измерений, имеющих различные единицы измерения. Коэффициент вариации можно использовать лишь в том случае, если измерения выполнены в шкале отношений.

2.4.2. Анализ статистических данных в MS Excel. Инструменты анализа: описательная статистика, корреляция.

В состав электронных таблиц Microsoft Excel входит так называемый пакет анализа – набор инструментов, предназначенный для решения сложных статистических задач. Данный пакет производит анализ статистических данных с помощью макрофункций и позволяет, выполнив одно действие, получить на выходе большое количество результатов. В пакете анализа, имеющемся в Excel, среди прочих инструментов анализа имеется разделы «Описательная статистика» и «Корреляция».

Инструмент «Описательная статистика» позволяет нам получить значительный перечень рассчитанных статистических характеристик для большого количества числовых рядов. С помощью инструмента «Корреляция» мы получаем корреляционную матрицу, содержащую все возможные парные коэффициенты корреляции. Для k рядов будет получено k (k – 1)/2 коэффициентов корреляции.

Пакет анализа вызывается с помощью пункта меню Сервис – Анализ данных… Если этот пункт меню отсутствует, значит, пакет анализа не установлен. Для его установки надо вызвать пункт меню Сервис – Надстройки… и включить надстройку «Пакет анализа», ОК (см. рисунок 1).

Рисунок 1. Диалоговое окно включения/выключения надстроек

После включения надстройки «Пакет анализа» будет доступен пункт меню Сервис – Анализ данных… При его выборе появляется следующее диалоговое окно (рисунок 2).

Рисунок 2. Диалоговое окно выбора инструмента для анализа данных

После выбора инструмента «Описательная статистика» и нажатия ОК появится еще одно диалоговое окно (рисунок 3), требующее ввода входных данных и места вывода результатов. Здесь достаточно в поле «Входной интервал» ввести диапазон ячеек, содержащих исходные данные. Можно указать диапазон с заголовками столбцов, в этом случае потребуется включить флажок «Метки в первой строке». Для указания выходного интервала достаточно указать только левую верхнюю ячейку диапазона. Результаты вычисления автоматически займут требуемое количество строк и столбцов в таблице.

Рисунок 3. Диалоговое окно инструмента «Описательная статистика»

Рассмотрим работу инструмента анализа «Описательная статистика» на следующем примере. В процессе обследования группы школьников (n = 21) измерялись следующие показатели: рост, масса тела, динамометрия правой и левой руки, жизненная емкость легких, проба Штанге и проба Генчи. Результаты были занесены в таблицу (рисунок 4).

Для получения статистических характеристик воспользуемся пакетом анализа, инструментом «Описательная статистика». В поле «Входной интервал» занесем диапазон ячеек В1:Н22. Так как выделенный входной интервал содержит заголовки столбцов, включаем флажок «Метки в первой строке». Для удобства работы в качестве места выхода результата выбираем «Новый рабочий лист». В качестве выводимых данных отметим флажками «Итоговая статистика» и «Уровень надежности: 95 %». Последний флажок позволит вывести параметры доверительного интервала с доверительной вероятностью 0,95. Полученный результат после небольшого форматирования будет выглядеть так, как показано на рисунке 5.

Рисунок 4. Результаты обследования группы школьников

Рисунок 5. Результат работы инструмента «Описательная статистика»

После выбора инструмента «Корреляция» и нажатия ОК в диалоговом окне «Анализ данных» (рисунки 2, 6) появится еще одно диалоговое окно (рисунок 7), требующее ввода входных данных и места вывода результатов. Здесь достаточно в поле «Входной интервал» ввести диапазон ячеек, содержащих исходные данные. Можно указать диапазон с заголовками столбцов, в этом случае потребуется включить флажок «Метки в первой строке». Для указания выходного интервала достаточо указать только левую верхнюю ячейку диапазона. Результаты вычисления автоматически займут требуемое количество строк и столбцов в таблице.

Рисунок 6. Диалоговое окно выбора инструмента для анализа данных

Рисунок 7. Диалоговое окно инструмента «Корреляция»

Рассмотрим работу инструмента анализа «Корреляция» на примере, представленном на рисунке 4.

Для получения корреляционной матрицы воспользуемся пакетом анализа, инструментом «Корреляция». В поле «Входной интервал» занесем диапазон ячеек В1:Н22. Так как выделенный входной интервал содержит заголовки столбцов, включаем флажок «Метки в первой строке». Для удобства работы в качестве места выхода результата выбираем «Новый рабочий лист». Полученный результат после небольшого форматирования будет выглядеть так, как показано на рисунке 8.

Рисунок 8. Корреляционная матрица

Таким образом, путем выполнения несложных операций мы получаем большое количество результатов вычислений. Стоит отметить, что хотя информационные технологии открывают перед исследователем возможности получения огромного количества информации для анализа, отбор наиболее информативных результатов, окончательная интерпретация и формулировка выводов – работа самого исследователя.

Основные понятия корреляционного анализа экспериментальных данных. Оценка коэффициента корреляции по экспериментальным данным.

В спортивных исследованиях между изучаемыми показателями часто обнаруживается взаимосвязь. Вид ее бывает различным. Например, определение ускорения по известным данным скорости, второй закон Ньютона и другие характеризуют так называемую функциональную зависимость, или взаимосвязь, при которой каждому значению одного показателя соответствует строго определенное значение другого.

К другому виду взаимосвязи относят, например, зависимость веса от длины тела. Одному значению длины тела может соответствовать несколько значений веса и наоборот. В таких случаях, когда одному значению одного показателя соответствует несколько значений другого, взаимосвязь называют статистической .

Изучению статистической взаимосвязи между различными показателями в спортивных исследованиях уделяют большое внимание, поскольку это позволяет вскрыть некоторые закономерности и в дальнейшем описать их как словесно, так и математически с целью использования в практической работе тренера и педагога.

Среди статистических взаимосвязей наиболее важны корреляционные . Корреляция – это статистическая зависимость между случайными величинами, при которой изменение одной из случайных величин приводит к изменению математического ожидания (среднего значения) другой. Например, толкание ядра 3 кг и 5 кг. Улучшение результатов толкания ядра 3 кг вызывает улучшение (в среднем) результата в толкании ядра весом 5 кг.

Статистический метод, который используется для исследования взаимосвязей, называется корреляционным анализом . Основной задачей его является определение формы, тесноты и направленности взаимосвязи изучаемых показателей. Корреляционный анализ позволяет исследовать только статистическую взаимосвязь. Он широко используется в теории тестов для оценки их надежности и информативности. Различные шкалы измерений требуют разных вариантов корреляционного анализа.

Величина коэффициента взаимосвязи рассчитывается с учетом шкалы, использованной для измерений.

Для оценки взаимосвязи, когда измерения производят в шкале отношений или интервалов и форма взаимосвязи линейная, используется коэффициент корреляции Бравэ-Пирсона (коэффициенты корреляции для других шкал измерения в данном пособии не рассматриваются). Обозначается он латинской буквой – r. Вычисление значения r чаще всего производят по формуле:

,

где и – средние арифметические значения показателей x и y, и – средние квадратические отклонения, n – число измерений (испытуемых).

В некоторых случаях тесноту взаимосвязи определяют на основании коэффициента детерминации D, который вычисляется по формуле:

.

Этот коэффициент определяет часть общей вариации одного показателя, которая объясняется вариацией другого показателя. Например, коэффициент корреляции r = –0,677 (между результатами в беге на 30 м с ходу и тройном прыжке с места). Коэффициент детерминации равен:

Следовательно, 45,8 % рассеяния спортивного результата в тройном прыжке объясняется изменением результатов в беге на 30 м. Иными словами, на оба исследуемых признака действуют общие факторы, вызывающие варьирование этих признаков, и доля общих факторов составляет 45,8%. Остальные 100% – 45,8% = 54,2% приходятся на долю факторов, действующих на исследуемые признаки избирательно.

Оценить статистическую достоверность коэффициента корреляции – это значит определить, существует или нет линейная корреляционная связь между генеральными совокупностями или, что то же, установить, существенно или несущественно отличается от нуля коэффициент корреляции между выборками. Эта задача может быть решена с помощью таблиц критических точек распределения коэффициента корреляции в следующем порядке:

1. Выдвигаются статистические гипотезы. Гипотеза Н 0 предполагает отсутствие статистически значимой взаимосвязи между исследуемыми показателями (r ген =0). Гипотеза Н 1 предполагает, что существует статистически достоверная взаимосвязь между показателями (r ген >0).

2. Рассчитывается наблюдаемое значение коэффициента корреляции r набл .

3. Находится по таблице критическое значение коэффициента корреляции r крит в зависимости от объема выборки n , уровня значимости a и вида критической области (односторонняя или двусторонняя).

3. Сравнивается r набл и r крит .

Если r набл < r крит – статистически недостоверным (незначимым). Принимается гипотеза Н 0 Если r набл r крит , коэффициент корреляции считается статистически достоверным (значимым). Принимается гипотеза Н 1 .

ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ ГОРОДА МОСКВЫ

ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

КОЛЛЕДЖ СВЯЗИ № 54 имени П.М. ВОСТРУХИНА

Статистические характеристики.

Учебное пособие к занятию часть 1.

Разработчик:

Преподаватель математики

Т.Н. Рудзина


– это математические понятия , с помощью которых описываются отличительные особенности и свойства совокупности данных , полученных с помощью наблюдений или каким-то другим способом. Значение характеристик состоит еще и в том, что они «подсказывают» , с каких позиций целесообразно анализировать имеющуюся совокупность данных .

К статистическим характеристикам относятся:

среднее арифметическое , размах , мода , медиана .

Рассмотрим пример:

При изучении учебной нагрузки учащихся выделили группу из 12 семиклассников. Их попросили отметить в определенный день время (в минутах), затраченное им на выполнения домашнего задания по алгебре. Получили такие данные:

23, 18, 25 20, 25, 25, 32, 37, 34, 26 34, 25 .

Имея этот ряд данных, можно определит ь, сколько минут в среднем затратили учащиеся на выполнение домашнего задания по алгебре.

Для этого указанные числа надо сложить и сумму разделить на 12:


Число 27 , полученное в результате, называют средним арифметическим рассматриваемого ряда чисел.

Определение :

Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на число слагаемых.

Обычно среднее арифметическое находят тогда, когда хотят определить среднее значение для некоторого ряда данных: среднюю урожайность пшеницы с 1 га в районе, средний суточный удой молока от одной коровы на ферме, среднюю зарплату одного рабочего бригады за смену и т.д. Заметим, что среднее арифметическое находят только для однородных величин. Не имеет смысла, например, использовать в качестве обобщающего показателя среднюю урожайность зерновых и бахчевых культур. Причем и для однородных величин вычисление среднего арифметического бывает иногда лишено смысла, например нахождение средней температуры больных в госпитале, среднего размера обуви…


В рассмотренном примере мы нашли, что в среднем учащиеся затратили на выполнение домашнего задания по алгебре по 27 мин. Однако анализ приведенного ряда данных показывает, что время, затраченное некоторыми учащимися, существенно отличается от 27 мин., т.е. от среднего арифметического. Наибольший расход равен 37 мин., а наименьший – 18 мин. Разность между наибольшим и наименьшим расходом времени составляет 19 мин. В этом случае говорят, что размах ряда равен 19.

Определение :

Размахом ряда чисел называется разность между наибольшим и наименьшим из этих чисел.

Размах находят тогда, когда хотят определить, как велик разброс данных в ряду.


При анализе сведений о времени, затраченном семиклассниками на выполнение домашнего задания по алгебре, нас могут интересовать не только среднее арифметическое и размах полученного ряда данных, но и другие показатели. Интересно, например, знать, какой расход времени является типичным для выделенной группы учащихся, т.е. какое число встречается в ряду данных чаще всего. Нетрудно заметить, что таким числом является число 25. Говорят, что число 25 – мода рассматриваемого ряда.

Определение :

Модой ряда чисел называется число, наиболее часто встречающееся в данном ряду .

Ряд чисел может иметь более одной моды или не иметь моду совсем.

Например, в ряду чисел 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 две моды – это числа 47 и 52 , так как каждое из этих чисел встречается два раза, а остальные числа встречаются в ряду менее двух раз, а в ряду чисел 69, 68, 66, 70, 67, 71, 74, 63, 73, 72 – моды нет.


Рассмотрим еще одну статистическую характеристику.

Начнем с примера. В таблице показан расход электроэнергии в январе жильцами девяти квартир

Составим из данных, приведенных в таблице, упорядоченный ряд:

64, 72, 72, 75, 78 , 82, 85, 91, 93.

В полученном упорядоченном ряду девять чисел. Не трудно заметить, что в середине ряда расположено число 78: слева от него записано четыре числа и справа тоже четыре числа. Говорят, что число 78 является срединным числом, или, иначе, медианой , рассматриваемого упорядоченного ряда чисел (от латинского слова mediana , которое означает «среднее»). Это число считают также медианой исходного ряда данных.


Приведем теперь другой пример. Пусть при сборе данных о расходе электроэнергии к указанным девяти квартирам добавили еще десятую. Получили такую таблицу:

Так же как в первом случае, представим полученные данные в виде упорядоченного ряда чисел:

64, 72, 72, 75, 78 , 82 , 85, 88, 91, 93

В этом числовом ряду четное число членов и имеются два числа, расположенные в середине ряда: 78 и 82 .

Число 80 , не являясь членом ряда, разбивает этот ряд на две одинаковые по численности группы: слева от него находятся пять членов ряда и справа тоже пять членов ряда:


64, 72, 72, 75, 78, 82, 85, 88, 91, 93

Говорят, что в этом случае медианой рассматриваемого упорядоченного ряда, а также исходного ряда данных, записанного в таблице, является число 80 .

Определение :

Медианой упорядоченного ряда чисел с нечетным числом членов называется число, записанное посередине, а медианой упорядоченного ряда чисел с нечетным числом членов называется среднее арифметическое двух чисел, записанных посередине.

Медианой произвольного ряда чисел называется медиана соответствующего упорядоченного ряда.


Если в упорядоченном числовом ряду содержится 2 n -1 членов, то медианой ряда является n -й член, так как n – 1 членов стоит до n -го члена и n – 1 членов – после n -го члена.

Если в упорядоченном ряду содержится 2 n членов, то медианой является среднее арифметическое членов, стоящих на n -м и n + 1 -м местах.

В каждом из рассмотренных выше примеров, определив медиану , мы можем указать номер квартиры, для которой расход электроэнергии жильцами превосходит срединное значение, т.е. медиану .

Рассмотрим еще один пример.

Известно, что 34 сотрудника отдела приобрели акции некоторого акционерного общества. Данные о числе акций, приобретенных сотрудниками, представлены в виде следующего упорядоченного ряда:

2, 2, 2, 2, 2, 3, 3, ……, 3, 4, 4, ……., 4, 100

Найдем медиану этого ряда. Так как всего в ряду 34 числа, то медиана равна среднему арифметическому 17– го и 18- го членов, т.е. равна (3 + 4) : 2 = 3,5

Вычисляя среднее арифметическое этого ряда, найдем, что оно приближенно равно 6,2, т.е. в среднем сотрудники отдела приобрели примерно по 6 акций. Мы видим, что в данном случае медиана лучше отражает реальную ситуацию, так как все сотрудники, кроме одного, приобрели не более 4 акций.

Такие показатели, как среднее арифметическое , мода и медиан а, по-разному характеризуют данные, полученные в результате наблюдений. Поэтому на практике при анализе данных в зависимости от конкретной ситуации используют либо все три показателя, либо некоторые из них.

Если, например, анализируются сведения о годовых доходах нескольких туристических фирм города, то удобно использовать все три показателя. Среднее арифметическое покажет средний годовой доход фирм, мода будет характеризовать типичный показатель годового дохода, медиана позволит определить туристические фирмы, годовой доход которых ниже среднего показателя.

Если изучают данные о размерах мужской обуви, проданной в определенный день в универмаге, то удобно воспользоваться таким показателем как мода , который характеризует размер, пользующийся наибольшим спросом. Находить в этом случае среднее арифметическое или медиану не имеет смысла .

При анализе результатов, показанных участниками заплыва на дистанцию 100 и, наиболее приемлемой характеристикой является медиана . Знание медианы позволит выделить для участия в соревнованиях группу спортсменов, показавших результаты выше среднего.

Статистические характеристики : среднее арифметическое , мод а, медиана называются средними результатами измерений .

Тип урока : урок изучения нового материала.

Цель урока: Создание условий для усвоения темы на уровне осмысления и первичного запоминания; для формирования математической компетенции личности учащегося

Образовательные: сформировать представление о статистике как науке; ознакомить учащихся с понятиями основных статистических характеристик; сформировать умения находить среднее арифметическое, размах, моду, медиану ряда, анализировать данные.
Развивающие: способствовать владению понятиями и их толкованием; развитию надпредметных навыков анализа, сравнения, систематизации и обобщения; способствовать формированию ключевых компетенций (познавательной, информационной, коммуникативной) на различных этапах урока, способствовать формированию у учащихся единой научной картины мира путем выявления межпредметных связей статистики и различных наук.
Воспитательные: воспитывать интерес к изучаемому предмету, информационную культуру; готовность к выполнению общепринятых норм и правил, высокой работоспособности и организованности.

Используемые технологии : Технология МДО.
Необходимое оборудование , материалы : мультимедийный проектор, компьютер, интерактивная доска.

План урока

Организационный момент. Класс разделен на 4 группы.

Включить видеоролик из фильма Служебный роман.

Файл "WMV" (.wmv)

Как вы думаете, о каком понятии мы сегодня будем говорить?

…….. верно, о статистике

Что такое статистика? (Слайд 2)

…….. вот такое определение нам выдаёт словарь (Слайд 3)

Влияет ли статистика на жизнь людей, на общество? Выскажете свои предположения по желанию.

Статистика как наука включает разные разделы: политическая, экономическая, прикладная, правовая, медицинская и др.

Нас будет интересовать математическая статистика. В чём особенность мат статистики?

…….. конечно с помощью математики (Слайд 4)

Математическая статистика обладает рядом характеристик. (на доске перевернуть слово «статистические характеристики»).

Перед вами понятия. (на доске таблички со словами:биссектриса, лунула, мюли, среднее арифметическое, медиана, мода, размах, диаметр, середина, максимум, оптимум, инварианта, константа, высота) Предположите, какие из них можно отнести к статистическим, как вы думаете?

(Предложенные слова поставить после слова статистические характеристики)

Сейчас вы обратитесь к текстам, которые помогут вам подтвердить или опровергнуть ваши предположения: являются ли выбранные понятия статистическими характеристиками и насколько велико влияние статистики на жизнь общества. Каждый ученик получил таблицу (Приложение 1), которую должен заполнить в течении урока.. Давайте вспомним правила работы в группе: спокойно, самостоятельно, по-деловому, с распределением обязанностей. Группа должна заполнить таблицу (Приложение 2)

Работа в группах. Тексты для групп. Приложение 3. (10 мин)

Защита (слайд с определением + слайд с задачей)

Обязательно заполняем листы-памятки. (У каждой группы спрашиваем, кто, что для себя отметил по данной характеристике в листке-памятке) (Приложение 1,2)

Среднее арифметическое

Наведём порядок в статистических характеристиках

(оставить только 4 характеристики)

1 группа выходят к доске и рассказывают о статистической характеристике - среднее арифметическое, решение предложенных задач, выводы. (Слайд 5,6).

2 группа выходят к доске и рассказывают о статистической характеристике- мода, решение предложенных задач, выводы. (слайд 7,8)

3 группа выходят к доске и рассказывают о статистической характеристике- размах, решение предложенных задач, выводы. (слайд 9,10)

4 группа выходят к доске и рассказывают о статистической характеристике- медиана, решение предложенных задач, выводы. (слайд 11,12)

Все группы пришли к выводу, что есть взаимосвязь между жизнью общества и статистикой, влияние велико, даже тогда, когда мы этого и не предполагаем.

Давайте обратимся к слайдам и посмотрим как в нашей обыденной жизни статистические характеристики могут себя проявлять.(Слайды с шутками 13-19, 20)

Сейчас мы вам предлагаем поработать статистами. (Раздаются 4 задачи практического содержания) (7 минут)

Итак, с какой статистической характеристикой вы работали в первой задаче, что у вас получилось

…….. мода - цвет глаз и волос (провести быстрый опрос каждой группы)

…….. размах - ширина ладони (провести быстрый опрос каждой группы)

с какой статистической характеристикой вы работали в третьей задаче, что у вас получилось

…….. медиана - размер обуви (провести быстрый опрос каждой группы)

с какой статистической характеристикой вы работали во второй задаче, что у вас получилось

…….. среднее арифметическое - рост (провести быстрый опрос каждой группы)

Судя, по результатам среднестатистический юноша в нашем классе выглядит так (Слайд 21)

А девушка так (Слайд 22)

На такой оптимистичной ноте мы завершаем наше занятие.

(Ответы к заданиям Приложение 5)

Приложение 1.

Приложение 2.

Приложение 3.

Группа 1. Статистика изучает численность отдельных групп населения страны и ее регионов, производство и потребление разнообразных видов продукции, перевозку грузов и пассажиров различными видами транспорта, природные ресурсы и т.п. Результаты статистических исследований широко используются для практических и научных выводов.

Средним арифметическим ряда чисел называется статистическая характеристика, которая позволяет найти частное от деления суммы этих чисел на число слагаемых. Обычно, среднее арифметическое находят тогда, когда хотят определить среднее значение для некоторого ряда данных: среднюю урожайность пшеницы с 1га в районе, средний суточный удой молока от одной коровы на ферме, среднюю выработку одного рабочего и т.п. Заметим, что среднее арифметическое находят только для однородных величин.

Например, при изучении учебной нагрузки учащихся выделили группу из 12 семиклассников. Их попросили отметить в определенный день время (в минутах), затраченное на выполнение домашнего задания по алгебре. Получили такие данные: 23, 18, 25, 20, 25, 25, 32, 37, 34, 26, 34, 25.

Имея этот ряд данных, можно определить, сколько минут в среднем затратили учащиеся на выполнение домашнего задания по алгебре. Для этого указанные числа надо сложить и полученную сумму разделить на количество, т.е. в данном случае 12:

Ср. арифм. ===27

Таким образом, мы нашли, что на выполнение домашнего задания по алгебре учащиеся затратили в среднем по 27 минут.

Найдите среднее арифметическое в следующих задачах:

Задача 1. Из предложенных в таблице загрязняющих атмосферу веществ, отходящих от стационарных источников в ХМАО-Югре, выберите сначала выбросы наиболее распространенных веществ, а потом определите среднее количество этих выбросов за три года, представленных в таблице в тыс.тонн.

твердые вещества

газообразные и жидкие вещества

диоксид серы

оксиды азота

оксид углерода

Задача 2. Определите среднюю температуру воздуха по городу Урай на 14 февраля 2017 года, если известно, что на сайтах: Яндекс -9 o C , Gismeteo -11 o C , rp5 -16 o C , - 11 oC, meteonovosti -15 o C , meteonova -10 o C , synoptic -11 o C .

Роль статистики в нашей жизни настолько значительна, что люди часто не задумываясь и не осознавая, постоянно используют элементы статистической методологии не только в трудовых процессах, но и в повседневном быту. Работая и отдыхая, делая покупки, знакомясь с другими детьми, принимая какие-то решения, человек пользуется определенной системой, имеющихся у него сведений, сложившихся вкусов и привычек, фактов, систематизирует, сопоставляет эти факты, анализирует их, делает вывод и принимает определенные решения, предпринимает конкретные действия. Таким образом, в каждом человеке заложены элементы статистического мышления, представляющего собой способности и к анализу и синтезу информации об окружающем мире.

Группа 2.

Значение слова «статистика

Результаты статистических исследований широко используются для практических и научных выводов.

При обработке данных статистика использует некоторые характеристики, одной из которых является мода. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей.

Мода ряда - значение во множестве наблюдений, которое встречается наиболее часто. Мода = типичность. В ряду 3,4,3,5,5,4,5,3,5 мода = 5. Как наиболее часто встречающееся число.

Иногда в совокупности встречается более, чем одна мода. Например: 6, 2, 6, 6, 8, 9, 9, 9, 10; мода = 6 и 9. В этом случае можно сказать, что совокупность мультимодальна. Из структурных средних величин только мода обладает таким уникальным свойством.

В ряду чисел 69,68,72,74,89,87,84 моды нет.

Мода как средняя величина употребляется чаще для данных, имеющих нечисловую природу. Среди перечисленных цветов автомобилей — белый, черный, синий металлик, белый, синий металлик, белый — мода будет равна белому цвету. При экспертной оценке с её помощью определяют наиболее популярные типы продукта, что учитывается при прогнозе продаж или планировании их производства

Решите следующие задачи:

Задача 1. В реках Ханты-Мансийского Автономного округа обитает много рыб.В реке Большой Юган обитают рыбы щука, окунь, плотва, карась, язь, налим. В реке Аган обитает рыба: щука, окунь, плотва, стерлядь, карась, язь, налим, нельма. В реке Вах обитает рыба: щука, окунь, плотва. В реке Тромъган обитает рыба: щука, окунь, плотва, карась, язь, налим. Совокупность рыб ХМАО-Югры, мультимодальна (щука, окунь и плотва встречаются во всех реках на территории округа. Определите наиболее типичную рыбу в представленных реках.

Залача 2. В таблице показан расход электроэнергии в январе жильцами 9 квартир

Определите моду данного ряда

Группа 3. Значение слова «статистика » за последние два столетия претерпело значительные изменении. Слово «статистика» имеет один корень со словом «государство» (state) и первоначально означало искусство и науку управления: первые преподаватели статистики университетов Германии 18-го века сегодня назывались бы специалистами по общественным наукам. Поскольку решения правительства до некоторой степени основываются на данных о населении, промышленности и т.д. статистики, естественно, стали интересоваться и такими данными, и постепенно слово «статистика» стало означать сбор данных о населении, о государстве, а затем вообще сбор и обработку данных. Нет смысла извлекать данные, если из этого не извлекается какая-то польза. Поэтому одна из основных задач статистики состоит в надлежащей обработке информации.

Сегодня статистика и анализ данных пронизывают практически любую современную область знаний: экономика, реклама, маркетинг, бизнес, медицина, образование и т.д. Она определяет динамику развития, спада или роста общественных явлений. Это наука, которая решает определенные задачи благодаря наличию и развитию статистических методов, в том числе благодаря развивающимся информационным технологиям.

При обработке данных статистика использует некоторые характеристики, одной из которых является медиана.

Медианой называется значение величины, расположенное в центре упорядоченного ряда.

Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц. При этом у одной половины значение признака не больше медианы, у другой - не меньше.

Медиану находят по следующему алгоритму:

Выстраивают числа по возрастанию,

Если ряд содержит нечетное количество элементов, то медиана-число, стоящее в середине;

Если ряд содержит четное количество элементов, медиана лежит между двумя средними элементами ряда и равна среднему арифметическому, вычисленному по этим двум элементам.

Пример . Найти медиану ряда 16,13,15,10,19,22,25,12,18,14,19,14,16,10.

Решение. Выстроим ряд по возрастанию: 10,10,12,13,14,14,15,16,16,18,19,19,22,25, он содержит четное число элементов n=14, следовательно медиана лежит между двумя средними элементами выборки - между 7-элементом и 8-элементом: 10,10,12,13,14,14,15,16,16,18,19,19,22,25 и равна среднему арифметическому этих элементов: Me=(15+16)/2=15,5

Приведем примеры реального использования медианы в статистике. Так при анализе результатов, показываемых участниками забега, медиана позволяет выделить группу спортсменов, показавших результат выше серединного и выставлять их в следующий этап соревнований.

Математическим свойством медианы является то, что сумма абсолютных (по модулю) отклонений от медианного значения дает минимально возможное значение. Данный факт находит свое применение, например, при решении транспортных задач, когда нужно рассчитать место строительства объекта около дороги таким образом, чтобы суммарная длина рейсов до него из разных мест была минимальной (остановки, заправки, склады и т.д. и т.п.).

Решите следующие задачи:

Задача 1. Текущие затраты на охрану окружающей среды в ХМАО составили в млн. рублей:

Найдите медиану данного ряда.

Группа 4. Статистика - наука, которая занимается получением, обработкой и анализом количественных данных разнообразных массовых явлениях, происходящих в природе и обществе.

Одной из основных задач статистики состоит в надлежащей обработке информации. Конечно у статистики есть много и других: получение и хранение информации, выработка различных прогнозов, оценка их достоверности и т.д.

Одним из статистических показателей различия или разброса данных является «Размах». Размахом ряда называется разность между наибольшим и наименьшим из этих чисел. Разберем задачу: При изучении учебной нагрузки учащихся выделили группу из 12 человек. Их попросили отметить в определенный день время (в минутах), затраченное на выполнение домашнего задания по алгебре. Получили такие данные: 23, 18, 25, 20, 25, 25, 32, 37, 34, 26, 34, 25.

Наибольший расход времени - 37 минут, а наименьший - 18 минут. Найдем размах ряда:

37-18=19 минут.

Решите следующие задачи:

Задача 1. Река Обь-это артерия Западной Сибири и несет свои воды по такой стране, как Россия. Длина водотока - 3650 км. Река Обь среди рек России вторая, уступает только Лене. Вместе со своим притоком Иртышом, Обь находится на первом месте по протяженности в России (5410 км.) и на втором - в Азии Глубина Оби - от 2-6 м в начале, у г. Бийска, доходит до 25 м у г. Новосибирска (возле ГЭС), уменьшается до 8 м возле устья Томи и вновь увеличивается до 15 м в верховьях Обской губы, куда впадает река. Найдите размах глубины реки Обь.

Задача 2. В период с 17 по 19 декабря отклонение среднесуточной температуры от нормы в ХМАО достигало 16-26 градусов. А 21 декабря администрация Белоярского района ХМАО сообщила о похолодании до - 62 ° C, в Ханты-Мансийске - 40°, в Сургуте - 43°, в Урае - 38°, в Югорске - 42°, в Кондинске - 33°. Найдите размах температуры данных населенных пунктов.

Статистика изучает численность отдельных групп населения страны и ее регионов, производство и потребление разнообразных видов продукции, перевозку грузов и пассажиров различными видами транспорта, природные ресурсы и т.п. Результаты статистических исследований широко используются для практических и научных выводов.

Роль статистики в нашей жизни настолько значительна, что люди часто не задумываясь и не осознавая, постоянно используют элементы статистической методологии не только в трудовых процессах, но и в повседневном быту. Работая и отдыхая, делая покупки, знакомясь с другими детьми, принимая какие-то решения, человек пользуется определенной системой, имеющихся у него сведений, сложившихся вкусов и привычек, фактов, систематизирует, сопоставляет эти факты, анализирует их, делает вывод и принимает определенные решения, предпринимает конкретные действия. Таким образом, в каждом человеке заложены элементы статистического мышления, представляющего собой способности и к анализу и синтезу информации об окружающем мире. Результаты статистических исследований широко используются для практических и научных выводов.

Приложение 4.

Задача 1. Опросите 10 человек из класса. Определите наиболее распространенный среди них

цвет волос и глаз. С какой статистической характеристики вы работали?

Задача 2. Опросите 10 человек из класса. Измерьте ширину их ладоней. Найдите разность

наибольшего и наименьшего значений. Какая статистическая характеристика используется

в этой задаче?

Задача 3. Опросите 9 человек из класса. Выясните их размер обуви. Выстройте числа в

порядке возрастания. Определите медиану ряда.

Задача 4. Опросите 10 человек из класса. Выясните их рост. Найдите средний рост

респондентов. С каким видом статистической характеристики вы работали?

Приложение 5.

Ответы к заданиям.

Среднее арифметическое

Щука, окунь, плотва