06 Основы математической статистики (2)


Одесский национальный медицинский университет

Кафедра биофизики, информатики и медицинской аппаратуры

Методические указания

студентам 1 курса по теме

“Основы математической статистики”

Утверждено

на методическом совещании кафедры

Протокол № от “___” ___ 2009 г.

Зав кафедрой ___________________

Переутверждено

на методическом совещании кафедры

Протокол № от “___” ___ 201_ г.

Зав кафедрой ___________________

Одесса 2009 г.

1.Тема: “ Основы математической статистики”.

2. Актуальность темы.

Математическая статистика - это раздел математики, которая изучает методы собирания, систематизации и обработки результатов наблюдений массовых случайных событий с целью выяснения и практического применения существующих закономерностей. Методы математической статистики нашли широкое применение в клинической медицине и здравоохранении. Они используются, в частности, при разработке математических методов медицинской диагностики, в теории эпидемий, в планировании и обработке результатов медицинского эксперимента, в организации здравоохранения. Статистические концепции, сознательно или бессознательно, используются при принятии решений в таких вопросах, как клинический диагноз, прогнозирование течения болезни у отдельного больного, прогнозирование возможных результатов осуществления тех или других программ в данной группе населения и выбор надлежащей программы в конкретных обстоятельствах. Знакомство с идеями и методами математической статистики является необходимым элементом профессионального образования каждого работника здравоохранения.

3. Целые занятия.

Общей цілью занятие есть научить студентам сознательно использовать математическую статистику при решении задач медико-биологического профиля.

Конкретные целые занятия:

  1. ознакомить студентов с основными идеями, понятиями и методами математической статистики, уделяя внимание, главным образом, вопросам, по'язанним с обработкой результатов наблюдений массовых случайных событий с целью выяснения и практического применения существующих закономерностей;

  2. научить студентам сознательно применять основные понятия математической статистики при решении простейших проблем, которые возникают в профессиональной деятельности врача.

Студент должен знать (2 уровень):

  1. определение частоты класса (абсолютной и относительной)

  2. определение генеральной сукупністі и виборки, объема виборки

  3. точечное и інтервальне оценивание

  4. надежный интервал и достоверность

  5. определение моды, медианы и выборочного среднего

  6. определение размаха, міжквартильного размаха, квартильного отклонение

  7. определение среднего абсолютного отклонения

  8. определение выборочной коваріації и дисперсии

  9. определение выборочных стандартного отклонения и коэффициенту вариации

  10. определение выборочных коэффициентов регрессії

  11. эмпирические уравнения линейной регрессії

  12. определение выборочного корреляційного коэффициенту.

Студент должен овладеть элементарными привычками вычисления (3 уровень):

  1. моды, медианы и выборочного среднего

  2. размаха, міжквартильного размаха, квартильного отклонение

  3. среднего абсолютного отклонения

  4. выборочной коваріації и дисперсии

  5. выборочных стандартного отклонения и коэффициенту вариации

  6. надежного интервала для математического ожидания и дисперсии

  7. выборочных коэффициентов регрессії

  8. выборочного корреляційного коэффициенту.

4. Пути реализации целей занятия:

Для реализации целей занятия Вам необходимые такие исходные знания:

  1. Определение случайных величин: дискретной и непрерывной

  2. Определение распределения, ряд распределения и многокутника распределения дискретной случайной величины

  3. Определение функции распределения

  4. Определение мер положения центра распределения

  5. Определение мер вариабельности значений случайной величины

  6. Определение щільністі распределения и кривой распределения непрерывной случайной величины

  7. Определение функциональной залежністі между случайными величинами

  8. Определение корреляционной залежністі между случайными величинами

  9. Определение регрессии, уравнение и линии регрессии

  10. Определение коваріації и коэффициента корреляции

  11. Определение уравнения линейной регрессии.

Вам необходимые также уметь вычислять вероятностей несовместимых и совместных событий с помощью соответствующих правил.

5. Задача для проверки студентами своего исходного уровня знаний.

Контрольные вопросы

  1. Определение випадковоі события, ее относительную частоту и вероятность.

  2. Теорема составления вероятностей несовместимых событий

  3. Теорема составления вероятностей совместных событий

  4. Теорема умножения вероятностей независимых событий

  5. Теорема умножения вероятностей зависимых событий

  6. Теорема полной вероятности

  7. Теорема Байєса

  8. Определение случайных величин: дискретной и непрерывной

  9. Определение распределения, ряд распределения и многокутника распределения дискретной случайной величины

  10. Определение функции распределения

  11. Определение мер положения центра распределения

  12. Определение мер вариабельности значений случайной величины

  13. Определение щільністі распределения и кривой распределения непрерывной случайной величины

  14. Определение функциональной залежністі между случайными величинами

  15. Определение корреляционной залежністі между случайными величинами

  16. Определение регрессии, уравнение и линии регрессии

  17. Определение коваріації и коэффициента корреляции

  18. Определение уравнения линейной регрессии.

6. Информацию для упрочения исходных знаний-умений можно найти в пособиях:

7. Содержание учебного материала из данной темы с выделением основных узловых вопросов.

Математическая статистика - это раздел математики, которая изучает методы сбора, систематизации, обработки, изображение, анализа и интерпретации результатов наблюдений с целью выявления существующих закономерностей.

Применение статистики в здравоохранении необходимо как на уровне сообщества, так и на уровне отдельных пациентов. Медицина имеет дело с индивидуумами, которые отличаются друг от друга по многим характеристикам, и значение показателей, на основе которых человека можно считать здоровой, варьируются от одного индивидуума к другому. Нет двух абсолютно одинаковых пациентов или двух групп пациентов, поэтому решение, которые касаются отдельных больных или групп населень, приходится принимать, исходя из опыта, накопленного на других больных или популяціних группах с похожими биологическими характеристиками. Необходимо осознавать, что учитывая существующие расхождения эти решения не могут быть абсолютно точными - они всегда связаны с некоторой неопределенностью. Именно в этом состоит ймовірносна природа медицины.

Некоторые примеры применения статистических методов в медицине:

• трактовка вариации (вариабельность характеристик организма при решении вопроса о том, какое значение той или другой характеристики будет идеальным, нормальным, средним и т.і., делает необходимым использование соответствующих статистических методов ).

• диагностика заболеваний в отдельных больных и оценка состояния здоровья группы населения.

• прогнозирование конца болезни в отдельных больных или возможного результата программы борьбы по той или другой болезнью в любой группе населения.

• выбор пригодного влияния на больного или на группу населения.

• планирование и проведение медицинских исследований, анализ и публикація результатов, их чтение и критическая оценка.

• планирование здравоохранения и руководство им.

Полезная медицинская информация обычно скрыта в массе необработанных данных. Необходимо сконцентрировать информацию, которая содержится в них, и представить данные так, чтобы структуру вариации было хорошо видно, а потом уже выбрать конкретные методы анализа.

Изображение данных предусматривает знакомство с такими понятиями и сроками:

• вариационный ряд (упорядоченное расположение) - простое упорядочение отдельных наблюдений за величиной.

• класс - один из интервалов, на которые делят весь диапазон значений случайной величины.

• крайние точки класса - значение, которые ограничивают класс, например 2,5 и 3,0, нижняя и верхняя границы класса 2,5 - 3,0.

• (абсолютная) частота класса - число наблюдений в классе.

• относительная частота класса - абсолютная частота класса, выраженная в виде частные общего числа наблюдений.

• кумулятивная (накопленная) частота класса - число наблюдений, которое равняется сумме частот всех предыдущих классов и данного класса.

• стовпцева диаграмма - графическое изображение частот данных для номинальных классов с помощью столбцов, высоты которых прямо пропорциональные частотам классов.

• круговая диаграмма - графическое изображение частот данных для номинальных классов с помощью секторов круга, площади которых прямо пропорциональные частотам классов.

• гістограма - графическое изображение частотного распределения количественных данных площадями прямоугольников, прямо пропорциональных частотам классов.

• полигон частот - график частотного распределения количественных данных; точку, соответствующую частоте класса, располагают над серединой интервала, каждое две соседние точки соединяют отрезком прямой.

• огива (кумулятивная кривая) - график распределения кумулятивных относительных частот.

Всем медицинским данным присущий вариабельность, тому аналіз результатов измерений основанный на изучении сведений о том, каких значениях принимала случайная величина, которая исследуется.

Совокупность всех возможных значений случайной величины называется генеральной.

Часть генеральной совокупности, зарегистрированная в результате испытаний, носит название виборкою.

Число наблюдений, включенное в виборку, зовут объемом виборки (обычно обозначается n).

Задача выборочного метода заключается в том, чтобы по полученной избирателю сделать правильную оценку случайной величины, которая изучается. Поэтому основное требование, которое пред'яв-ляється к виборки, это максимальное отображение всех черт генеральной совокупности. Виборка, что удовлетворяет этому требованию, называется репрезентативной. От репрезентативности виборки зависит обгрунтованість оценки, то есть степень соответствия оценки параметру, который она характеризует.

При оценивании параметров генеральной совокупности по избирателю (параметрическом оценивании) пользуются такими понятиями:

• точечное оценивание - оценка параметра генеральной совокупности в виде единичного значения, которое он может принять с самой большой вероятностью.

• інтервальне оценивание - оценка параметра генеральной совокупности в виде интервала значений, который имеет заданную вероятность накрыть его истинное значение.

При інтервальному оценивании используют понятие:

• надежный интервал - интервал значений, который имеет заданную вероятность накрыть истинное значение параметра генеральной совокупности при інтервальному оценивании.

• достоверность (надежная вероятность) - вероятность, с которой надежный интервал накрывает истинное значение параметра генеральной совокупности.

• надежные границы - нижняя и верхняя границы надежного інтервала.

Выводы, которые получаются методами математической статистики, всегда основываются на ограниченном, выборочном числе наблюдений, поэтому природньо, что для второй виборки результаты могут быть другими. Это обстоятельство определяет ймовірносний характер выводов математической статистики и, как следствие, широкое использование теории вероятностей в практике статистического исследования.

Типичный путь статистического исследования такой:

оценивши величины или зависимости между ними по данным наблюдений, выдвигают допущение о том, что явление, которое изучается, можно описать той или другой стохастичною моделью

• используя статистические методы, можно это предположение подтвердить или отвергнуть; при подтверждении цель достигнута - найдена модель, которая описывает исследуемые закономерности, в противоположном случае продолжают работу, выдвигая и проверяя новую гипотезу.

Определение выборочных статистических оценок:

• мода - это значения, которое чаще всего встречается в избирателе,

• медиана - центральное (срединное) значение вариационного ряда

• размах R - разность между самым большим и наименьшим значениями в серии наблюдений

• процентилі - значение в вариационном ряде, которые делят распределение на 100 равных частей ( таким образом, медиана будет п'ятидесятим процентилем )

• первый квартиль - 25-ий процентиль

• третий квартиль - 75-ий процентиль

• міжквартильний размах - разность между первым и третьим квартилями (охватывает центральных 50% наблюдений)

• квартильне отклонение - половина міжквартильного размаха

• выборочное среднее 0x01 graphic
- среднее арифметическое всех выборочных значений 0x01 graphic
(выборочная оценка математического ожидания 0x01 graphic
)

0x01 graphic

• среднее абсолютное отклонение - сумма отклонений от соответствующего начала ( без учета знака), разделенная на объем виборки

• среднее абсолютное отклонение от выборочного среднего 0x01 graphic
вычисляют за формулой

0x01 graphic

• выборочная дисперсия 0x01 graphic
(X) - (выборочная оценка дисперсии ) определяется формулой

0x01 graphic

• выборочная коваріація -- (выборочная оценка коваріації К(Х,Y) ) равняется

0x01 graphic

• выборочный коэффициент регрессии Y на X 0x01 graphic
(выборочная оценка коэффициента регрессии Y на X ) 0x01 graphic
равняется

0x01 graphic

• эмпирическое уравнение линейной регрессии Y на X имеет вид

0x01 graphic

• выборочный коэффициент регрессии X на Y 0x01 graphic
(выборочная оценка коэффициента регрессии X на Y ) 0x01 graphic
равняется

0x01 graphic

• эмпирическое уравнение линейной регрессии X на Y имеет вид

0x01 graphic

• выборочное стандартное отклонение s(Х) - (выборочная оценка стандартного отклонения) равняется корню квадратному из выборочной дисперсии

• выборочный корреляційний коэффициент 0x01 graphic
- (выборочная оценка корреляционного коэффициента 0x01 graphic
) равняется

0x01 graphic

• выборочный коэффициент вариации γ - (выборочная оценка коэффициента вариации CV) равняется

0x01 graphic
.

8. Задача для самостоятельной подготовки студентов.

8.1 Задача для самостоятельного изучения материала с темы.

8.1.1 Практическое вычисление выборочных оценок

Практическое вычисление выборочных точечных оценок

Пример 1.

Продолжительность заболевания ( в днях) в 20 случаях пневмонии сложила:

10, 11, 6, 16, 7, 13, 15, 8, 9, 10, 11, 13, 7, 8, 13, 15, 16, 13, 14, 15

Определить моду, медиану, размах, міжквартильний размах, выборочное среднее, среднее абсолютное отклонение от выборочного среднего, выборочную дисперсию, выборочный коэффициент вариации.

Розв'зок.

Вариационный ряд для виборки имеет вид

6, 7, 7, 8, 8, 9, 10, 10, 11, 11, 13, 13, 13, 13, 14, 15, 15, 15, 16, 16

• Мода

Наиболее часто в избирателе встречается число 13. Поэтому значением моды в избирателе будет это число.

• Медиана

Когда вариационный ряд содержит парное число наблюдений, медиана равняется среднему двух центральных членов ряда, в данном случае это 11 и 13, поэтому медиана равняется 12.

• Размах

Минимальное значение в избирателе равняется 6, а максимальное 16, итак, R = 10.

• Міжквартильний размах, квартильне отклонение

В вариационном ряде четверть всех данных имеет значение меньшие, или уровне 8, поэтому первый квартиль 8, а 75% всех данных имеют значение меньшие, или уровне 12, поэтому третий квартиль 14. Итак, міжквартильний размах равняется 6, а квартильне отклонение составляет 3.

• Выборочное среднее

Среднее арифметическое всех выборочных значений равняется

0x01 graphic
.

• Среднее абсолютное отклонение от выборочного среднего

0x01 graphic
.

• Выборочная дисперсия

• Выборочное стандартное отклонение

0x01 graphic
.

• Bибірковий коэффициент вариации

0x01 graphic
.

В следующем примере рассмотрим простейшие средства изучения стохастичної зависимости между двумя случайными величинами.

Пример 2.

При обследовании группы пациентов получены данные о росте Н (см) и объем циркулирующей крови V (л) :

Н

170

169

175

150

175

155

180

160

185

175

165

V

4,8

5,1

4,0

5,3

4,1

5,3

4,8

4,3

5,2

5,2

4,7

Найти эмпирические уравнения линейной регрессії.

Розв'зок.

Первое, что необходимо вычислить, это:

• выборочное среднее

0x01 graphic

• выборочное среднее

0x01 graphic
.

Второе, что необходимо подсчитать, это:

• выборочную дисперсию 0x01 graphic
(Н)

0x01 graphic

• выборочную дисперсию 0x01 graphic
(V)

0x01 graphic

• выборочную коваріацію 0x01 graphic

0x01 graphic

Третье, это вычисления выборочных коэффициентов регрессии:

• выборочный коэффициент регрессии V на H 0x01 graphic

0x01 graphic

• выборочный коэффициент регрессии H на V 0x01 graphic

0x01 graphic
.

Четвертое, записать искомые уравнения:

• эмпирическое уравнение линейной регрессии V на H имеет вид

0x01 graphic

• эмпирическое уравнение линейной регрессии H на V имеет вид

0x01 graphic
.

Пример 3.

Используя условия и результаты примера 2, высчитать коэффициент корреляции и проверить достоверность существования корреляционной зависимости между ростом человека и объемом циркулирующей крови с 95% надежной вероятностью.

Розв'зок.

Коэффициент корреляції 0x01 graphic
связан с коэффициентами регрессии 0x01 graphic
и 0x01 graphic
практически полезной формулой

.

Для выборочной оценки коэффициента корреляції 0x01 graphic
эта формула имеет вид

.

Используя вираховані в примере 2 значение выборочных коэффициентов регрессії 0x01 graphic
и 0x01 graphic
, получим

.

Проверка достоверности корреляційної зависимости между случайными величинами (полагает нормальное распределение у каждой из них) осуществляется таким образом:

0x01 graphic

0x01 graphic

0x01 graphic
.

Поскольку 3,5 > 2,26, то с 95% надежной вероятностью существования корреляционной зависимости между ростом пациента и объемом циркулирующей крови можно считать установленным.

Інтервальні оценки для математического ожидания и дисперсии

Если случайная величина имеет нормальное распределение, то інтервальні оценки для математического ожидания и дисперсии вычисляют в такой последовательности:

1. находят выборочное среднее 0x01 graphic
;

2. подсчитывают выборочную дисперсию 0x01 graphic
и выборочное стандартное отклонение s;

3. в таблице распределения Стьюдента за надежной вероятностью α и объемом виборки n находят коэффициент Стьюдента 0x01 graphic
;

4. надежный интервал для математического ожидания записывают в виде

0x01 graphic

5. в таблице распределения "хи-квадрат" за надежной вероятностью α и объемом виборки n находят коэффициенты

0x01 graphic
;

6. надежный интервал для дисперсии записывают в виде

0x01 graphic

Величина надежного интервала, надежная вероятность α и объем виборки n зависят друг от друга. На самом деле, отношение

0x01 graphic

уменьшается с ростом n, итак, при постоянной величине надежного интервала с ростом n растет и α . При постоянной надежной вероятности с ростом объема виборки п уменьшается величина надежного интервала. При планировании медицинских исследований эта связь используют для определения минимального объема виборки, который обеспечит нужны по условиям решаемой задачи величины надежного интервала и надежной вероятности.

Пример 5.

Используя условия и результаты примера 1, найдите інтервальні оценки математического ожидания и дисперсии для 95% надежной вероятности.

Розв'зок.

В примере 1 вираховані точечные оценки математического ожидания (выборочное среднее 0x01 graphic
=12), дисперсии (выборочная дисперсия 0x01 graphic
=10,7) и стандартного отклонения (выборочное стандартное отклонение 0x01 graphic
). Объем виборки равняется п = 20.

Из таблицы распределения Стьюдента найдем значение коэффициента

0x01 graphic

дальше вычислим полуширину d надежного интервала

0x01 graphic

и запишем інтервальну оценку математического ожидания 0x01 graphic

10,5 < 0x01 graphic
< 13,5 при α = 95%

Из таблицы распределения Пірсона " хи-квадрат " найдем коэффициенты

0x01 graphic

0x01 graphic

вычислим нижнюю и верхнюю надежные границы

0x01 graphic
0x01 graphic

и запишем інтервальну оценку для дисперсии в виде

6,2 0x01 graphic
23 при α = 95% .

8.1.2. Задачи для самостоятельного решения

Для самостоятельного решения предлагаются задачи 5.4 С 1 - 8 (П.Г.Жуматій. “Математическая обработка медико-биологических данных. Задачи и примеры”. Одесса, 2009, с. 24-25)

8.1.3. Контрольные вопросы

  1. Частота класса (абсолютная и относительная).

  2. Генеральная совокупность и выборка, объем выборки.

  3. Точечное и інтервальне оценивание.

  4. Надежный интервал и достоверность.

  5. Мода, медиана и выборочное среднее.

  6. Размах, міжквартільний размах, квартальное отклонение.

  7. Среднее абсолютное отклонение.

  8. Выборочные коваріація и дисперсия.

  9. Выборочные стандартное отклонение и коэффициент вариации.

  10. Выборочные коэффициенты регрессии.

  11. Эмпирические уравнения регрессии.

  12. Вычисление корреляционного коэффициента и достоверности корреляционной связи.

  13. Построение інтервальних оценок нормально распределенных случайных величин.

8.2 Основная литература

  1. Жуматій П.Г. “Математическая обработка медико-биологических данных. Задачи и примеры”. Одесса, 2009.

  2. Жуматій П.Г. Лекция “Математическая статистика”. Одесса, 2009.

  3. Жуматій П.Г. “ Основы математической статистики”. Одесса, 2009.

  4. Жуматій П.Г., Сеницька Я.Р. Элементы теории вероятностей. Методические указания для студентов медицинского института. Одесса, 1981.

  5. Чалый О.В., Агапов Б.Т., Цехмістер Я.В. Медицинская и биологическая физика. Киев, 2004.

8.3 Дополнительная литература

  1. Ремізов О.M. Медицинская и биологическая физика. М., “Высшая школа”, 1999.

  2. Ремізов О.M., Ісакова Н.Х., Максіна О.Г.. Сборник задач из медицинской и биологической физики. М., .,“Высшая школа”, 1987.

Методические указания сложил доц. П. Г. Жуматій.

1

10



Wyszukiwarka

Podobne podstrony:
MT st w 06
Kosci, kregoslup 28[1][1][1] 10 06 dla studentow
06 Kwestia potencjalności Aid 6191 ppt
06 Podstawy syntezy polimerówid 6357 ppt
06
06 Psych zaburz z somatoformiczne i dysocjacyjne
GbpUsd analysis for July 06 Part 1
Probl inter i kard 06'03
06 K6Z4
06 pamięć proceduralna schematy, skrypty, ramyid 6150 ppt
Sys Inf 03 Manning w 06
Ustawa z dnia 25 06 1999 r o świadcz pien z ubezp społ w razie choroby i macierz
06 ZPIU org prod
06 Testowanie hipotez statystycznychid 6412 ppt
06 Testy korelacjiid 6413 ppt

więcej podobnych podstron