Как посчитать достоверность результатов исследования

В практической и научно-практической работе врачи обобщают результаты, полученные как правило на выборочных совокупностях. Для более широкого распространения и применения полученных при изучении репрезентативной выборочной совокупности данных и выводов надо уметь по части явления судить о явлении и его закономерностях в целом.

Учитывая, что врачи, как правило, проводят исследования на выборочных совокупностях, теория статистики позволяет с помощью математического аппарата (формул) переносить данные с выборочного исследования на генеральную совокупность. При этом врач должен уметь не только воспользоваться математической формулой, но сделать вывод, соответствующий каждому способу оценки достоверности полученных данных. С этой целью врач должен знать способы оценки достоверности.

Применяя метод оценки достоверности результатов исследования для изучения общественного здоровья и деятельности учреждений здравоохранения, а также в своей научной деятельности, исследователь должен уметь правильно выбрать способ данного метода. Среди методов оценки достоверности различают параметрические и непараметрические.

Параметрическими называют количественные методы статистической обработки данных, применение которых требует обязательного знания закона распределения изучаемых признаков в совокупности и вычисления их основных параметров.

Непараметрическими являются количественные методы статистической обработки данных, применение которых не требует знания закона распределения изучаемых признаков в совокупности и вычисления их основных параметров.

Как параметрические, так и непараметрические методы, используемые для сравнения результатов исследований, т.е. для сравнения выборочных совокупностей, заключаются в применении определенных формул и расчете определенных показателей в соответствии с предписанными алгоритмами. В конечном результате высчитывается определенная числовая величина, которую сравнивают с табличными пороговыми значениями. Критерием достоверности будет результат сравнения полученной величины и табличного значения при данном числе наблюдений (или степеней свободы) и при заданном уровне безошибочного прогноза.

Таким образом, в статистической процедуре оценки основное значение имеет полученный критерий достоверности, поэтому сам способ оценки достоверности в целом иногда называют тем или иным критерием по фамилии автора, предложившего его в качестве основы метода.

При проведении выборочных исследований полученный результат не обязательно совпадает с результатом, который мог бы быть получен при исследовании всей генеральной совокупности. Между этими величинами существует определенная разница, называемая ошибкой репрезентативности, т.е. это погрешность, обусловленная переносом результатов выборочного исследования на всю генеральную совокупность.

Данный способ применяется в тех случаях, когда по результатам выборочной совокупности необходимо судить о размерах изучаемого явления (или признака) в генеральной совокупности.

Обязательным условием для применения способа является репрезентативность выборочной совокупности. Для переноса результатов, полученных при выборочных исследованиях, на генеральную совокупность необходима степень вероятности безошибочного прогноза (Р), показывающая, в каком проценте случаев результаты выборочных исследований по изучаемому признаку (явлению) будут иметь место в генеральной совокупности.

При определении доверительных границ средней величины или относительного показателя генеральной совокупности, исследователь сам задает определенную (необходимую) степень вероятности безошибочного прогноза (Р).

Для большинства медико-биологических исследований считается достаточной степень вероятности безошибочного прогноза, равная 95%, а число случаев генеральной совокупности, в котором могут наблюдаться отклонения от закономерностей, установленных при выборочном исследовании, не будут превышать 5%. При ряде исследований, связанных, например, с применением высокотоксичных веществ, вакцин, оперативного лечения и т.п., в результате чего возможны тяжелые заболевания, осложнения, летальные исходы, применяется степень вероятности Р = 99,7%, т.е. не более чем у 1% случаев генеральной совокупности возможны отклонения от закономерностей, установленных в выборочной совокупности.

Заданной степени вероятности (Р) безошибочного прогноза соответствует определенное, подставляемое в формулу, значение критерия t, зависящее также и от числа наблюдений.

Вывод. Установлено с вероятностью безошибочного прогноза Р = 95%, что средняя частота пульса в генеральной совокупности, т.е. у всех водителей сельскохозяйственных машин, через 1 ч работы в аналогичных условиях будет находиться в пределах от 78 до 82 ударов в минуту, т.е. средняя частота пульса менее 78 и более 82 ударов в минуту возможна не более, чем у 5% случаев генеральной совокупности.

на определение ошибок репрезентативности (m) и доверительных границ относительного показателя генеральной совокупности (Р_ген)

Условие задачи: при медицинском осмотре 164 детей 3 летнего возраста, проживающих в одном из районов городе Н., в 18% случаев обнаружено нарушение осанки функционального характера.

Задание: определить ошибку репрезентативности (m_p) и доверительные границы относительного показателя генеральной совокупности (Р_ген).

Вывод. Установлено с вероятностью безошибочного прогноза Р=95%, что частота нарушения осанки функционального характера у детей 3 летнего возраста, проживающих в городе Н., будет находиться в пределах от 12 до 24% случаев.

Данный способ применяется в тех случаях, когда необходимо определить, случайны или достоверны (существенны), т.е. обусловлены какой-то причиной, различия между двумя средними величинами или относительными показателями.

Обязательным условием для применения данного способа является репрезентативность выборочных совокупностей, а также наличие причинно-следственной связи между сравниваемыми величинами (показателями) и факторами, влияющими на них.

Формулы определения достоверности разности представлены следующим образом:

для средних величин

для относительных
показателей

Если вычисленный критерий t более или равен 2 (t ≥ 2), что соответствует вероятности безошибочного прогноза Р равном или более 95% (Р ≥ 95%), то разность следует считать достоверной (существенной), т.е. обусловленной влиянием какого-то фактора, что будет иметь место и в генеральной совокупности.

При t 99,7%, следовательно можно утверждать, что различия в средних значениях пульса у водителей сельскохозяйственных машин до и после 1 ч работы не случайно, а достоверно, существенно, т.е. обусловлено влиянием воздействия шума и низкочастотной вибрации.

на оценку достоверности разности относительных показателей

Условие задачи: при медицинском осмотре детей 3 летнего возраста в 18% (m = ± 3%) случаях обнаружено нарушение осанки функционального характера. Частота аналогичных нарушений осанки при медосмотре детей 4-летнего возраста составила 24% (m = ± 2,64%).

Задание: оценить достоверность различий в частоте нарушения осанки у детей 2 возрастных групп.

Применение методов статистического анализа для изучения общественного здоровья и здравоохранения. Под ред. чл.-корр. РАМН, проф. В.З.Кучеренко. М., «Гэотар-Медиа», 2007, учебное пособие для вузов

Источник

ТЕМА №4. ОЦЕНКА ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ

ЦЕЛЬ ЗАНЯТИЯ. Освоить параметрические методы оценки достоверности результатов статистического исследования и овладеть методикой расчета ошибок средних и относительных величин, доверительных границ этих величин, методикой расчета достоверности разности средних и относительных величин.

МЕТОДИКА ПРОВЕДЕНИЯ ЗАНЯТИЯ. Студенты самостоятельно готовятся к практическому занятию по рекомендованной литературе и выполняют индивидуальное домашнее задание. Преподаватель в течение 10 минут проверяет правильность выполнения домашнего задания и указывает на допущенные ошибки, проверяет степень подготовки с использованием тестирования и устного опроса. Затем студенты самостоятельно вычисляют ошибки репрезентативности средних и относительных показателей, доверительные границы выборочных производных величин, оценивают достоверность разности между сравниваемыми выборочными величинами. В конце занятия преподаватель проверяет самостоятельную работу студентов.

КОНТРОЛЬНЫЕ ВОПРОСЫ:

1. Что оказывает влияние на достоверность статистических данных?

2. Какая доверительная вероятность допустима в медицинских исследованиях?

3. Какой будет величина коэффициента достоверности при вероятности безошибочного прогноза 95%?

4. Какая формула используется для определения ошибки относительного показателя?

5. Какая формула применяется для оценки достоверности различий между относительными величинами?

6. Как оценить критерий достоверности при больших и малых выборках?

КРАТКОЕ СОДЕРЖАНИЕ ТЕМЫ:

В тех случаях, когда уровень относительного показателя превышает величину основания (общий уровень заболеваемости составил 1300 случаев на 1000 человек), определение ошибки представительности по указанной выше формуле становится невозможным, и если показатель находится в пределах от 1,0 до 1,5 в среднем на одного человека, то ошибку представительности следует определять по формуле: m = , где М – среднее число заболеваний на одного человека (при заболеваемости 1300‰ – М = 1,3), n –общее число наблюдений.

Поскольку полученное значение (0.7) меньше двух, различия между средними величинами статистически недостоверны (незначимы). Следовательно, влияние инсулина на содержание белков в крови приведенными выше данными не подтверждается и остается недоказанным, возможно, из-за недостаточного числа определений.

Вывод. Значение критерия t = 3,5 соответствует вероятности безошибочного прогноза Р > 99%, следовательно, можно утверждать, что различия в средних значениях пульса у водителей сельскохозяйственных машин до и после 1 ч. работы не случайно, а достоверно, существенно, т.е. обусловлено влиянием воздействия шума и низкочастотной вибрации.

Для малых по объему выборок лучшим способом определения достоверности различий разнообразия признаков является критерий F Фишера.

где — дисперсии первой и второй выборки соответственно. Как уже было отмечено, показателем степени разнообразия служит основное отклонение — σ (сигма). Еще более чувствительным показателем степени разнообразия (варьирования, дисперсии, разброса данных) служит σ 2 (варианса, девиата, дисперсия).

Так как, согласно условию вычисления критерия, величина числителя должна быть больше или равна величине знаменателя, то значение F всегда будет больше или равно единице. Число степеней свободы определяется также просто:

В приложении, табл. 5 критические значения критерия Фишера находятся по величинам k₁ (верхняя строчка таблицы) и k₂ (левый столбец таблицы). Если t_эмп>t_крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.

Пример.В двух третьих классах проводилось тестирование умственного развития десяти учащихся. Полученные значения средних величин достоверно не различались, однако психолога интересует вопрос — есть ли различия в степени однородности показателей умственного развития между классами.

Решение. Для критерия Фишера необходимо сравнить дисперсии тестовых оценок в обоих классах. Результаты тестирования представлены в таблице:

№№ учащихся	Первый класс	d	d 2	Второй класс	d	d 2
29,4	864,4	-22,6	510,8
-31,6	998,6	-14,6	213,2
-21,6	466,6	-7,6	57,8
18,4	338,6	0,4	0,16
27,4	750,8	8,4	70,6
-7,6	57,8	1,4	1,96
-26,6	707,6	-0,6	0,36
-20,6	424,4	23,4	547,6
14,4	207,4	13,4	179,6
18,4	338,6	-1,6	2,6
Суммы	5154,8	1584,7
Среднее	60,6	63,6

Среднеквадратическое отклонение для простого ряда при числе наблюдений меньше 30 вычисляется по формуле:

Дисперсия представляет собой сумму средних квадратов отклонений. Рассчитав дисперсии для переменных X и Y, получаем:

Тогда по формуле для расчета по критерию Фишера F находим

F = =3,25

Задача 11

Из 360 больных, направленных в стационар станцией скорой и неотложной помощи, случаи расхождения диагнозов были отмечены у 42 пациентов, а из 113 больных, направленных поликлиникой, случаи расхождения диагнозов между поликлиникой и стационаром отмечены у 10 пациентов. Имеется ли достоверная разница в качестве диагностики в поликлинике и станции скорой и неотложной помощи?

Задача 12

Из 63 пациентов хирургического отделения, прооперированных с помощью плазменного скальпеля, гладкое послеоперационное течение отмечено у 59 человек, тогда как из 42 больных, прооперированных обычным способом, послеоперационных осложнений не было у 26 человек. Действительно ли применение плазменного скальпеля достоверно улучшает результаты лечения?

Задача 13

При выяснении уровеня компьютерной грамотности врачей и сестер-руководителей, получены следующие результаты: из 77 опрошенных врачей владеют компьютером в объеме пользователя 50 человек, а из 29 опрошенных старших медицинских сестер – 12. Имеется ли достоверная разница в уровне компьютерной грамотности врачей и старших медицинских сестер?

Задача 14

Задание №4. Вычислите ошибки средних величин и оцените достоверность разности двух средних показателей

Задача 1

Средний возраст вступления в брак у 350 опрошенных студенток составил 19,8 года, среднеквадратическое отклонение равно 11,4, тогда как аналогичный показатель у 265 студентов-мужчин оказался равным 21,5 года, а среднеквадратическое отклонение составило 8,6. Достоверно ли отличается средний возраст вступления в брак у студентов разного пола?

Задача 2

Средний уровень гемоглобина у 445 детей, получавших коровье молоко с первых месяцев жизни (до 3-х месяцев), составил 114,69 (среднеквадратическое отклонение равно 5,8). У 326 детей, получавших коровье молоко начиная с 7 месяца жизни, средний уровень гемоглобина составил 117,5, а среднеквадратическое отклонение 4,5. Достоверно ли отличается средний уровень гемоглобина у детей с разными сроками введения коровьего молока в рацион?

Задача 3

Средняя продолжительность одного случая временной нетрудоспособности у студентов 1 курса лечебного факультета (всего 41 случай ВН) составила 5,8 дня, среднеквадратической отклонение равно 2,3, тогда как у студентов стоматологического факультета средняя продолжительность одного случая временной нетрудоспособности (всего 35 случаев ВН) составила 3,6 дня, а среднеквадратическое отклонение 1,9. Достоверно ли отличается средняя продолжительность одного случая временной нетрудоспособности на двух факультетах?

Задача 4

Средний уровень успеваемости 315 студентов 6 курса лечебного факультета по дисциплине «Общественное здоровье и здравоохранение» составил 4,3 балла, среднеквадратическое отклонение равно 1,6, тогда как у 119 студентов педиатрического факультета эти показатели соответственно равны 3,9 балла и 1,1. Достоверно ли отличается уровень успеваемости выпускников на двух факультетах?

Задача 5

Среднее число беременностей у 210 женщин 35 лет, имевших самопроизвольные аборты в анамнезе, составило 6,3, при этом среднеквадратическое отклонение равно 2,8, а у 432 женщин этого же возраста, не имевших самопроизвольных абортов, среднее число беременностей составило 2,9, а среднеквадратическое отклонение равно 5,4. Достоверно ли отличается число беременностей у женщин, имевших самопроизвольные аборты в анамнезе?

Задача 6

Средний срок наблюдения за 189 пациентами с неосложненной формой острого аппендицита в стационаре составил 8,2 дня, при среднеквадратическом отклонении равном 3,1, тогда как при осложненной форме (53 чел.) длительность пребывания в стационаре увеличилась у до 11,4 дня при среднеквадратическом отклонении равном 2,2. Достоверно ли увеличивается средний срок пребывания в стационаре при осложненной форме острого аппендицита?

Задача 7

Средний рост мальчиков 7 лет в 389 семьях со здоровым образом жизни составил 130,5 см. (σ =4,3), а в 59 неблагополучных по алкоголизму семьях 123,3 см. (σ =5,8). Достоверно ли снижение роста у детей в семьях неблагополучных по алкоголизму?

Задача 8

Средний возраст первого сексуального опыта у 266 опрошенных городских девушек составил 15,2 года, при среднеквадратическом отклонении равном 4,8; тогда как у 150 сельских девушек он составил 16,9 года, при среднеквадратическом отклонении равном 7,6. Имеется ли статистически достоверная разница между началом половой жизни у городских и сельских девушек?

Рекомендуемая литература:

· Лисицын Ю.П. Общественное здоровье и здравоохранение. Учебник для вузов. — М.: ГЭОТАР-МЕД, 2007. — 512 с.

· Общественное здоровье и здравоохранение. Под ред. В.А. Миняева, Н.И. Вишнякова М. «МЕДпресс-информ»., 2002. – с. 108-109, 113-114.

Источник

Оценка степени достоверности результатов количественного анализа

Оценка степени достоверности результатов

Важной составляющей количественного анализа является оценка степени надежности (достоверности) полученного результата. Конечный результат анализа, так же как и любое измерение, выполняемое в ходе анализа, всегда содержит некоторую погрешность, которую необходимо уметь оценить. Ее величина часто является определяющей при принятии каких-либо решений на основании результата анализа.

1. Погрешности в количественном анализе

Погрешности по своему характеру делятся на систематические, случайные и промахи, а по способу выражения на абсолютные и относительные.

Систематические погрешности – это погрешности одинаковые по знаку. Они возникают под действием каких-либо постоянных причин и делятся на методические, инструментальные и индивидуальные.

Методические погрешности зависят от особенностей применяемого метода анализа и являются следствием, например, не вполне количественного протекания реакции, частичной растворимости осадка, гигроскопичности гравиметрической формы и т. д. Методические погрешности трудно устранимы, но могут быть учтены при расчетах.

Инструментальные погрешности зависят от применяемых приборов, весов, мерной посуды и т. д. Они устраняются или учитываются путем калибровки посуды, применения стандартных веществ и образцов и т. д.

Индивидуальные погрешности зависят от индивидуальных особенностей экспериментатора. Они постоянны во всех измерениях.

Случайные погрешности – это неопределенные по величине и знаку погрешности. В их появлении нет какой-либо закономерности.

Результаты анализа одного и того же вещества, полученные на одних и тех же приборах, с использованием одних и тех же реактивов и посуды, одним и тем же экспериментатором, как правило, несколько отличаются друг от друга вследствие случайных погрешностей. Случайные погрешности нельзя измерить. Их влияние на результат анализа оценивается путем обработки результатов параллельных определений с помощью методов математической статистики.

Промахи – это ошибочные результаты, существенно отличающиеся от других результатов ряда параллельных определений. Они могут являться следствием неправильного подсчета разновесов, неправильного отсчета объема раствора по бюретке, потери части раствора или осадка и т. д. Промахи исключаются из результатов серии параллельных определений с помощью специальных приемов.

Абсолютная погрешность Еа единичного измерения или результата анализа определяется разницей между экспериментальным Э и истинным или действительным (теоретическим) Т значением определяемой величины:

и имеет размерность измеряемой величины (г, мл, % и т. д.).

Истинное значение определяемой величины чаще всего неизвестно. Поэтому вместо него используется так называемое действительное значение, которое получают расчетным путем (массовая доля иона или элемента в веществе определенного состава) или экспериментально (содержание определяемого компонента в стандартном образце).

Относительная погрешность Er – это отношение │Еа│ к Т, выраженное в процентах:

2. Правильность и воспроизводимость результатов анализа

Правильность результата измерения или анализа характеризуется его близостью к истинному (действительному) значению определяемой величины. Очевидно, что чем правильнее выполнено измерение или анализ, тем меньше значения Еа и Еr.

Воспроизводимость результата измерения или анализа характеризуется близостью друг к другу значений единичных результатов в серии параллельных измерений или определений.

Случайные погрешности влияют на воспроизводимость измерений, анализа или метода анализа. Их влияние на результат анализа уменьшается с увеличением числа параллельных определений, выполняемых в идентичных условиях.

Очевидно, что хорошая воспроизводимость указывает на отсутствие случайных погрешностей, но не является свидетельством правильности анализа. Правильным он будет лишь в отсутствие систематической погрешности.

Критериями воспроизводимости служат отклонения единичных результатов (вариант) xiот среднегоряда вариант (выборки или выборочной совокупности):

di = ,

среднее значение единичных отклонений от среднего:

дисперсия V (S2), стандартное отклонение S, стандартное отклонение среднего и относительное стандартное отклонение Sr. Чем меньше численное значение указанных величин, тем лучше воспроизводимость.

Чаще всего в качестве критериев воспроизводимости используются дисперсия и стандартное отклонение. Дисперсия выборки характеризует рассеяние вариант (значений определяемой величины xi) относительно среднего значения и вычисляется по формуле

Стандартное отклонение выборки – положительное значение корня квадратного из дисперсии

Стандартное отклонение среднего – результат деления S на :

Стандартное отклонение выборки и стандартное отклонение среднего имеют размерность определяемой величины.

Относительное стандартное отклонение Sr вычисляется по формуле:

·100%.

Если объем выборки достаточно большой (n>20), то такую выборочную совокупность можно считать генеральной совокупностью, в которой среднее и истинное (Т или ) значения совпадают. В этом случае стандартное отклонение σ вычисляется по формуле:

В том случае, когда истинное (действительное) значение определяемой величины неизвестно, то, в отсутствие систематической погрешности, правильность оценивается с использованием данных по воспроизводимости.

При этом оценка правильности заключается в нахождении доверительного интервала δ, в котором с определенной доверительной вероятностью находится истинное значение определяемой величины.

Для выборки из n вариант (ряда из n значений) полуширина доверительного интервала δ вычисляется по формуле:

где tp, f – коэффициент Стьюдента, величина которого зависит от доверительной вероятности Р и числа степеней свободы f (табл. 1).

Некоторые значения коэффициентов Стьюдента tp, f для расчета границ доверительного интервала при доверительной вероятности Р, объеме выборки n, числе степеней свободы f = n–1

Значение tp, f при доверительной вероятности

Источник