Как поступают с грубыми погрешностями
Грубые погрешности и методы их исключения
Министерство образования и науки Российской Федерации
ФГБОУ ВПО «Тамбовский государственный технический университет»
ГРУБЫЕ ПОГРЕШНОСТИ И МЕТОДЫ ИХ ИСКЛЮЧЕНИЯ
Утверждено Методическим советом ТГТУ в качестве
методических указаний для студентов, обучающихся по направлениям
27.03.02 «Управление качеством», 15.03.06 «Мехатроника и робототехника»,
13.03.02 «Электроэнергетика и электротехника»,
13.03.01 «Теплоэнергетика и теплотехника»,
22.04.01 «Материаловедение и технологии материалов»
Доктор технических наук
Утверждено Методическим советом ТГТУ
ГРУБЫЕ ПОГРЕШНОСТИ И МЕТОДЫ ИХ ИСКЛЮЧЕНИЯ
Цель работы: изучить классификацию погрешностей; ознакомиться с методами исключения грубых погрешностей; получить практические навыки обработки результатов измерений по обнаружению грубых погрешностей.
Задание. Решить задачи, согласно полученному варианту (см. табл. 6).
Грубой погрешностью (промахом) называется погрешность, существенно превышающая значение ожидаемой погрешности при данных условиях проведения измерительного эксперимента. Обычно грубая погрешность является следствием значительного внезапного изменения условий эксперимента: броска тока источника электропитания; не учтенное экспериментатором изменение температуры окружающей среды (при длительном эксперименте); неправильный отсчет показаний из-за отвлечения внимания экспериментатора и др.
При однократных измерениях обнаружить промах не представляется возможным. Для уменьшения вероятности появления промахов измерения проводят два-три раза и за результат принимают среднее арифметическое полученных отсчетов. При многократных измерениях для обнаружения промахов используют статистические критерии, такие как критерий Романовского, критерий Шарлье, критерий Диксона.
Для выявления грубых погрешностей задаются уровнем значимости q (вероятностью P) того, что сомнительный результат действительно мог иметь место в данной совокупности результатов измерений.
Критерий Романовского применяется, если число измерений n 20). Тогда по теореме Бернулли число результатов, превышающих по абсолютного значению среднее арифметическое значение на величину , будет
, где
— значение нормированной функции Лапласа для X = Kш.
Если сомнительным в ряду результатов наблюдений является один результат, то
.
.
Значения критерия Шарлье приведены в таблице 3.
Грубые погрешности.
Грубая погрешность, или промах, – это погрешность результатаотдельного измерения, входящего в ряд измерений, которая для данныхусловий резко отличается от остальных результатов этого ряда.Источником грубых погрешностей нередко бывают ошибки, допущенныеоператором во время измерений. К ним можно отнести:
− неправильный отсчет по шкале измерительного прибора,происходящий из-за неверного учета цены малых делений шкалы;
− неправильная запись результата наблюдений, значений отдельных мер использованного набора, например гирь.
Грубые погрешности, как правило, возникают при однократных измерениях и обычно устраняются путем повторных измерений. Их причинами могут быть внезапные и кратковременные изменения условий измерения или оставшиеся незамеченными неисправности в аппаратуре. Под промахом понимается значение погрешности, отклонение которого от центра распределения существенно превышает значение, оправданное объективными условиями измерения. Поэтому с точки зрения теории вероятности появление промаха маловероятно.
Особую неприятность доставляют отсчеты, которые хотя и не входят в компактную группу основной массы отсчетов выборки, но и не удалены от нее на значительное расстояние, – так называемые предполагаемые промахи. Отбрасывание «слишком» уда-
ленных от центра выборки отсчетов называется цензурированием выборки.
Это осуществляется с помощью специальных критериев. При однократных измерениях обнаружить промах не представляется возможным. Для уменьшения вероятности появления промахов измерения проводят два-три раза и за результат принимают среднее арифметическое полученных отсчетов. При многократных измерениях для обнаружения
промахов используют статистические критерии, предварительно определив, какому виду распределения соответствует результат измерений.
Вопрос о том, содержит ли результат наблюдений грубую погрешность, решается общими методами проверки статистических гипотез Проверяемая гипотеза состоит в утверждении, что результат наблюдения х, не содержит грубой погрешности, т.е. является одним из значений измеряемой величины. Пользуясь определенными статистическими критериями, пытаются опровергнуть выдвинутую гипотезу. Если это удается, то результат наблюдений рассматривают как содержащий грубую погрешность и его исключают.
Для выявления грубых погрешностей задаются вероятностью q —
уровнем значимости того, что сомнительный результат действительно мог
иметь место в данной совокупности результатов измерений.
Следует заметить, что в нормативной документации по статистическому контролю качества продукции и учебниках по управлению качеством вероятность признать негодной партию годных изделий называют “риском производителя”, а вероятность принять негодную партию – “риском потребителя
Проверку статистической гипотезы проводят для принятого уровня значимости q (принимается равным 0,1; 0,05; 0,01 и т. д.). Так принятый уровень значимости q = 0,05 означает, что выдвинутая нулевая статистическая гипотеза может быть принята с доверительной вероятностью P = 0,95.. Нулевая статистическая гипотеза подтверждает принадлежность проверяемого “подозрительного” результата измерения (наблюдения) данной группе измерений.
где xiпод – результат наблюдения, проверяемый на наличие грубой погрешности;
Таким образом, границы погрешности зависят от вида распределения, объема выборки и выбранной доверительной вероятности.
Критерий «трех сигм» применяется для результатов измерений,
распределенных по нормальному закону. По этому критерию считается,
что результат, возникающий с вероятностью q 3Sx , где Sx – оценка СКО
измерений. Величины X и Sx вычисляют без учета экстремальных
значений xi . Данный критерий надежен при числе измерений n ≥ 20. 50.
Это правило обычно считается слишком жестким, поэтому
рекомендуется назначать границу цензурирования в зависимости от
приведены в таблице 4.3 [27].
Применение рассмотренных критериев требует осмотрительности и
учета объективных условий измерений. Конечно, оператор должен
исключить результат наблюдения с явной грубой погрешностью и
выполнить новое измерение. Но он не имеет права отбрасывать более или
менее резко отличающиеся от других результаты наблюдений. В
сомнительных случаях лучше сделать дополнительные измерения (не
взамен сомнительных, а кроме них) и затем привлекать на помощь
рассмотренные выше статистические критерии. Кроме рассмотренных
критериев существуют и другие, например критерии Граббса и Шовенэ
Пример 1. При измерении диаметра вала микрометром были получены
значения: 12,24; 12,26; 12,28; 12,28; 12,31; 12,34; 12,40; 12,41; 12,42; 12,42;
12,45; 12,80 мм. Число измерений n = 12. Последний результат (12,80 мм) вы-
зывает сомнения. Принимаем Р= 0,95, тогда q = 0,05.
Выполнив расчеты, получили значения − х = 12,38 мм; S = 0,15 мм. Так
как n βти результат хi =
хпр= 12,80 мм необходимо «отбросить», как промах.
После исключения результатов, содержащих промахи, определяют но-
вые значения хи S и, если есть сомнения, процедуру проверки наличия прома-
Методы исключения грубых погрешностей
Грубая погрешность, или промах – это погрешность результата отдельного измерения, входящего в ряд измерений, которая для данных условий резко отличается от остальных результатов этого ряда. Источником грубых погрешностей нередко бывают резкие изменения условий измерения и ошибки, допущенные оператором.
К ним можно отнести:
• неправильный отсчет по шкале измерительного прибора, происходящий из-за неверного учета цены малых делений шкалы;
• неправильная запись результата наблюдений, значений отдельных мер использованного набора, например гирь;
• хаотические изменения параметров питающего СИ напряжения, например его амплитуды или частоты.
Если «свои» и «чужие» отсчеты различаются по значениям, то их исключают из выборки (рис.6.1,а). Особую неприятность доставляют отсчеты, которые хотя и не входят в компактную группу основной массы отсчетов выборки, но и не удалены от нее на значительное расстояние, – так называемые предполагаемые промахи (рис. 6.1,6).
Рисунок 6.1 – Проявление промахов на дифференциальном законе распределения вероятности
Отбрасывание «слишком» удаленных от центра выборки отсчетов называется цензурированием выборки. Это осуществляется с помощью специальных критериев.
При однократных измерениях обнаружить промах не представляется возможным. Для уменьшения вероятности появления промахов измерения проводят два-три раза и за результат принимают среднее арифметическое полученных отсчетов. При многократных измерениях для обнаружения промахов используют статистические критерии, предварительно определив, какому виду распределения соответствует результат измерений.
Вопрос о том, содержит ли результат наблюдений грубую погрешность, решается общими методами проверки статистических гипотез. Проверяемая гипотеза состоит в утверждении, что результат наблюдения хi не содержит грубой погрешности, т.е. является одним из значений измеряемой величины. Пользуясь определенными статистическими критериями, пытаются опровергнуть выдвинутую гипотезу. Если это удается, то результат наблюдений рассматривают как содержащий грубую погрешность и его исключают.
Для выявления грубых погрешностей задаются вероятностью q (уровнем значимости) того, что сомнительный результат действительно мог иметь место в данной совокупности результатов измерений.
Критерий «трех сигм» применяется для результатов измерений, распределенных по нормальному закону. По этому критерию считается, что результат, возникающий с вероятностью q0,003, маловероятен и его можно считать промахом, если
, где Sx – оценка СКО измерений. Величины
и Sx вычисляют без учета экстремальных значений хi. Данный критерий надежен при числе измерений n > 20-50.
Это правило обычно считается слишком жестким, поэтому рекомендуется назначать границу цензурирования в зависимости от объема выборки: при 6 Данное правило также применимо только для нормального закона.
В общем случае границы цензурирования tгр, Sх выборки зависят не только от объема n, но и от вида распределения. Назначая ту или иную границу, необходимо оценить уровень значимости q, т.е. вероятность исключения какой-либо части отсчетов, принадлежащих обрабатываемой выборке.
Выражение для приближенного расчета коэффициента tгр при уровне значимости q
• кругловершинных двухмодальных распределений с ε = 1,5, 3, являющихся композицией дискретного двузначного и нормального распределений;
• островершинных двухмодальных распределений с ε = 1,5, 6, являющихся композицией дискретного двузначного распределения и распределения Лапласа;
• композиций равномерного и экспоненциальных распределений с показателем степени α = 1/2 при ε = 1,8, 6;
• экспоненциальных распределений с ε = 1,5, 6.
Критерий Романовского применяется, если число измерений n βт, то результат xi считается промахом и отбрасывается.
Пример 6.3. При диагностировании топливной системы автомобиля результаты пяти измерений расхода топлива составили: 22, 24, 26, 28, 30 л на 100 км. Последний результат вызывает сомнение. Проверить по критерию Романовского, не является ли он промахом.
Значения критерия Романовского β = f(n)
q | n = 4 | n = 6 | n = 8 | n = 10 | n = 12 | n = 15 | n = 20 |
0,01 0,02 0,05 0,10 | 1,73 1,72 1,71 1,69 | 2,16 2,13 2,10 2,00 | 2,43 2,37 2,27 2,17 | 2,62 2,54 2,41 2,29 | 22,75 2,66 2,52 2,39 | 2,90 2,80 2,64 2,49 | 3,08 2,96 2,78 2,62 |
Найдем среднее арифметическое значение расхода топлива и его СКО без учета последнего результата, т.е. для четырех измерения. Они соответственно равны 25 и 2,6 л на 100 км.
Критерий Романовского свидетельствует о необходимости отбрасывания последнего результата измерения.
Вариационный критерий Диксона удобный и достаточно мощный (с малыми вероятностями ошибок). При его применении полученные результаты наблюдений записывают в вариационный возрастающий ряд x1, х2, хn (х1 Zp) = q. Значения Zp приведены в табл. 6.2.
Пример 6.4. Было проведено пять измерений напряжения в электросети. Получены следующие данные: 127,1; 127,2; 126,9; 127,6; 127,2 В. Результат 127,6 В существенно (на первый взгляд) отличается от остальных. Проверить, не является ля он промахом.
Составим вариационный ряд из результатов измерений напряжения в электросети: 126,9; 127,1; 127,2; 127,2; 127,6 В. Для крайнего члена этого ряда (127,6 В) критерий Диксона
Значения критерия Диксона
n | Zq при q, равном | ||
0,10 | 0,05 | 0,02 | 0,01 |
0,68 0,48 0,40 0,35 0,29 0,28 0,26 0,26 0,22 | 0,76 0,56 0,47 0,41 0,35 0,33 0,31 0,30 0,26 | 0,85 0,64 0,54 0,48 0,41 0,39 0,37 0,36 0,31 | 0,89 0,70 0,59 0,53 0,45 0,43 0,41 0,39 0,34 |
Как следует из табл.6.2, по этому критерию результат 127,6 В может быть отброшен как промах лишь на уровне значимости q = 0,10.
Применение рассмотренных критериев требует осмотрительности и учета объективных условий измерений. Конечно, оператор должен исключить результат наблюдения с явной грубой погрешностью и выполнить новое измерение. Но он не имеет права отбрасывать более или менее резко отличающиеся от других результаты наблюдений. В сомнительных случаях лучше сделать дополнительные измерения (не взамен сомнительных, а кроме них) и затем привлекать на помощь рассмотренные выше статистические критерии. Кроме рассмотренных критериев, существуют и другие, например критерии Граббса и Шовенэ.
Отсеивание грубых погрешностей результатов измерений с помощью различных критериев в среде Excel
Рубрика: Технические науки
Дата публикации: 29.11.2021 2021-11-29
Статья просмотрена: 26 раз
Библиографическое описание:
Гапеева, В. Д. Отсеивание грубых погрешностей результатов измерений с помощью различных критериев в среде Excel / В. Д. Гапеева, В. А. Цыбенко. — Текст : непосредственный // Молодой ученый. — 2021. — № 49 (391). — С. 20-27. — URL: https://moluch.ru/archive/391/86128/ (дата обращения: 22.12.2021).
В статье рассмотрены различные критерии отбрасывания грубых погрешностей измерений, применяемые в практической деятельности, на основе рекомендаций ведущих специалистов-метрологов, а также с учетом действующих в настоящий момент нормативных документов.
Приведен пример использования Excel при оценке грубых погрешностей по критериям Стьюдента и Романовского при обработке реальных результатов измерений.
Ключевые слова: грубые погрешности, критерии согласия, сомнительные значения, уровень значимости, нормальное распределение, критерий согласия Стьюдента, критерий Романовского, выборка, отклонения, Excel.
Одним из важнейших условий правильного применения статистических оценок является отсутствие грубых ошибок при наблюдениях. Поэтому все грубые ошибки должны быть выявлены и исключены из рассмотрения в самом начале обработки наблюдений.
Единственным достаточно надежным способом выявления грубых ошибок является тщательный анализ условий самих испытаний. При этом наблюдения, проводившиеся в нарушенных условиях, должны отбрасываться, независимо от их результата. Например, если при проведении эксперимента, связанного с электричеством, в лаборатории на некоторое время был выключен ток, то весь эксперимент обязательно нужно проводить заново, хотя результат, быть может, не сильно отличается от предыдущих измерений. Точно так же отбрасываются результаты измерений на фотопластинках с поврежденной эмульсией и вообще на любых образцах с обнаруженным позднее дефектом.
На практике, однако, не всегда удается провести подобный анализ условий испытания. Чаще всего приходится иметь дело с окончательным цифровым материалом, в котором отдельные данные вызывают сомнение лишь своим значительным отклонением от остальных. При этом сама «значительность» отклонения во многом субъективна — зачастую приходится сталкиваться со случаями, когда исследователь отбрасывает наблюдения, которые ему не понравились, как ошибочные исключительно по той причине, что они нарушают уже созданную им в воображении картину изучаемого процесса.
Строгий научный анализ готового ряда наблюдений может быть проведен лишь статистическим путем, причем должен быть достаточно хорошо известен характер распределения наблюдаемой случайной величины. В большинстве случаев исследователи исходят из нормального распределения. Каждая грубая ошибка будет соответствовать нарушению этого распределения, изменению его параметров, иными словами, нарушится однородность испытаний (или, как говорят , однородность наблюдений), поэтому выявление грубых ошибок можно трактовать как проверку однородности наблюдений.
Промахи, или грубые погрешности, возникают при единичном измерении и обычно устраняются путем повторных измерений. Причиной их возникновения могут быть:
В третьем случае, если оператор в процессе измерения обнаружит промах, он вправе отбросить этот результат и провести повторные измерения.
В настоящее время определение грубой погрешности приведено в ГОСТ Р 8.736–2011: «Грубая погрешность измерения: Погрешность измерения, существенно превышающая зависящие от объективных условий измерений значения систематической и случайной погрешностей» [1, с. 6].
Общие подходы к методам отсеивания грубых погрешностей, как это уже давно принято в практике измерений, заключаются в следующем.
Задаются вероятностью Р или уровнем значимости α (
) того, что результат наблюдения содержит промах. Выявление сомнительного результата осуществляют с помощью специальных критериев. Операция отбрасывания удаленных от центра выборки сомнительных значений измеряемой величины называется «цензурированием выборки».
Проверяемая гипотеза состоит в утверждении, что результат наблюдения x i не содержит грубой погрешности, т. е. является одним из значений случайной величины x с законом распределения Fx(x), статистические оценки параметров которого предварительно определены. Сомнительным может быть в первую очередь лишь наибольший x max или наименьший xmin из результатов наблюдений.
Предложим для практического использования наиболее простые методы отсева грубых погрешностей.
Если в распоряжении экспериментатора имеется выборка небольшого объема n ≤ 25, то можно воспользоваться методом вычисления максимального относительного отклонения [2, с. 149]:
где x i — крайний (наибольший или наименьший) элемент выборки, по которой подсчитывались оценки среднего значения
и среднеквадратичного отклонения
Таким образом, для выделения аномального значения вычисляют значение статистики,
Квантили распределения статистики τ при уровнях значимости α = 0,10; 0,05; 0,025 и 0,01 или доверительной вероятности
= 0,90; 0,95; 0,975 и 0,99 приведены в таблице 1. На практике очень часто используют уровень значимости α = 0,05 (результат получается с 95 %-й доверительной вероятностью).
Функции распределения статистики τ определяют методами теории вероятностей. По данным таблицы, приведенной в источниках [2, с. 283; 3, с. 184] при заданной доверительной вероятности
или уровне значимости α можно для чисел измерения п = 3–25 найти те наибольшие значения
которые случайная величина
может еще принять по чисто случайным причинам.
Процедуру отсева можно повторить и для следующего по абсолютной величине максимального относительного отклонения, но предварительно необходимо пересчитать оценки среднего значения
и среднеквадратичного отклонения
для выборки нового объема
Квантили распределения максимального относительного отклонения при отсеве грубых погрешностей [2, с. 283]