Закон распределения ошибок

Большая Энциклопедия Нефти и Газа

Закон — распределение — ошибка

Закон распределения ошибок р находят экспериментально статистическими методами. [1]

Закон распределения ошибок в коэффициентах а и Ь, очевидно, аналогичен. [2]

Закон распределения ошибок в большинстве случаев является нормальным. [4]

Закон распределения ошибки А неизвестен, он зависит, в частности, от оцениваемого параметра а. Чтобы обойти это затруднение, применяют приближенные приемы. [5]

Закон распределения ошибок Рй находят экспериментально статистическими методами. [6]

Зная закон распределения ошибки восприятия и его параметры, можно определить их зависимость от условий работы оператора, например, таких, как размер экрана и расстояние от оператора до экрана. Для этого была проведена серия экспериментов, в которых 4 испытуемых определяли координаты х, у положения 100 объектов на экранах различной площади 5 с постоянного расстояния R. [7]

Следует ввести закон распределения ошибок . [8]

Тогда нужен закон распределения ошибок , соответствующий этому правилу. Гаусс ищет, какой должна быть уз, чтобы среднее значение оказалось наиболее вероятным. [9]

Следует ввести закон распределения ошибок . [10]

Для построения закона распределения ошибки необходимо определить математическое ожидание выходной величины / лх или центр рассеивания отклонений. При рассмотрении тепловозной системы приходим к выводу, что существуют два центра рассеивания. Первый центр определяется параметрами настройки системы энергетической цепи и САР по мощности тягового генератора. Значительная часть элементов САР при функционировании поддерживает в заданных пределах устанойленную при настройке мощность тягового генератора и его внешнюю характеристику. [11]

Он аналогичен кривой закона распределения ошибок Гаусса . [13]

Принимаем, что закон распределения ошибок размеров всех производимых деталей есть гауссов. Требуется найти математическое ожидание, дисперсию ошибок размеров деталей, признаваемых годными, и определить вероятный процент брака. [14]

С целью исследования закона распределения ошибки измерения дальности с помощью радиодальномера произведено 300 измерений дальности. [15]

Закон распределения ошибок;

Ошибки отдельного измерения Δx также представляют собой случайную величину, которая подчиняется нормальному закону распределения:

(7)

Здесь σ – среднеквадратичная ошибка отдельного измерения.

Среднеквадратичные ошибки среднего значения σср и отдельного измерения σi связаны следующим образом. Среднеквадратичная ошибка отдельного измерения вычисляется по формуле:

, (8)

средняя квадратичная ошибка среднего значения:

(9)

(10)

Величина σср показывает, насколько полученное среднее значение отличается от истинного значения.

Пусть α означает вероятность того, что результат измерений отличается от истинного значения на величину не более Δx:

.

α называется доверительной вероятностью, или коэффициентом надежности.

Чем больше надежности мы требуем, тем больше получается доверительный интервал. И наоборот: чем шире мы возьмем доверительный интервал, тем больше надежность, т. е. меньше вероятность получить результат, не совпадающий с нашим.

6. Обработка большого числа измерений (n > 30)

Вычисляется среднее арифметическое

Вычисляются отклонения каждого измерения:

Смотрите так же:

  • Закон 93 п4 Закупка у единственного поставщика: отвечаем на злободневные вопросы наших читателей. Часть 15 Татьяна Вихрова, старший специалист учебно-методического отдела Учебного центра Ассоциации электронных торговых площадок […]
  • Федеральный закон 100 фз от 07052013 Комментарий к Федеральному закону от 07.05.2013 N 100-ФЗ "О внесении изменений в подразделы 4 и 5 раздела I части первой и статью 1153 части третьей Гражданского кодекса Российской Федерации" (Павелин А.) Дата […]
  • Федеральный закон no 100-фз Федеральный закон от 7 мая 2013 г. N 100-ФЗ "О внесении изменений в подразделы 4 и 5 раздела I части первой и статью 1153 части третьей Гражданского кодекса Российской Федерации" (с изменениями и […]
  • Незаконно полученные пособия В Коврове по требованию прокуратуры незаконно полученные пособия по безработице возвращены в бюджет Ковровской городской прокуратурой проведена проверка соблюдения федерального законодательства о занятости […]
  • Нотариус берингов проезд 1 Нотариус Свиблово Свиблово очень интересный и древний район города Москвы. Знаете ли Вы, что в 1998 году Свиблово исполнилось 575 лет?! Первым крупным промышленным предприятием в селе Свиблово была «Суконная фабрика», […]
  • Оформить салат в виде обезьяны Салат в виде обезьяны новогодний (курица с черносливом) Помните мультфильм "Осторожно обезьянки"? Такой харизматичной мамы-обезьяны больше не было нигде. Она и постирает, и есть приготовит, и детей развлечет, и все […]

Вычисляется среднеквадратичная ошибка среднего значения:

(11)

Величина σ показывает, насколько полученное среднее значение отличается от истинного значения.

Затем выбирается доверительная вероятность α и ошибка вычисляется как

где ε – коэффициент, зависящий от выбранной надежности α.

Для любой величины доверительного интервала по формуле Гаусса может быть рассчитана соответствующая надежность. Результаты таких расчетов приводятся в справочниках.

Справочник химика 21

Химия и химическая технология

Закон распределения ошибок

Формулу (2.19) называют законом накопления или законом распределения ошибок. Пользуясь этой формулой, можно оценить погрешность косвенного измерения, если известны погрешности прямых измерений. [c.34]

Обычно выполняются следуюш,ие условия 1) чем больше отклонения а от [X, тем они реже (менее вероятны) 2) отклонения х от в обе стороны равновероятны (т. е. одинаково часто встречаются как положительные, так и отрицательные отклонения). При выполнении этих условий считают, что закон распределения ошибок является нормальным. Кривые р (г), соответствующие [c.12]

Практически в большинстве физических измерений отклонения от х тем реже (менее вероятны), чем больше они по величине кроме того, эти отклонения в обе стороны в равной степени вероятны. При этом выполняется нормальный закон распределения ошибок, аналитический вид которого предложен Гауссом. Зависимость р (у) для нормального распределения показана на рис. И-1. [c.37]

В тех случаях, когда число измерений меньше 20, порядок обработки результатов остается таким же. Однако для оценки точности отдельных измерений и среднего арифметического следует пользоваться выборочной средней квадратичной ошибкой, обозначаемой не а, а 5, так как различие между ними становится существенным. При этом нормальный закон распределения ошибок становится уже не применимым для оценки надежности измерений. [c.228]

Среднее арифметическое значение есть наиболее вероятное значение определяемой величины (утверждение справедливо в случае, если выполняется нормальный закон распределения ошибок). Среднее значение подсчитывается, если имеется не менее трех отдельных измерений (результатов испытаний). [c.15]

Линейный МНК позволяет получить аналитическое выражение для вектора оценок параметров. При нормальном законе распределения ошибок линейные оценки параметров состоятельны, несме-щены и совместно эффективны [107, 118]. Нелинейный МНК не позволяет получить аналитическое выражение для вектора оценок параметров, задача решается лишь численно. [c.322]

К сожалению, при обработке экспериментальных данных часто отсутствует информация о законах распределения ошибок. Тогда выбор критерия F суш ественно усложняется. Большей частью на практике применяют критерий (111,8). Критерий (111,10) впервые был использован в работах П. Л. Чебышева. [c.132]

Закон распределения ошибок приборов, измеряющих и устанавливающих величины VI, выражается уравнением [c.211]

График уравнения (III. 12) показан на рис. 24. Он аналогичен кривой закона распределения ошибок Гаусса. [c.50]

При анализе можно получить иногда и очень большие ошибки, но число таких измерений невелико. Практически считают, что наибольшая возможная ошибка аке =3т. Действительно, из закона распределения ошибок видно, что при отдельном измерении ошибки, большие, чем встречаются только в трех случаях из 1000. Так, если для данной методики т = 2,0%, то наибольшая возможная ошибка при одном анализе не превосходит 6,0%. [c.228]

Пользуясь нормальным законом распределения ошибок, можно ответить на ряд вопросов, возникающих в измерительной практике. [c.452]

Вопрос об оценке вероятностей Р(.4 ) связан с установлением закона распределения ошибок, которым подвержены частные контрольные требования. В случае гауссовского закона вероятности Р Al) оцениваются с помощью критерия Стьюдента. [c.124]

Если заменить в выражении (3) величину а величиной 5, рассчитанной по малой выборочной совокупности, то нельзя получить нормальный закон распределения ошибок. Поэтому вероятностная теория ошибок, основанная на нормальном распределении, оказалась не применимой для обработки малого числа измерений. [c.228]

Закон распределения по скоростям близок по форме к найденному Гауссом закону распределения ошибок наблюдений, играющему важную роль при точных измерениях (астрономия, геодезия, физика) и в статистике. [c.152]

Так как величина t в этом выражении не подчиняется нормальному закону распределения ошибок из-за различия между 5 и (Т, то вероятность появления ошибки при малом числе измерений должна оцениваться по другому уравнению. Это уравнение известно под названием распределения Стьюдента или распреде-ления и имеет вид [c.228]

Результаты измерений, обработанные таким образом, наносят на бумагу, имеющую масштаб интегрального закона распределения ошибок. На этой бумаге абсцисса имеет линейную шкалу, а ордината —шкалу интегрального закона распределения ошибок Гаусса, поэтому интегральная кривая ошибок в этих координатах превращается в прямую линию. Классы наносят на ось абсцисс, а соответствующие суммы множеств — на ось ординат. Масштаб оси абсцисс нужно выбирать таким образом, чтобы величина т лежала посредине прямой, а наибольшее и наименьшее значения измеренных величин попадали в интервал от т — 2У /идо т — 2Ут. [c.36]

Уравнение (10-9) является хорошо известным из работ Гаусса нормальным законом распределения ошибок. По этой причине распределение, подсчитанное в настоящем разделе, обычно называют распределением Гаусса. [c.202]

При оценке результатов анализа следует, однако, иметь в виду, что приведенные на рис. Х1У.7 погрешности определения параметров правомерны только для пиков, высоты которых значительно больше, чем уровень квантования д. В соответствии с гауссовым законом распределения ошибок погрешность квантования, которая составляет в среднем /2, вносит вклад в параметры площади. Например, погрешность определения площади сигнала треугольной формы высотой Н, связанная с квантованием, имеет величину АРд = д1Н. Для того чтобы погрешность составляла меньше 1 %, высота сигнала должна быть большей чем 100 уровней квантования. [c.442]

На рис. IV. 6 объединены результаты опытов с шарообразными зернами, а на рис. IV. 7 — с зернами в виде таблеток-цилиндриков. В обоих случаях функция распределения в соответствии с нормальным законом распределения ошибок имеет вид [c.200]

При отрицате.чьной ошибке в приведенны.х примерах и им подобных пределы неопределенности меньше, если закон распределения ошибок анализа лог-нормальный. [c.135]

Тем не менее, полезно знать, что в некоторых практически важных случаях ошибки распределены по другим законам. Так, довольно часто измеряемая величина существенно неотрицательна, причем в опытах могут получаться значения, очень близкие к нулю, но величина меньше нуля получиться не может. Здесь принятие нормального закона распределения ошибок может существенно исказить картину. Нормальный закон предполагает возможность заметных отрицательных отклонений. Но если истинное значение а близко к нулю, то отрицательное отклонение, превосходящее —а, невозможно. [c.52]

Графическое изображение этого закона распределения ошибок представлено на рис. 187. Здесь по оси абсцисс отложена величина Е -, выраженная в процентах от измеряемой величины, а по [c.218]

ОПЫТОВ исключали по три ряда зерен, расположенных у стенки аппарата. На основе анализа результатов всех измерений было показано, что функция распределения скоростей потока в слое (частота п ) близка к нормальному закону распределения ошибок (рис. 10.5). К такому же выводу, на основе своих опытов, пришли Н. М. Тихонова [134] и позже Е. В. Бада-тов. Профили относительных скоростей (рис. 10.6), полученные из распределений шв плане (см. рис. 10.4), отчетливо показывают, что у стенок аппарата сюорости резко возрастают (на 20—100 %). [c.273]

Критерий (6) — частный случай критерия (1). Он называется принципом наименьшах квадратов в случае нелинейной функции Х С, а) от искомых параметров а([61, с. 205) и методом наименьших квадратов в случае линейного вида Х С, а) относительно параметров а. Этот критерий широко используется даже в тех случаях, когда закон распределения ошибок неизвестен и величины Оэксп. определены приближенно [61. Основанием для его применения могут служить предельные теоремы. [c.115]

Физический смысл закона распределения ошибок хорошо ил-.люстрирует опыт, показанный на рис 140, б. В вертикально по- ставленную доску забито большое число тонких стержней. Сверху через узкое отверстие воронки падают одинаковые дробинки. При ударах о стержень дробинка отклонится случайным образом в ту или другую сторону. Дробинки, получившие одинаковое от- [c.252]

Установление взаимосвязи точности и надежности измерений в конкретных условиях производства возможно, как правило, методами математической статистики, которая все больше применяется в теории и практике автоматического анализа. Однако широкому внедрению математической статистики препятствуют малоизученные и не поддающиеся строгому контролю физические связи определяемого компонента со свойствами среды. Опираясь на теорию вероятностей и используя результаты изменений состава и свойств, математическая статистика позволяет изучить объективные закономерности автоматического анализа, выразить их в виде законов распределения ошибок тех или иных методов. Она дает также возможность в компактной форме представить результаты измерений и, самое главное, позволяет количественно оценить элемент сомнения, сопут- ствующий какждому измерению с малым числом опытных данных, вследствие того, что любое определение переменного параметра единственно и неповторимо длящего обработки методами математической статистики. [c.192]

Частоты распределения п, как функции относительных ско-эостей для отдельных опытов показаны на рис. IV. 4 и IV. 5. Очевидно, что функция распределения оз должна укладываться в нор-vlaльный закон распределения ошибок [2] (см. раздел 1.3). На )ис. IV. 6 и IV. 7 логарифмы величин (в %) отложены как функ-л,ии квадрата отклонений от средней скорости [c.199]

Помимо упомянутых квадраничных критериев широко используют критерий минимума суммы модулей и критерий минимакоа. Выбор типа критерия осуществляется на основании принципа максимального правдоподобия и обусловлен законом распределения ошибок измерения (см., например, Худсон Д. Статистика для физиков. М., Мир, 1970). [c.73]

Проведено сопоставление двух указанных методов в прикладном и теоретическом аспектах. Сформулирована острая проблема какой из двух предельных законов распределения ошибок — гауссовский или лапласовский — лучше модулирует эмпирическое распределение Библиогр. 3. [c.223]

Смотреть страницы где упоминается термин Закон распределения ошибок: [c.36] [c.56] [c.167] [c.12] [c.99] [c.196] [c.160] Смотреть главы в:

Закон распределения ошибок

Глава 7. ИЗМЕРЕНИЕ И ЗАКОН РАСПРЕДЕЛЕНИЯ ОШИБОК

Не так давно мой сын Алексей, вернувшись из школы, сообщил об оценке по английскому, полученной им за последнее сочинение. Ему поставили 93 балла. Будь все как обычно, я бы поздравил его с высшей оценкой — А. Но поскольку в пределах А это невысокий балл, а я знаю, что он способен на большее, я бы не преминул добавить: оценка говорит о том, что если в следующий раз он приложит чуть больше усилий, то получит более высокий балл. Однако все было отнюдь не как обычно, и я счел 93 балла возмутительной недооценкой сочинения. Здесь вам, верно, подумалось, что предыдущие несколько предложений говорят больше обо мне, нежели об Алексее. Что ж, вы совершенно правы. На самом деле, вся эта история обо мне, потому что сочинение за Алексея написал я.

О да, позор на мою голову! В свою защиту должен сказать, что в более мирных обстоятельствах скорее дотянулся бы за Алексея пяткой до подбородка на его занятиях по кунг-фу, чем писал бы за него сочинение. Но дело в том, что Алексей подошел ко мне с просьбой взглянуть на его работу как обычно, поздно вечером, в день перед сдачей сочинения. И я пообещал взглянуть. Начав читать сочинение с экрана компьютера, я поначалу внес несколько незначительных изменений — ничего такого, на что стоило бы обратить внимание. Однако затем редактор во мне начал шаг за шагом переставлять и перефразировать то и это, а когда дошел до конца, оказалось, что Алексей уже спит крепким сном, а я по сути написал новое сочинение. На следующее утро, смущенно признавшись, что поленился сохранить файл под новым именем, я сказал ему, чтобы он просто сдал мой вариант.

Сын протянул мне проверенное сочинение, похвалив его весьма сдержанно. «Неплохо, — сказал он. — Оно, конечно, 93 балла — это скорее А с минусом, чем А, но было уже поздно, и если бы у тебя не слипались глаза, наверняка справился бы лучше». Не сказать, чтобы я был рад. Во-первых, мало приятного в том, что твой пятнадцатилетний сын говорит тебе те самые слова, которые ты прежде обращал к нему, и при этом они кажутся тебе совершенно пустыми. Но кроме того, как могло мое сочинение — труд человека, которого даже собственная мать считает профессиональным писателем, — не получить достойной оценки у школьного учителя английского? Понятное дело, я был не одинок. Уже потом мне рассказали о другом писателе, с которым приключилась точно такая же история, с той лишь разницей, что его дочь получила еще более низкую оценку — В. Тексты, выходившие из-под пера этого писателя с докторской степенью по английскому языку, вполне удовлетворяли даже столь взыскательные издания, как «Роллинг Стоун», «Эсквайр» и «Нью-Йорк Таймс», но только не учителя средней школы. Алексей попытался утешить меня, поведав еще одну историю. Как-то раз двое его друзей сдали одно и то же сочинение. Сын решил, что они сглупили, и их немедленно разоблачат. Однако перегруженная учительница не только не заметила удвоения, но и поставила за одно сочинение 90 баллов (А), а за другое — 79 (С). На первый взгляд, странно, но только если вам не доводилось, как мне, ночь напролет проверять здоровенную стопку работ, гоняя по кругу, чтобы ненароком не заснуть, музыку из «Стар Трек».

Числам всегда приписывается особый вес. Рассуждение, во всяком случае, неосознанно, строится примерно так: если учитель оценивает сочинение по сто-балльной шкале, эти незначительные различия и в самом деле что-то значат. Но если десять издателей сочли, что рукопись первого тома «Гарри Поттера» не заслуживает публикации, то каким образом бедная миссис Финнеган (на самом деле ее зовут не так) проводит тонкое различение между двумя школьными сочинениями, ставя за одно 92 балла, а за другое 93? Если мы допускаем, что качество сочинения в принципе поддается определению, то нам придется признать, что оценка — не описание качества сочинения, но его измерение, а измерение, как ничто другое, подвержено случайности. В случае с сочинением измерительный инструмент — учитель, а в выставляемых им оценках, как и в любом измерении, проявляются случайная дисперсия и ошибки.

Еще один вид измерения — голосование. В этом случае мы измеряем не столько количество людей, поддерживающих того или иного кандидата на момент выборов, сколько количество тех, кто не поленился прийти в избирательный участок и проголосовать. В этом измерении тоже множество источников случайной ошибки. Одни законные избиратели, приходя в участок, обнаруживают, что их имя не внесено в списки для голосования. Другие по ошибке голосуют не за того, за кого собирались. Конечно же, ошибки возникают и при подсчете голосов. Часть бюллетеней ошибочно признается недействительными или, напротив, действительными. Еще часть может быть утеряна. Как правило, даже все эти факторы в совокупности не могут повлиять на исход выборов. Однако в случае выборов, где у соперников шансы на победу приблизительно равны, они могут сыграть свою роль, и тогда голоса обычно подсчитываются не один, а несколько раз, как если бы второй или третий подсчет были меньше подвержены влиянию случайной ошибки, чем первый.

Ни процесс подсчета голосов, ни сам процесс голосования нельзя назвать совершенным. Если, например, по причине ошибки в работе почтовой службы 1 из 100 потенциальных избирателей не получит извещения с адресом избирательного участка, а еще 1 на каждых 100 таких избирателей по этой причине не проголосует, то в вашингтонских выборах это вылилось бы в 300 избирателей, которые хотели бы проголосовать, но не получили такой возможности в силу ошибки правительства. Выборы, как и любое измерение, неточны, пересчеты тоже, поэтому когда кандидаты набирают близкое количество голосов, разумнее принять результаты выборов такими, какие они есть, или попросту подбросить монетку, а не тратить время на бесконечные пересчеты.

Работы Лапласа и Лавуазье, а также ряда других ученых, прежде всего Шарля-Огюстена де Кулона, проводившего опыты с электричеством и магнетизмом, преобразили экспериментальную физику. Кроме того, эти работы внесли вклад в развитие в 1790-х гг. новой метрической системы, пришедшей на смену множеству разрозненных и несопоставимых систем, тормозивших развитие науки и нередко служивших причиной споров между торговцами. Новую метрическую систему, разработанную группой ученых, сформированной по указу Людовика XVI, революционное правительство узаконило уже после падения Людовика. По иронии судьбы, Лавуазье был одним из членов этой группы.

Требования как астрономии, так и экспериментальной физики были таковы, что на долю математиков конца XVIII — начала XIX вв. выпали прежде всего осмысление и подсчет случайной ошибки. Их усилиями возникла новая область — математическая статистика, занимающаяся разработкой методов для интерпретации данных наблюдений и опытов. Специалисты в области статистики зачастую считают, что рост современной науки начался именно с этих разработок — с развития теории измерения. Однако статистические методы используются и для решения задач повседневной жизни: например, для оценки эффективности лекарственных препаратов или популярности политиков. Поэтому понимание правил осуществления статистических выводов важно не только для тех, кто занимается наукой, но и для каждого из нас.

Еще одна область субъективных измерений, которым доверяют больше, чем следовало бы — оценка вин. В 1970-х гг. винный бизнес явно не переживал расцвета, а если и развивался, то преимущественно в сфере продаж дешевого столового вина. Однако в 1978 г. произошло событие, с которым часто связывают последующее стремительное развитие отрасли: некий юрист, Роберт М. Паркер-младший, объявил себя экспертом в области вин и решил, что вдобавок к своим публикуемым в прессе критическим обзорам будет давать винам количественную оценку по сто-балльной шкале. Со временем большинство изданий, печатавших материалы о винах, последовали его примеру. На сегодняшний день американцы ежегодно выкладывают за винную продукцию более 20 млрд долларов, однако же среди миллионов любителей спиртных напитков редко когда найдется простак, который согласится раскошелиться, не взглянув предварительно на рейтинг приглянувшегося ему вина. Поэтому, когда журнал «Вайн Спектейтор» выставил, скажем, аргентинскому каберне-совиньону «Валентин Бьянки» 2004 г. не 89, а 90 баллов, этот единственный балл привел к огромному увеличению объема продаж «Валентин Бьянки» . В самом деле, заглянув в местную винную лавку, американец обнаружит, что вина, выставленные на распродажу со скидкой, как правило, получают оценки на один или несколько баллов ниже 90. Но какова вероятность того, что аргентинское каберне «Валентин Бьянки» 2004 г., удостоенное 90 баллов, не получило бы 89, если бы процесс оценивания был повторен, предположим, час спустя?

С теоретической точки зрения, есть множество оснований поставить под сомнение результаты оценивания вин. Для начала скажем, что вкусовые ощущения определяются сложным взаимодействием между вкусовыми и обонятельными стимулами. Строго говоря, любое вкусовое ощущение определяется пятью типами рецепторов, располагающихся на поверхности языка: рецепторами соленого, сладкого, кислого, горького и «мясного» (умами [11] ). Последняя группа рецепторов соотносится с определенными аминокислотами (преобладающими, например, в соевом соусе). Но если бы этим все и ограничивалось, то вкус любой пищи — например, вашего любимого бифштекса, жареной картошки, праздничного яблочного пирога и изысканных спагетти по-болонски — можно было бы имитировать, используя лишь столовую соль, сахар, уксус, хинин и глутамат натрия. К счастью, этим дело не обходится, и на помощь приходит обоняние. Именно оно объясняет, почему, если взять два стакана с одинаковым раствором сахара и добавить в один из них клубничную эссенцию (не содержащую сахара), жидкость в этом стакане покажется вам слаще . Вкус вина определяется воздействием от 600 до 800 изменчивых органических составляющих на рецепторы как языка, так и носа . И что с этим делать — непонятно, ведь исследования показывают: даже профессиональные дегустаторы редко могут с уверенностью определить более 3-4 компонентов в смеси .

Дегустаторов вин часто сбивает с толку и оборотная сторона ошибки ожидания — недостаток контекста. Поднося к носу корень хрена, вы едва ли перепутаете его с зубчиком чеснока, а запах чеснока не спутаете с запахом, скажем, стелек из ваших ношеных кроссовок. Но если вам приходится иметь дело с ароматом прозрачных жидкостей, оттолкнуться не от чего. В отсутствие контекста высока вероятность того, что ароматы будут перепутаны. Именно это случилось, когда исследователи предъявили экспертам набор из шестнадцати случайно отобранных запахов: эксперты неверно определили в среднем каждый четвертый запах .

Имея все основания для скептицизма, ученые разработали методы прямой оценки различения вкусов экспертами. Один из таких методов — использование «треугольника вин». Это не собственно треугольник, скорее метафора: каждому эксперту предъявляется три сорта вина, два из которых идентичны. Задача состоит в том, чтобы выявить отличающийся от остальных сорт вина. В исследовании 1990 г. эксперты успешно справились с этой задачей только в 2/3 случаев, то есть на каждые три пробы приходилась одна, в которой эти гуру не могли отличить пино нуар, допустим, «с роскошным букетом земляники, сочной ежевики и малины», от пино «с выраженным ароматом сушеного чернослива, желтой черешни и бархатистой черной смородины» . В том же исследовании группу экспертов попросили оценить ряд вин по 12 параметрам: таким, как содержание алкоголя, присутствие танинов, сладость и фруктовый запах. Эксперты существенно разошлись в своих оценках по 9 из 12 параметров. Наконец, когда их попросили подобрать вина, подходящие под описания, данные другими экспертами, испытуемые выполнили задачу правильно только в 70% случаев.

Если качество вина (или сочинения) в самом деле может быть подвергнуто измерению в числовом выражении, то перед теорией измерения встает два вопроса. Во-первых, как получить это число на основе ряда отличающихся друг от друга измерений? Во-вторых, имея в виду, что число измерений ограничено, как вычислить вероятность того, что оценка верна? Рассмотрим эти вопросы, поскольку независимо от того, объективен или субъективен источник данных, теория измерения ставит себе целью найти на них ответы.

Ключ к пониманию измерения — постижение природы разброса данных, обусловленного случайной ошибкой. Предположим, мы попросили пятнадцать дегустаторов оценить некоторое вино, или же предложили оценить его несколько раз в разные дни одному и тому же дегустатору, или прибегли к обеим процедурам. Мы можем подвести итоги оценивания, используя усреднение полученных оценок. Однако важную информацию содержит не только среднее значение: если все пятнадцать дегустаторов выставляют оценку 90, это одно, а если они выставляют оценки 80, 81, 82, 87, 89, 89, 90, 90, 90, 91, 94, 97, 99 и 100 — это совсем другое. Среднее значение обоих наборов данных одно и то же, но они различаются разбросом данных относительно этого среднего. А поскольку распределение данных — важный источник информации, для его описания математики предложили количественную меру разброса. Эта мера называется выборочным стандартным отклонением. Кроме того, математики измеряют разброс посредством квадратичной меры, которую называют выборочной дисперсией.

Стандартное отклонение показывает, насколько данные по выборке близки к среднему — или, в практическом смысле, какова погрешность измерения. Если оно невысоко, все данные группируются вокруг среднего. Например, для случая, когда все дегустаторы поставили вину оценку 90, стандартное отклонение равно 0, указывая на то, что все измерения идентичны среднему значению. В случае же высокого стандартного отклонения данные разбросаны относительно среднего. Например, когда вино оценивается Дегустаторами в диапазоне от 80 до 100, выборочное стандартное отклонение равно 6. Это означает, что на практике большинство оценок попадет в диапазон от -6 до +6 относительно среднего. В рассмотренном случае о вине можно с высокой степенью уверенности сказать, что его истинная оценка, скорее всего, относится к диапазону от 84 до 96.

Пытаясь понять значение своих измерений, ученые XVIII-XIX вв. сталкивались с теми же проблемами, что и скептически настроенные ценители хороших вин. Ибо если группа исследователей осуществляет рад наблюдений и измерений, результаты почти всегда получаются разными. Один астроном мог столкнуться с неблагоприятными погодными условиями, другой — покачнуться из-за порыва ветра, третий, возможно, только что вернулся от Уильяма Джеймса, с которым вместе дегустировал мадеру. В 1838 г. математик и астроном Ф.В. Бессель выделил одиннадцать классов случайных ошибок, которые могут возникнуть в ходе любого наблюдения с использованием телескопа. Даже если один и тот же астроном осуществляет ряд повторных измерений, результаты могут различаться из-за таких факторов, как неустойчивая острота зрения и влияние температуры воздуха на аппаратуру. Поэтому астрономам пришлось разбираться, как на основе ряда несовпадающих измерений установить истинное положение небесного тела. Но из того, что ценители вин и ученые сталкиваются с одной и той же проблемой, совсем не обязательно следует, что для них годится одно и то же решение. Можно ли выделить универсальные характеристики случайной ошибки, или же ее природа зависит от контекста?

Одним из первых предположение о том, что для разных типов измерений характерны одни и те же особенности, выдвинул Даниил Бернулли, племянник Якоба Бернулли. В 1777 г. он уподобил случайную ошибку в астрономическом наблюдении отклонениям в траектории выпущенной из лука стрелы. В обоих случаях, рассуждал он, цель — истинное значение измеряемой переменной или же «яблочко» мишени — располагается где-то посреди, а наблюдаемые результаты группируются вокруг нее, причем большинство должны лежать в окрестностях цели, и лишь немногие выпадают за их пределы. Закон, который Бернулли предложил для описания этого распределения, оказался неверен, однако важно само понимание того, что распределение ошибок лучника может быть сходно с распределением ошибок в наблюдениях астрономов.

Идея о том, что распределение ошибок подчиняется некому универсальному закону, который называют законом случайного распределения ошибок, является основополагающей для теории измерения. И вот что примечательно: допущение состоит в том, что при условии удовлетворения определенных условий довольно общего характера установить истинное значение некоторой переменной на основе ряда измерений можно с использованием одного и того же математического аппарата. Если в дело вступает универсальный закон, то задача установления истинного положения небесного тела на основе ряда наблюдений астрономов приравнивается к задаче нахождения центра мишени на основе дырочек от стрел или определения «качества» вина на основе ряда экспертных оценок. Именно поэтому математическая статистика — последовательная и согласованная область, а не просто набор трюков: неважно, осуществляете ли вы ряд измерений для того, чтобы установить положение Юпитера в 4 часа утра на Рождество или средний вес булок с изюмом, выходящих с конвейера, распределение ошибок будет одним и тем же.

Однако отсюда не следует, что случайная ошибка — единственный вид ошибок, которые могут повлиять на измерение. Если половина дегустаторов предпочитает красное вино, а другая половина — белое, однако во всех остальных отношениях они сходятся в своих суждениях (и предельно последовательны в их вынесении), то оценка каждого конкретного вина не будет определяться законом случайного распределения ошибок: распределение получится резко двугорбым, причем причиной появления одного из пиков станут любители красного вина, а другого — любители белого. Но даже в тех случаях, когда применимость закона случайного распределения ошибок не столь очевидна (начиная от футбольного тотализатора и заканчивая измерением коэффициента интеллекта), зачастую он все же оказывается применим. Много лет назад мне в руки попали несколько тысяч регистрационных карточек покупателей компьютерной программы, которую разработал для восьми- и девятилетних школьников мой приятель. Продажи шли не так хорошо, как ожидалось. Кто же покупал программу? После некоторых подсчетов я установил, что наибольшее число пользователей приходится на семилетних, указывая на нежелательное, но не то чтобы неожиданное расхождение. Но вот что самое удивительное: когда я построил гистограмму зависимости количества пользователей от возраста, взяв семь лет за среднее значение, я обнаружил, что построенный мною график принял крайне знакомую форму — форму закона случайного распределения ошибок.

Одно дело — подозревать, что лучники и астрономы, химики и маркетологи сталкиваются с одним и тем же законом распределения ошибок, и совсем другое — самому натолкнуться на частный случай этого закона. Подталкиваемые необходимостью анализировать данные астрономических наблюдений ученые, такие как Даниил Бернулли и Лаплас, постулировали в конце XVIII в. несколько вариантов закона, оказавшихся неверными. Однако выяснилось, что математическая функция, верно отражающая закон случайного распределения ошибок, — колоколообразная кривая — все это время была у них под носом. За много десятилетий до них она была открыта в Лондоне в контексте решения совсем иных задач.

Среди троих ученых, благодаря которым на колоколообразную кривую обратили внимание, реже всех воздается по заслугам именно ее первооткрывателю. Абрахам де Муавр совершил свое открытие в 1733 г., когда ему было за шестьдесят, однако до появления второго издания его книги «Об измерении случайности», вышедшего в свет пять лет спустя, об этом никто не знал. Де Муавр пришел к искомой форме кривой, когда пытался аппроксимировать числа, заполняющие треугольник Паскаля значительно дальше той строки, на которой оборвал его я, — сотнями и даже тысячами строк ниже. Когда Якоб Бернулли обосновывал свой вариант закона больших чисел, ему пришлось столкнуться с некоторыми свойствами чисел, появляющихся в этих строках. А числа действительно очень велики: например, одно из чисел в двухсотой строке треугольника Паскаля состоит из пятидесяти девяти цифр! Во времена Бернулли, да и вообще до тех пор, пока не появились компьютеры, эти числа было очень трудно высчитать. Именно поэтому, как я сказал, Бернулли обосновывал свой закон больших чисел, используя различные способы приближенного вычисления, что снижало практическую значимость результатов его работы. Де Муавр со своей кривой осуществил несравненно более точную аппроксимацию и потому значительно улучшил оценки Бернулли.

Как де Муавр осуществил свою аппроксимацию, становится понятно, если числа в ряду треугольника представить в виде высоты столбика на гистограмме — я поступил так с регистрационными карточками. Например, числа в третьей строке треугольника — 1, 2, 1. Тогда на гистограмме первый столбик будет высотой в одно деление, второй — вдвое выше, а третий — вновь высотой в одно деление. Рассмотрим теперь пять чисел в пятой строке: 1, 4, 6, 4, 1. На гистограмме будет пять столбиков, она вновь начнется с минимальной высоты, достигнет максимума в центре и продемонстрирует симметричное снижение. Если спуститься по треугольнику вниз, получатся гистограммы с огромным количеством столбиков, но поведение их будет тем же самым. Гистограммы для 10-й, 100-й и 1000-й строк треугольника Паскаля приведены на странице 139.

Если теперь провести кривые, соединяющие вершины столбиков на каждой из гистограмм, все они окажутся характерной формы, напоминающей колокол. А если несколько сгладить эти кривые, можно подобрать соответствующее им математическое выражение. Колоколообразная кривая — не просто визуализация чисел в треугольнике Паскаля: это инструмент, позволяющий получить точные и удобные в употреблении оценки значений чисел, появляющихся в расположенных ниже строках треугольника. В этом и состояло открытие де Муавра.

Сегодня колоколообразную кривую называют обычно нормальным распределением, а иногда — Гауссовой кривой (вскоре читатель узнает, откуда взялось это название). Нормальное распределение — не отдельная фиксированная кривая, но целое семейство кривых, определяемых двумя параметрами, задающими положение кривой и ее форму. Первый из них — расположение пика: в графиках на странице 174 это 5, 50 и 500 соответственно. Второй — степень разброса. Этот показатель, получивший свое современное наименование лишь в 1894 г., называется стандартным отклонением и представляет собой теоретический аналог понятия, о котором я уже упоминал — выборочного стандартного отклонения. Грубо говоря, это половина ширины кривой в той точке, где кривая достигает своей 60%-ной высоты. В наше время значение нормального распределения выходит далеко за пределы аппроксимации чисел в треугольнике Паскаля. Это самая распространенная форма распределения любого рода данных.

При описании распределения данных колоколообразная кривая демонстрирует, что в том случае, когда вы делаете много замеров, большинство их результатов будут примыкать к среднему значению, что отображается в виде пика. Симметрично снижаясь по обе стороны от пика, кривая показывает, как убывает число результатов замеров ниже и выше среднего, поначалу довольно резко, а потом не столь круто. Если данные распределены нормально, около 68% (т.е. приблизительно 2/3) результатов измерений попадают в пределы одного стандартного отклонения, около 95% — в пределы двух стандартных отклонений и 99,7% — в пределы трех стандартных отклонений.

Кружочками на том же графике отображен еще один набор данных — успешность работы 300 менеджеров паевых инвестиционных фондов. Для этого набора данных по оси абсцисс отложено не количество верных угадываний исходов подбрасывания монеты, а количество лет (из 10), когда показатели успешности работы менеджера были выше группового среднего. Обратите внимание на сходство! Мы еще вернемся к нему в главе 9.

Чтобы понять связь между нормальным распределением и случайной ошибкой, можно рассмотреть процесс проведения выборочного опроса. Вспомним опрос относительно популярности мэра Базеля, который я упоминал в главе 5. В этом городе часть жителей одобряет деятельность мэра, а часть осуждает. Для простоты примем, что тех и других по 50%. Но, как мы видели, результаты опроса не обязательно будут полностью соответствовать этой пропорции 50/50. И в самом деле, если выборочно опросить N горожан, то вероятность, что любое произвольное их число поддержит мэра, пропорциональна числам в строке N треугольника Паскаля. А раз так, то, согласно работам де Муавра, если служба общественного мнения опросит большое число горожан, вероятность всех возможных результатов опроса можно будет описать с помощью кривой нормального распределения. Иными словами, около 95% случаев одобрения попадет в пределы 2 стандартных отклонений от истинного рейтинга мэра, 50%. Для описания этой погрешности службы общественного мнения используют понятие «допустимый предел погрешности». Сообщая средствам массовой информации, что предел погрешности опроса составляет +/-5%, они имеют в виду, что если повторить опрос много раз подряд, 19 из 20 раз (т.е. в 95% случаев) результат его будет в пределах 5% от истинного значения измеряемой переменной. (И хотя службы общественного мнения редко на это указывают, в 1 случае из 20 результат опроса будет мало соответствовать действительности.) На практике размеру выборки в 100 человек соответствует такой допустимый предел погрешности, который никуда не годится. А вот для выборки в 1000 человек предел погрешности обычно составляет около 3%, что уже вполне пригодно для большинства целей.

Тот факт, что нормальное распределение описывает распределение ошибки измерения, открыл десятилетия спустя после выхода работы де Муавра человек, имя которого носит колоколообразная кривая, — немецкий математик Карл Фридрих Гаусс. Эта мысль — во всяком случае, в отношении астрономических измерений, — пришла Гауссу в голову, когда он работал над проблемой траекторий движения планет. Однако же «доказательство» Гаусса было, по его собственному позднейшему признанию, ошибочным , а далеко идущие последствия этого открытия тоже не пришли ему на ум. Поэтому он, дабы не привлекать излишнего внимания, сунул обнаруженный закон в один из последних параграфов своей книги «Теория движения небесных тел, обращающихся вокруг Солнца по коническим сечениям». Там бы она и сгинула, эта еще одна из многочисленных отвергнутых наукой идей о том, как должен выглядеть закон распределения ошибок.

Однако нормальное распределение вернул из небытия Лаплас, наткнувшийся на работу Гаусса в 1810 г., вскоре после того, как подал в Академию наук статью с доказательством так называемой центральной предельной теоремы, гласящей, что сумма большого количества независимых случайных величин имеет распределение, близкое к нормальному. Например, предположим, что вы выпекаете 100 буханок хлеба, каждый раз основываясь на рецепте, по которому должны получаться буханки весом в 1000 граммов. Но иногда вы случайно добавляете то чуть меньше, то чуть больше муки или молока, а иногда чуть меньше или чуть больше жидкости испаряется за время нахождения буханки в печи. В конечном счете в силу каждой из множества возможных причин вес буханки может вырасти или уменьшиться на несколько граммов, и в этом случае центральная предельная теорема утверждает, что итоговый вес буханок будет варьировать в соответствии с законом нормального распределения. Читая работу Гаусса, Лаплас сразу же понял, что может использовать его открытие в целях совершенствования собственной работы, а его собственная работа, в свою очередь, намного убедительнее, чем это удалось Гауссу, доказывает: нормальное распределение является отражением закона распределения ошибок. Лаплас немедленно опубликовал краткое продолжение статьи, посвященной центральной предельной теореме. В наши дни эта теорема и закон больших чисел — две наиболее важных наработки в рамках теории случайности.

Чтобы пояснить, каким образом центральная предельная теорема доказывает, что нормальное распределение адекватно отражает закон случайного распределения ошибки, вернемся к примеру Даниила Бернулли с лучником. Мне однажды довелось выступить в роли лучника во время вечера в приятном обществе с крепкими напитками и беседами не для детского уха: ко мне прибежал мой младший сын Николай, протянул мне лук и стрелу и начал упрашивать, чтобы я метким выстрелом сбил у него с головы яблоко. И хотя стрела была с мягким наконечником из губки, мне показалось разумным проанализировать свои возможные ошибки и оценить их вероятность. Естественно, больше всего меня беспокоили смещения по вертикали. Простая модель таких ошибок выглядит следующим образом: каждый случайный фактор (скажем, ошибка прицеливания, влияние воздушных потоков и т. п.) может с равной вероятностью сместить мой выстрел по вертикали либо вверх, либо вниз относительно мишени. Итоговая ошибка будет равна сумме всех этих ошибок. Если мне повезет, примерно половина из них сместит выстрел вверх, другая половина — вниз, и тогда я попаду точно в цель. А если мне (точнее, моему сыну) не повезет, то все ошибки подействуют в одном направлении, и в цель я не попаду, а попаду либо существенно ниже, либо существенно выше. Соответственно, мне хотелось знать, какова вероятность того, что ошибки нивелируют друг друга, или, напротив, их сумма достигнет максимального значения, или примет одно из промежуточных значений. Но это был в точности процесс Бернулли, как если бы я подбрасывал монеты и задавался при этом вопросом, с какой вероятностью у меня выпадет определенное число орлов. Ответ на этот вопрос дает треугольник Паскаля или, если попыток много, нормальное распределение. И ровно этому же посвящена центральная предельная теорема. (Кстати сказать, в итоге я не попал ни в яблоко, ни в сына, но зато сбил бокал превосходного каберне.)

К 1830-м гг. большинство ученых обрели уверенность в том, что любое измерение многосоставно, подвержено огромному числу источников отклонения, а следовательно, и закону распределения ошибок. Этот закон, наряду с центральной предельной теоремой, привел, таким образом, к новому, более глубокому пониманию получаемых данных и их отношения к физической реальности. В следующем веке эти за идеи ухватились ученые, занимающиеся исследованием человеческого общества. К своему удивлению, они обнаружили, что человеческое поведение и индивидуальные особенности нередко подчиняются тем же закономерностям, что и ошибка измерения. В связи с этим было решено расширить круг приложений закона распределения ошибок за пределы естествознания и применять его в новой науке о человеческих отношениях.

Опубликовано / Август 14, 2018
Рубрики:
Блог