WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

Pages:     || 2 | 3 |

«МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ МЕТОДОЛОГИЯ И МЕТОДЫ РАЗРАБОТКИ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ МЕХАНИЧЕСКИХ СИСТЕМ И ПРОЦЕССОВ Часть II Планирование экспериментов и обработка результатов измерений Издание третье, переработанное и ...»

-- [ Страница 1 ] --

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ВОЗДУШНОГО ТРАНСПОРТА

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ

ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

ГРАЖДАНСКОЙ АВИАЦИИ»

Кафедра аэродинамики, конструкции и прочности летательных аппаратов М.С. КУБЛАНОВ

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

МЕТОДОЛОГИЯ И МЕТОДЫ РАЗРАБОТКИ

МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ

МЕХАНИЧЕСКИХ СИСТЕМ И ПРОЦЕССОВ

Часть II Планирование экспериментов и обработка результатов измерений Издание третье, переработанное и дополненное Рекомендовано УМО вузов РФ по образованию в области эксплуатации авиационной и космической техники в качестве учебного пособия МОСКВА УДК 519.876.5(075.8) ББК 22.2в631.0я73- К Печатается по решению редакционно-издательского совета Московского государственного технического университета ГА Рецензенты: д-р техн. наук, проф. В.Г Ципенко;

канд. техн. наук, проф. С.Г. Косачевский (проректор по научной работе Ульяновского высшего авиационного училища ГА) Кубланов М.С.

К88 Математическое моделирование. Методология и методы разработки математических моделей механических систем и процессов. Часть II. Планирование экспериментов и обработка результатов измерений. Издание третье, переработанное и дополненное: Учебное пособие. – М.: МГТУ ГА, 2004. – 125 с.: ил. 14, табл. 36.

ISBN 5-86311-437- Книга представляет собой учебное пособие, предназначенное для студентов, знакомых с высшей математикой в объеме первых двух курсов втузовского образования. Данная книга является второй частью пособия, в которой излагаются отдельные вопросы математической статистики, необходимые при планировании экспериментов, а также методы обработки и анализа информации, предназначенные для изучения в процессе магистерской подготовки. Большинство сложных тем изложено на подробно разобранных примерах. Особое внимание уделено связи практических задач с объектами прикладной математики.

Данное учебное пособие издается в соответствии с учебными планами для студентов специальностей 130300, 330500 и направления всех форм обучения.

Рассмотрено и одобрено на заседаниях кафедры АКПЛА 10.02.04 г. и методических советов по специальности 130300 16.02.04 г., по специальности 330500 20.02.04 г., по направлению 552000 17.02.04 г.

1602110000 028 ББК 22.2в2.2в6к73 - К К Ц 33(03) Св. тем. план 2004 г.

поз. Московский государственный технический университет ГА, Кубланов М.С.

ОГЛАВЛЕНИЕ

Часть II. Планирование экспериментов и обработка результатов измерений Предисловие

Раздел

МЕТОДЫ ОБРАБОТКИ ИНФОРМАЦИИ

Г л а в а 5. Основы теории вероятностей и математической статистики 5.1. Основные термины теории вероятностей и математической статистики

5.2. Отбор информации

5.3. Точечные оценки

5.4. Законы распределения

5.5. Интервальные оценки

5.6. Проверка статистических гипотез

5.7. Статистическая проверка адекватности математических моделей

5.8. Основы статистического контроля качества технологических процессов

Г л а в а 6. Основы многомерного статистического анализа

6.1. Классификация задач многомерного статистического анализа

6.2. Понятие о корреляционном анализе

6.3. Дисперсионный анализ

6.4. Регрессионный анализ

6.5. Понятие о конфлюэнтном анализе

6.6. Непрерывные случайные величины и понятие о теории фильтрации

ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА

Г л а в а 7. Статистические методы планирования эксперимента......... 7.1. Проблемы построения эксперимента

7.2. Назначение плана эксперимента

7.3. Планирование объема эксперимента

7.4. Планирование однофакторного эксперимента

7.5. Планирование двухфакторного эксперимента

7.6. Планирование многофакторного эксперимента

7.7. Неполные и неортогональные планы

7.8. Сравнение приемов планирования эксперимента

Г л а в а 8. Особые методы планирования эксперимента

8.1. Специальные приемы планирования эксперимента

8.2. Методы экспертных оценок

Список литературы

Данная книга является второй частью учебного пособия, состоящего из двух частей. В ней сохранена сквозная нумерация разделов, глав, параграфов, рисунков и таблиц, продолжающая нумерацию первой части. Первая часть посвящена собственно теории математического моделирования и полностью изучается студентами механического факультета МГТУ ГА в рамках дисциплины "Моделирование систем и процессов". В ней излагаются основные понятия теории, классификация моделей, дается обзор методов разработки математических моделей и вычислительных методов.

Вторая часть посвящена методам прикладной математики, применяемым при математическом моделировании, и изучается студентами в рамках дисциплины "Планирование экспериментов и обработка результатов измерений". Однако отдельные разделы главы 5 второй части пособия необходимы студентам при изучении дисциплины "Моделирование систем и процессов". Студенты магистерской подготовки изучают отдельные разделы данной части пособия, не входящие в программу дисциплины "Планирование экспериментов и обработка результатов измерений".



МЕТОДЫ ОБРАБОТКИ ИНФОРМАЦИИ

Приступая к изучению реально существующего объекта, мы сталкиваемся с вопросом: какая информация и в каком виде нам необходима. Любой изучаемый объект многообразен. Число факторов, влияющих на него, бесконечно.

Проявления этих факторов могут быть неоднозначны или случайны. Как выбрать основное? Общие соображения для ответа на этот вопрос может дать четко сформулированная цель исследований. Такие соображения можно назвать постановкой задачи отбора информации Более конкретное представление о наборе рассматриваемых факторов, об их количественных характеристиках может быть получено только в результате нескольких последовательных приближений эксперимента, сопровождающихся постепенным "созреванием" модели объекта. При этом для достижения даже четко сформулированной цели исследований не всегда ясно, когда можно остановиться, а когда необходимо углублять свое представление об изучаемом объекте, с какой точностью и как необходимо регистрировать данные наблюдений.

Было бы очень кстати иметь аппарат для строгого обоснования отбора информации.

Таким образом, прослеживается аналогия между объектом наблюдения и зарегистрированными результатами, с одной стороны, и понятиями генеральной совокупности и выборки, с другой. Т.е. можно почерпнуть недостающий исследовательский аппарат из математической статистики.

Удобное представление результатов расчетов и экспериментов подразумевает не только компактность, но и информативность, а также возможность получения достоверных выводов по результатам анализа, т.е. адекватных моделей. Это понятие достоверности опять приводит нас к необходимости применения статистических методов для отбора и обработки информации.

Математическая статистика опирается на аппарат теории вероятностей, поэтому очередная глава посвящена основам теории вероятностей в том объеме, который необходим для понимания следующих глав учебного пособия.

Глава 5. Основы теории вероятностей и математической статистики 5.1. Основные термины теории вероятностей и математической статистики Теория вероятностей – наука, изучающая закономерности в случайных явлениях.

Случайное явление – явление, которое при неоднократном воспроизведении одного и того же опыта протекает по-разному.

Событие – всякий факт, который в результате опыта может произойти или не произойти.

Если некоторое событие A заведомо не может произойти (например, температура воздуха не может принять значение –300С), то такое событие называется невозможным.

Если некоторое событие A обязательно происходит (например, температура воздуха принимает значение в интервале от –300С до 1000С), то такое событие называется достоверным.

Два события называются несовместными, если их одновременное (совместное) наступление невозможно (например, невозможно выпадение одновременно 3 и 5 очков на игральной кости).

Несколько событий образуют полную группу событий, если обязательно происходит хотя бы одно из них, т.е. никаких других, неучтенных, событий быть не может (например, полную группу событий составляют выпадение 1, 2, 3, 4, 5, 6 очков на игральной кости).

Из практики мы знаем, что при повторении одного и того же опыта (например, замер температуры воздуха, бросание игральной кости) получаются различные результаты. Это является следствием влияния неучтенных в данном эксперименте факторов. Будем называть результаты этих опытов исходами или элементарными событиями.

Рассмотрим идеализированную систему исходов, обладающих следующими свойствами:

– число исходов конечно;

– все исходы образуют полную группу событий;

– все исходы попарно несовместны;

– все исходы равновозможны.

Если появление некоторого исхода влечет за собой происхождение события A, то такие исходы называют благоприятными появлению события A (например, выпадение 2, 4 или 6 очков являются исходами, благоприятными появлению четного числа).

На этой идеализированной схеме можно дать классическое определение вероятности: вероятность P(A) случайного события A – это числовая характеm ристика возможности этого события, определяемая отношением, где n – число всех равновозможных, несовместных исходов, образующих полную группу событий, а m – число исходов, благоприятных появлению события A.

Так, например, вероятность появления четного числа очков при бросании игm ральной кости определится дробью: P(A ).

Легко видеть основные свойства вероятности:

– вероятность принимает значения от 0 до 1: 0 p 1;

– невозможное событие имеет нулевую вероятность (p = 0);

– достоверное событие имеет единичную вероятность (p = 1).

Случайной величиной называют величину, которая в результате опыта может принять только одно из множества возможных значений, заранее не известно какое.

Различаются дискретные (принимающие отдельные, изолированные перечисляемые значения) и непрерывные (возможные значения заполняют некоторый промежуток числовой оси) случайные величины.

Основное прикладное значение в теории вероятностей имеют законы распределения случайных величин, ставящие в соответствие каждому значению случайной величины вероятность именно его появления.

Если случайная величина (например, температура воздуха в районе МГТУ ГА, замеряемая датчиком с электронным табло) подчиняется некоторому закону распределения F(), то каждое наблюдаемое ее значение xi в i-ый замер встречается с какой-то вероятностью, определяемой с помощью данного закона распределения.

В случае дискретной случайной величины (например, число очков, выпавшее на игральной кости) закон распределения задается таблицей соответствия возможных значений и вероятностей их появления (см. табл. 6).

Для непрерывных случайных величин такое соответствие записать нельзя, так как на любом отрезке числовой оси (на которой случайная величина может принимать значения) различных возможных значений бесконечно много и вероятность появления каждого из них равна нулю. Поэтому применяется запись закона распределения с помощью, так называемой интегральной функции распределения вероятностей F(x) = P( < x), задающей по определению вероятность того, что случайная величина примет значение на числовой оси левее числа x. Понятно, что, чем правее расположена задаваемая граница x, тем больше вероятность попадания в соответственно больший интервал. Таким образом, выяснено главное свойство интегральной функции распределения F(x) – монотонное возрастание ее значений от 0 до 1 на том интервале, на котором задана случайная величина. В общем случае следует говорить не о конечном интервале, а обо всей числовой оси, поэтому общий вид интегральной функции распределения F(x) можно представить левым графиком рис. 43.

Справа на рис. 43 показана дифференциальная функция распределения вероятностей (плотность распределения вероятностей) f(x), полученная дифференцированием интегральной F(x). Связь этих функций представляется в виде:

Исходя из определения интегральной функция распределения, для любого непрерывного закона распределения справедлива формула, определяющая вероятность попадания случайной величины в интервал от x1 до x2:

В табл. 7 приводится система обозначений (для дискретной случайной величины, принимающей M значений), принятая в данном учебном пособии.

Обратим пока основное внимание на левую часть этой таблицы.

№ элементы генераль- генеральные элементы выборочные оценки слоя ной совокупности объем средняя дисперсия выборки объем средняя дисперсия ция значений расслоеннй случайной величины имеет вид: ji (или x ji ), где первый индекс означает номер слоя (группы) j = 1, 2,..., k, а второй – порядковый номер в слое i = 1, 2,..., Mk (Nk).

Основными числовыми характеристиками законов распределения являются математическое ожидание, обозначаемое a, и дисперсия, обозначаемая D или. Величина имеет собственное наименование – среднее квадратическое отклонение.

Математическое ожидание a E() характеризует центр закона распределения – ту точку на числовой оси, около которой следует ожидать появления случайной величины. Для дискретной случайной величины математическое ожидание определяется формулами:

здесь E() обозначает операцию вычисления по приведенной формуле. Для непрерывной случайной величины математическое ожидание определяется формулой:

Дисперсия и среднее квадратическое отклонение характеризуют рассеивание (разброс) значений случайной величины около ее математического ожидания – возможные отклонения – "размазанность" кривой плотности распределения. Чем больше дисперсия, тем шире "колокол" этой функции. Для дискретной случайной величины дисперсия определяется формулами:

а для непрерывной случайной величины – формулой:

Далее в данном учебном пособии будут рассматриваться такие дискретные случайные величины, которые принимают M различных значений с одинаковой вероятностью. В реальности таких случайных величин не бывает, однако для простоты изложения математического аппарата такое можно себе представить, тем более что именно так ведут себя результаты наблюдений и измерений. Для такой модели дискретных случайных величин все p i M или p ji M j одинаковы, поэтому числовые характеристики задаются достаточно простыми формулами:

Существуют и другие числовые характеристики случайных величин.

Среди таковых для центра распределения является медиана ~ – такое значение, для которого одинаково вероятно, окажется ли случайная величина меньше или больше ~, а также мода x M – наиболее вероятное значение случайной величиx ны. Еще одной характеристикой рассеивания является размах R – разность между наибольшим и наименьшим из возможных значений случайной величины.

Для характеристики системы двух случайных величин, (встречающихся парами) используется ковариация (корреляционный момент) определяемая следующим образом:

где b – математическое ожидание случайной величины ; i,i – все возможные пары значений,. Нормирование ковариации по средним квадратическим отклонениям дает коэффициент корреляции:

Указанные числовые характеристики реальных случайных величин нам не могут быть известны, так же как их объемы M, M j, вероятности pi, p ji и законы распределения – это может быть известно лишь Создателю. В этих формулах E() и D() лишь обозначают операции определения математического ожидания и дисперсии, но по ним эти характеристики обычно не вычисляются. Эти формулы можно использовать только для модельных случайных величин, законы распределения которых записаны априори, как, например, для игральной кости.

Очевидно, что на практике не всегда есть возможность построить идеализированную схему для расчета вероятности по классическому определению. Например, для того, чтобы выявить поддельность игральной кости необходимо убедиться в неодинаковости вероятностей выпадения различного количества очков. В этом случае нет подходящей схемы равновозможных исходов для классического определения вероятностей. Поэтому приходится его заменять статистическим.

Статистическое определение вероятности основывается на априорном свойстве состоятельности любого массового повторения опытов. Это значит, что при бесконечном увеличении числа повторений опытов относительная частота появления интересующего нас события стремится к вероятности:

где – число появлений события A в опытах. Иначе говорят, что сходится по вероятности к величине P( A ): P P(A ) 1. Величину lim и принимают за статистическое определение вероятности. Разумеется, точно этот предел найти нельзя, но оценить его с той или иной уверенностью (вероятностью) на конечном множестве опытов можно. Этим и занимается математическая статистика.

Математическая статистика – наука для разработки методов регистрации, описания и анализа экспериментальных данных наблюдения массовых случайных явлений. Центральное место в математической статистике занимают теория оценок и теория проверки гипотез. Основное правило математической статистики гласит: каждое выдвинутое предложение должно быть оценено и проверено на правдоподобие.

Всякое наблюдение дает какое-то ограниченное представление о явлении в целом, в том числе и об определенной случайной величине. Итогом такого наблюдения, т.е. отбора информации, становится выборка – некоторая совокупность результатов наблюдения случайной величины (генеральной совокупности), отобранная для исследования по определенному правилу. Таким образом, результаты наблюдения случайного явления дают лишь ограниченную информацию о случайной величине в целом. Поэтому переход от зафиксированного экспериментального факта к выводу и прогнозу – далеко не очевиден и нуждается в обосновании. Математическая статистика позволяет по результатам наблюдения частного (выборки) сделать некоторые обоснованные выводы о характеристиках общего (генеральной совокупности).

Вся продукция электролампового завода – генеральная совокупность, проверенная часть ламп – выборка. По сроку службы в среднем, вычисленному по выборке, можно судить о сроке службы ламп в среднем для всей генеральной совокупности. Но лишь "судить", "оценивать", ибо нельзя знать заранее срок службы какой-либо конкретной лампы.

Интервалы времени между прибытием самолетов в аэропорт 13 февраля с 1200 до 1600 дают какое-то представление о том, что будет 14 февраля с 1200 до 1600 – например, в каком режиме придется работать АТБ.

Общая последовательность применения методов математической статистики была предложена Р. Фишером (в скобках дается комментарий в современных терминах):

1 Планирование исследований (планирование эксперимента, определение способа отбора информации).

2 Конкретизация математико-статистического описания (выбор дисперсионной или регрессионной модели).

3 Оценка параметров модели (получение точечных и интервальных оценок) и составление их выборочных (эмпирических) распределений.

4 Изучение согласия между моделью и наблюдениями (адекватность модели оригиналу и проверка критериев согласия в обоснование модели).

5 Реальное решение задачи посредством оценок параметров и критериев значимости (статистический анализ результатов и разработка выводов).

Первый и третий этапы представляют собой, так называемую, процедуру первичной обработки информации, которая начинается с отбора информации, включает построение гистограмм и полигонов частот (если это необходимо для визуальной оценки вида эмпирического распределения), и завершается расчетом точечных и интервальных оценок. Эти результаты служат исходным материалом для четвертого и пятого этапов – статистического анализа, целью которого является установление статистических закономерностей.

Исследователь, озабоченный составлением некоторой модели явления, стремится получить из эксперимента лишь ограниченный круг параметров, ее описывающих. Под эту задачу и собирается информация. Таким образом формулируются первичные требования к отбору информации.

Однако, как мы убедимся на примере в конце параграфа, статистический материал может содержать в себе намного больше информации, чем ставилось целью собрать. Можно не только получить значения наблюдаемых параметров с контролируемой погрешностью и с заданной вероятностью, что позволяет сделать первичная обработка информации. Умелое извлечение информации позволяет еще и быстрее достичь требуемого результата, и оценить его добротность, и даже оценить адекватность разрабатываемой модели.

Но не стоит думать, что математическая статистика отвечает на все вопросы. Во-первых, она способна обработать только ту информацию, которая собрана. Во-вторых, ее методы дают лишь более или менее вероятные (и эту вероятность можно оценить) результаты. Поэтому нет и не может быть математической обработки информации вообще, есть только аппарат для целевых исследований, невозможных без предварительных предположений о модели. Т.е.

за человеком в любом случае остается творческий подход к выбору модели, к способам отбора информации и к формулировке выводов.

Для анализа информации не важно, получена она из натурного эксперимента, или из вычислительного эксперимента на детерминированной или стохастической модели. В любом случае основными проблемами сбора и обработки информации являются:

– выбор существенных факторов;

– выбор процедуры отбора информации;

– обеспечение достоверности выводов по результатам анализа.

Все эти проблемы разрешимы с помощью математического аппарата статистического анализа, излагаемого в последующих параграфах.

Следующий пример иллюстрирует необходимость строгого научного подхода к сбору и обработке информации.

Социологический опрос. Пусть результаты ответов 50 человек на некоторый вопрос представлены рядом знаков "+" – "да" и "–" – "нет":

Подсчитаем количество тех и других знаков: "+" встречается 29 раз, "–" – 21 раз. Т.е. ответов "да" на 38 % больше, чем "нет". Но подождем делать соответствующие практические выводы. Подсчитаем баланс знаков, стоящих на четных местах: "+" – 18, "–" – 7; и на нечетных: "+" – 11, "–" – 14. Насколько можно доверять общим итогам опроса в таком случае?

В каждой практической задаче можно выдвинуть множество гипотез о происхождении таких разногласий, например, в рассматриваемом примере можно предположить и психологические особенности разных групп респондентов, и недоброкачественный (непредставительный) отбор респондентов, и недобросовестность сборщиков информации и т.д. Можно ли оценить степень их влияния на итоговый результат? И как отобрать "хорошую" информацию?

Математическая статистика может дать ответы на все эти вопросы! Конечно, она не сформулирует причины обнаруженного разногласия и не даст непосредственного рецепта для отбора информации. Но она может оценить вероятность правильности выдвигаемых гипотез, определить число факторов, которые оказали решающее влияние на результаты, и оценить вклад каждого из них. С помощью математической статистики можно оценить и добротность самого статистического материала.

Отбор информации – важнейшая операция, от правильного проведения которой существенно зависит результат статистического анализа, а, следовательно, и выводы исследований. Не стоит заблуждаться относительно якобы объективности данных наблюдения или эксперимента. Во-первых, результаты таких наблюдений всегда имеют свойства случайной выборки из генеральной совокупности. Так обстоит дело и при контроле технологических процессов, когда проверяются не все характеристики не всех изделий; и при изучении природных явлений, когда не все факторы учитываются и контролируются; и при экспертизе, в которой принимает участие ограниченный круг экспертов. Вовторых, информация собирается для определенных целей. Для проверки различных моделей необходима различная информация, подчас одна в другую не преобразуемая. В-третьих, результаты наблюдений фиксируются всегда с какой-то погрешностью: из-за методики измерения, измерительной аппаратуры, округлений и т.п. Опыт человечества, давно заметившего эти обстоятельства, привел к простейшему приему отбора информации: чем ее больше, тем лучше.

В теории измерений это нашло свое выражение в методике многократного повторения опытов в идентичных условиях.

Однако не всегда есть возможность повторять опыты: это может быть слишком дорогим удовольствием или в принципе невозможно. В связи с этим приходится подробнее рассматривать различные виды отбора информации в эксперименте – получения выборки.

Отбор информации, происходящий помимо воли исследователя, называется естественным в противоположность искусственному. Здесь не следует путать ситуацию с пассивным и активным экспериментом (§ 7.1) – естественный отбор предполагает получение информации в виде констатации определенных событий, процесс которой (констатации) не зависит от исследователя. Далее рассматриваются различные виды искусственного отбора.

Пристрастный отбор осуществляется по заранее намеченному признаку.

Наука до ХХ века пользовалась именно пристрастным отбором информации: для выявления какой-либо зависимости в изучаемом природном явлении необходимо было избавиться от влияния "посторонних" факторов (например, от притяжения Земли, от проходящего трамвая и т.п.). Поэтому каждый отдельный опыт в эксперименте ставился в одних и тех же специальных условиях, имевших немаловажное значение и получивших наименование "чистоты эксперимента".

Случайный отбор производится с помощью случайных чисел по любой методике.

Механический отбор – отбор данных из всей совокупности по какомулибо правилу (например, каждый пятый).

Типический отбор – отбор из слоев (частей) всей имеющейся совокупности. Так делается отбор материала из отдельных партий продукции для технического контроля.

Аритмический отбор – частный случай типического и механического, когда отбор производится из равных групп по правилу, например: из первой группы берется первый элемент, из второй – второй, и т.д.

Пропорциональный отбор – частный случай типического отбора, когда из каждого слоя отбирается часть, пропорциональная объему слоя.

При репрезентативном отборе получается представительная выборка, достаточно полно характеризующая всю совокупность с точки зрения влияния важных и существенных факторов. Безусловно, к такому отбору следует стремиться, однако для оценки степени репрезентативности необходимы именно те характеристики, которые являются результатом конечного анализа отобранной информации. Поэтому в таких областях, как, например, политическая социология или экология, где цена принимаемого решения чрезвычайно высока, проводится специальный статистический эксперимент для оценки репрезентативности различных выборок и построения оптимальной из них по определенному критерию.

Существуют и другие виды отбора информации, в частности, расслоенный случайный отбор – комбинация типического и случайного, при которой из отдельных слоев (групп, частей) отбор осуществляется случайным образом.

Объем расслоенных выборок может быть произвольным или регулироваться: пропорционально объему слоев или оптимально – для обращения, например, в минимум дисперсии результатов 2 или стоимости эксперимента C и т.д.

В правой части табл. 7 (стр. 103) приведена система обозначений для выборочных данных из генеральной совокупности, принятая в данном учебном пособии.

В процессе любого эксперимента, в том числе и вычислительного, приходится иметь дело с теми или иными значениями наблюдаемых параметров.

Определение этих значений с достаточной точностью невозможно без многократных повторений опытов и специальной процедуры их обработки. Простейшим примером этого является определение средней величины результатов однотипных измерений. В более сложных случаях приходится вычислять значения ненаблюдаемых параметров по значениям наблюдаемых. Определение значения некоторого параметра наблюдаемого объекта по экспериментальным данным носит название статистической точечной оценки.

В первую очередь для расчетов и анализа любой случайной величины необходимо получить точечные оценки параметров закона ее распределения, основными из которых являются математическое ожидание a и дисперсия (см. § 5.1). Поэтому изучение статистических методов точечных оценок сосредоточено на получении оценок именно этих величин.

Наиболее простым методом нахождения точечных оценок является метод моментов, предложенный К. Пирсоном. Он заключается в приравнивании начальных r или центральных r моментов порядка r генеральной совокупности соответствующим моментам выборки. Т.е. для оценки математического ожидания достаточно использовать формулу:

где x называется выборочной средней, а для оценки дисперсии – формулу:

где DВ называется выборочной оценкой дисперсии.

Нетрудно заметить, что суммы в этих формулах отличаются друг от друга верхним пределом, что характеризует различие классического и статистического определений вероятности, и скобками: слева все возможные значения, справа встретившиеся в наблюдениях (в выборке). В этом переходе и содержится математический смысл метода моментов.

Основные преимущества метода моментов заключаются в простоте вычислений и независимости от законов распределения – их не нужно знать. Этим же методом можно построить точечные оценки для расслоенных выборок:

Обратимся к табл. 7 и проследим процесс получения точечной оценки a математического ожидания (генеральной средней) для наблюдаемой в k выборках (расслоенный отбор) случайной величины. Даже если отвлечься от элементарных знаний математической статистики, ясно, что в качестве такой оценки может выступать выборочная средняя x. Но если в нашем распоряжении k выборок (например, полученных k исследователями), то не ясно, какую из выборочных средних x j надо принять за оценку математического ожидания. Более того, эти выборочные средние x j сами по себе случайные величины, так как и выборки и условия экспериментов могут случайно меняться. А может быть вообще следует взять за искомую оценку какую-то другую величину, например, медиану, или моду, или среднее от средних? Тогда возникает вопрос, как это надо считать: ведь объем информации в разных выборках N j различен!

Способ определения точечной оценки * истинного значения параметра определяется теми ее свойствами, которые необходимо обеспечить в конкретном случае. Математическая статистика рассматривает следующие свойства точечных оценок.

Несмещенность – свойство точечной оценки *, при котором ее математическое ожидание равно истинному значению оцениваемого параметра: E(*) =.

Т.е. несмещенная точечная оценка определяет искомый параметр без систематической ошибки: отклонения, например, x j от генеральной средней a (математического ожидания) распределены симметрично. В специальном курсе математической статистики доказывается, что выборочная средняя x и исправленная выборочная оценка дисперсии s2 обладают свойством несмещенности:

Состоятельность – свойство точечной оценки *, при котором с возрастанием объема выборки N она стремится по вероятности к истинному значению оцениваемого параметра: lim P(| * | ) 1, где P – вероятность, – проN извольное сколь угодно малое число. В специальном курсе математической статистики доказывается, что выборочная средняя x является состоятельной оценкой математического ожидания.

Эффективной называется точечная оценка *, имеющая при заданном объеме выборки N наименьшую дисперсию. Естественно, что из нескольких состоятельных оценок следует выбирать наиболее эффективную. Препятствием выявления этого свойства может стать необходимость знания закона распределения изучаемой случайной величины. Поэтому далеко не всегда удается обеспечить эффективность найденной точечной оценки. Можно показать, что выборочное среднее x является эффективной оценкой математического ожидания.

Достаточная (исчерпывающая) точечная оценка не может быть существенно изменена из-за получения какой-либо дополнительной информации. В этом смысле такая оценка обеспечивает полноту использования всей информации, содержащейся в выборке, и свидетельствует о том, что выборка репрезентативная (представительная). Эффективная оценка обязательно является достаточной.

Свойства оценок математического ожидания a с помощью выборочных оценок среднего x, медианы ~ и моды x M ; дисперсии 2 с помощью неисx правленной DВ и исправленной s 2 оценок дисперсии; а также среднего квадратического отклонения с помощью D В, s и размаха R сведены в табл. 8.

параметр характеристика несмещенность состоятельность эффективность Метод моментов, изложенный выше, дает состоятельные оценки. Однако Р. Фишер показал, что полученные этим методом оценки могут быть смещенными и неэффективными. Он же разработал и обосновал другой метод, свободный от этих недостатков.

Метод наибольшего правдоподобия основывается на отыскании такой оценки параметра распределения *, которая обращает в максимум вероятность появления именно той выборки (x1, x2,..., xN), которая получена в эксперименте.

Для его реализации составляют функцию правдоподобия:

представляющую собой именно эту вероятность, определенную при искомом значении параметра * закона распределения. (В общем случае может рассматриваться задача нахождения нескольких параметров, тогда под * понимается вектор.) Далее тем или иным способом решается задача оптимизации – нахождения такого значения *, которое обеспечивает функции правдоподобия наибольшее значение.

По виду функции правдоподобия ясно, что составить и вычислить ее можно только тогда, когда известен вид закона распределения. Только в этом случае можно вычислить при любом предполагаемом значении * вероятность появления того набора значений случайной величины x1, x2,..., xN, который получен в эксперименте.

Требование знания закона распределения и является практически единственным, но существенным недостатком метода. Однако никто не запрещает сравнивать между собой наибольшие значения функций правдоподобия, определенных для нескольких альтернативных видов распределения.

Поскольку в практике чаще всего используются законы распределения, описываемые с помощью экспонент, оказалось удобным находить критические точки функции правдоподобия из необходимых условий экстремума не для самой L, а для ее логарифма (что одно и то же для отыскания единственного максимума):

называемых уравнением наибольшего правдоподобия. В таком виде удобно применять метод еще и потому, что для независимо полученных значений случайной величины (а именно так и стремятся поставить эксперимент) функция правдоподобия принимает вид произведения:

что обеспечивает простоту уравнения наибольшего правдоподобия:

Применение метода наибольшего правдоподобия для нахождения оценки математического ожидания приводит к тем же результатам, что и метод моментов, что и неудивительно, так как в этом случае и метод моментов обеспечивал все требуемые свойства оценок.

Можно показать, что известный метод наименьших квадратов (см. § 6.3) является частным случаем метода наибольшего правдоподобия для оценки математического ожидания нормально распределенной случайной величины.

Необходимость получения состоятельных, эффективных и достаточных оценок в случаях неизвестных законов распределения привела к разработке приемов получения робастных оценок и критериев – не зависящих от вида закона распределения или, по крайней мере, устойчивых к его нарушениям. Однако обольщаться этими приемами не следует, так как они в основном имеют эмпирическое происхождение, связаны с удачными решениями определенных задач, а в общем случае теоретически не обоснованы, т.е. не гарантируют получения результата.

Перечисленные выше требования к оценкам наталкивают на вопрос о приемлемом для тех или иных оценок объеме информации. Более подробно этот вопрос освещен в § 7.3, здесь же достаточно упомянуть простейшие практические ограничения снизу на объем статистического материала для уверенных результатов: N 30, N j 5.

Это ограничение касается не столько обеспечения состоятельности и эффективности оценки, сколько достаточности степеней свободы выборки. Числом степеней свободы для системы n случайных величин называется число n этих величин минус число линейных связей между ними. Поэтому при определении выборочного среднего – первой числовой характеристики (связи) – в качестве числа степеней свободы используется объем выборки N или, соответственно, N j (число полученных в выборке случайных значений). При вычислении второй характеристики – дисперсии – число степеней свободы необходимо уменьшить на 1 за счет использования связи в виде выборочного среднего.

Вот почему несмещенная оценка дисперсии требует в знаменателе своей формулы число N – 1 или N j 1. Кроме того, число степеней свободы, оправдывая свое название, указывает количество связей между величинами, которые можно определить на данном статистическом материале, не опасаясь их линейной зависимости и, соответственно, вырожденности результатов. Поэтому ограничение снизу N j 5 в 5 единиц оставляет свободу использования таких независимых характеристик, как среднее, дисперсия, медиана и мода.

В табл. 9 в обозначениях табл. 7 приведены формулы для вычисления требуемых объемов выборок из слоев, отобранных различными, описанными в § 5.2, способами, и выборочного среднего всей совокупности с его дисперсией.

стоимость эксперимента обозначена C C 0 c j N j, где C0 – накладные расj ходы, cj – стоимость одного наблюдения в j-м слое.

Фундаментальное значение в теории вероятностей имеет центральная предельная теорема, доказывающая, что сумма произвольно распределенных независимых случайных величин при условии одинакового их влияния распределена по нормальному закону. Нормальному закону распределения подчиняется, например, случайная ошибка измерений, к которой человечество привыкло за тысячелетия своей практической деятельности. На практике это означает хорошо известный на бытовом уровне факт, что погрешность измерений при их многократном повторении стремится к характерному колоколообразному распределению – распределению ошибки (см. рис. 43). Эта колоколообразная кривая, называемая кривой ошибок или кривой Гаусса, и представляет собой плотность распределения вероятностей нормального закона.

В общем виде нормальный закон распределения описывается функцией его плотности распределения вероятностей:

с математическим ожиданием a и дисперсией 2 и интегральной функцией:

Поскольку интегральная функция распределения F(x) используется в приложениях, а через элементарные функции не выражается, ее табулируют. Такую функцию для стандартизованного нормального закона при a = 0, = 1 называют функцией Лапласа и обозначают (x). Через (x) можно выразить интегральную функцию распределения для любых значений математического ожидания а и среднего квадратического отклонения. Существует несколько разновидностей функции Лапласа:

– *(x) затабулирована в [9], 1(x) – в [26], (x) – в [18].

В § 5.1 рассматривалось множество значений выборочных средних x j, претендовавших на оценку математического ожидания. Каждое из этих значений теперь можно рассматривать как отдельную реализацию некоторой не рассматривавшейся ранее случайной величины – выборочной средней (определяемой суммой случайных значений), которая, согласно центральной предельной теореме, распределена по нормальному закону. А так как закон распределения известен, то оценку математического ожидания генеральной совокупности можно получить с заданными свойствами.

Эти рассуждения наводят на мысль об обоснованной возможности получения состоятельных и эффективных оценок не только математического ожидания, но и некоторых функций от него, используя такие величины, как среднее выборочное, выборочная оценка дисперсии, выборочная ковариация и т.д.

Особенно важным это становится при обработке структурированных выборок большого объема (см. табл. 7), необходимых для статистического анализа.

В табл. 10 приведены распределения некоторых важных выборочных функций – функций от выборочных значений. Во всех этих случаях предполагается, что выборка объема N (или в слое N j ) сделана из нормально распределенной генеральной совокупности с математическим ожиданием a (или a j ) и дисперсией 2 (или i2 ). В табл. 10 обозначены следующие законы распределения, таблицы которых приводятся в специальной литературе: u – стандартизованное нормальное распределение с нулевым математическим ожиданием и единичной дисперсией (u-распределение); t – распределение Стьюдента (t-распределение); r – r-распределение; 2 – 2 -распределение Пирсона; F – распределение Фишера (v 2 -распределение); z – z-распределение. Кроме того введены обозначения: для характеристик расслоенных выборок:

– s 2 – межгрупповая дисперсия (выборочная оценка) между слоями (рассеяние изA за влияния исследуемого фактора) и s 0 – остаточная (внутренняя) дисперсия (выборочная оценка) внутри слоев (рассеяние результатов из-за влияния неучтенных факторов); а для системы случайных величин:

– гипотетический (генеральный) и выборочный byx коэффициенты регрессии, выборочные коэффициент корреляции и ковариация.

В специальной литературе можно найти несколько более широкий список выборочных функций. Кроме того, в прикладных исследованиях можно пользоваться не только точными законами распределения выборочных функций, но и приближенными. Перечень известных приближенных законов распределения выборочных функций значительно шире.

Таким образом, зная закон распределения выборочной функции, можно построить оценки наибольшего правдоподобия для параметров ее распределения. При этом математическое ожидание и дисперсия упомянутых в табл. законов распределения принимают значения, приведенные в табл. 11, где под f понимается число степеней свободы соответствующего закона.

Кроме того, законы распределения выборочных функций играют большую роль и в других задачах математической статистики, которые будут рассмотрены в следующих параграфах.

Точечные оценки параметров распределения не всегда дают достаточно информации для анализа и выводов. Прежде всего, это связано с приближенностью полученных оценок из выборок небольшого объема. Кроме того, точечные оценки не дают информации об их точности. Использование для этой цели оценок дисперсии не всегда помогает, так как и они определяются неточно и имеют некоторую неединичную вероятность. Поэтому с некоторого момента стали использоваться интервальные оценки параметров закона распределения – доверительные интервалы. Идея Ю. Неймана об интервальных оценках заключается в получении некоторого интервала, в котором должен находиться оцениваемый параметр. Но, поскольку оценки такого рода делаются на основе случайной выборки, а не генеральной совокупности, постольку они должны даваться с определенной вероятностью. Так было сформулировано понятие доверительного интервала: интервал (*l, *r ) (l – левая граница, r – правая граница), в котором с заданной доверительной вероятностью следует ожидать истинное, но не известное значение оцениваемого параметра, т.е.:

Выписанное соотношение является ключевым для всей процедуры отыскания доверительного интервала. Действительно: если известен закон распределения оцениваемого параметра (а его интегральная функция распределения по определению монотонно возрастает – см. вероятность попадания в интервал в § 5.1), то всегда можно подобрать множество пар значений (*l, *r ), удовлетворяющих определению доверительного интервала. Остается только договориться о конкретном выборе такой пары.

Естественным для такого выбора является опора на точечную оценку * искомого параметра, найденную предварительно, и определение границ по этой величине:

где погрешности l, r (допуски) характеризуют точность оценки влево и вправо от *. В простейшем случае принимают l r, т.е. строят симметричный доверительный интервал относительно точечной оценки параметра.

Таким образом, оговорив соотношение между l и r, можно определить доверительный интервал однозначно, если только известен закон распределения для выборочной функции от этого параметра.

Найти симметричный доверительный интервал для математического ожидания a нормально распределенной случайной величины в случае известного среднего квадратического отклонения.

В табл. 10 есть две выборочные функции, которые содержат искомый параметр a и известный параметр : в 1-й и в 4-й строках. Согласно принятой системе обозначений, с помощью первой строки можно определить a, исходя из единственного замера искомого параметра x i, а с четвертой – исходя из выборочного среднего x по выборке объемом N. Для этого проведем простейшие алгебраические преобразования на примере x i :

При известном законе распределения величины вычисление этой вероятности не представляет труда – достаточно воспользоваться формулой вероятности попадания в заданный интервал. В нашем случае эта величина согласно 1-й строке табл. 10 распределена по стандартизованному нормальному закону, таблицу функции Лапласа для которого возьмем из [18]. Для такой симметричной относительно нуля функции Лапласа выражение для определения доверительного интервала приобретает вид:

При заданном по таблице функции Лапласа можно определить ее аргумент u 0,5 = /. Таким образом численное значение погрешности для точечной оценки математического ожидания a по данным единственного замера x i определится: u 0,5, где u 0,5 – аргумент функции Лапласа, соответствующий значению функции, равному (u 0,5 ) 0,5. В итоге доверительный интервал приобретает вид:

Аналогичным образом строится доверительный интервал для точечной оценки математического ожидания a по выборочному среднему x из 4-й строки табл. 10, в результате чего, как нетрудно проверить, получается выражение:

свидетельствующее об уменьшении погрешности (увеличении точности) в N раз по сравнению с единственным замером. Этот факт давно известен человечеству: "семь раз отмерь – один отрежь".

Этот пример разобран так подробно, чтобы показать возможность получения формулы доверительного интервала без использования специальных справочников для любого оцениваемого параметра с помощью таблицы законов распределения выборочных функций типа табл. 10. Так вычисляются доверительные интервалы для известных из курса математической статистики случаев: математического ожидания при неизвестном среднем квадратическом отклонении (из 5-ой строки), а также для дисперсии (из 6-ой).

В многообразной практической деятельности человека процедура выдвижения и проверки гипотез имеет самые различные формы от простейших бытовых обсуждений (насколько разбавлена сметана недобросовестным продавцом) до расчетов стоимости эффекта и потерь (какова средняя стоимость ремонта аварийного автомобиля – для страховой компании). Наиболее обоснованной из этих форм является математическая теория проверки статистических гипотез.

В математической статистике существует жесткое правило: любое предположение о свойствах распределения некоторой величины, основанное на выборочных данных, должно быть проверено. Статистическая проверка не может доказать истинность (чего не может сделать вообще никто), но может указать с некоторой долей уверенности на наличие или отсутствие признаков опровержения данного суждения. Дальше уже дело человека – принять или отвергнуть предлагаемую гипотезу на основании такого статистического вывода.

Некоторые вопросы статистической проверки затрагивались при изучении свойств точечных оценок. Например, неприемлемость в некоторых приложениях смещенной оценки дисперсии проистекало именно из-за того, что возникали признаки опровержения полученных результатов.

Собственно проверка статистических гипотез представляет собой аппарат получения оценки соответствия выдвинутой гипотезы полученному статистическому материалу, т.е. выборке.

В качестве выдвигаемых гипотез обычно выступают предположения о свойствах закона распределения F(x, ) генеральной совокупности. Таковыми могут быть предположения о значениях параметров закона распределения – для их проверки применяются параметрические критерии, а также предположения о непараметризуемых свойствах распределения – для них служат непараметрические критерии. Первые из таких гипотез принято обозначать H0: = 0, вторые более общим выражением H0: F(x) = F0(x, 0). Первые требуют знания общего вида закона распределения, зато вторые оказываются менее эффективными. Под 0 здесь понимается вполне определенное число, на совпадение с которым желательно проверить параметр.

В качестве критерия соответствия понимается достижение определенного значения функции правдоподобия (см. § 5.3) полученной выборки. Т.е. если выборка попадает в область малого правдоподобия, то присутствуют признаки опровержения гипотезы – есть основания отвергнуть эту гипотезу. В противоположном случае нет оснований отвергнуть гипотезу.

Однако, поскольку наши суждения о реальности весьма ограничены, постольку нельзя забывать о возможной ошибке в наших выводах, поэтому здесь возможны не два, а четыре исхода:

1) гипотеза верна и не отвергается согласно критерию (правильный вывод);

2) гипотеза неверна и отвергается согласно критерию (правильный вывод);

3) гипотеза верна, но отвергается согласно критерию (ошибка I рода);

4) гипотеза неверна, но не отвергается согласно критерию (ошибка II рода).

Вероятность ошибки I рода, т.е. вероятность ошибки при условии верности гипотезы, принято обозначать и называть уровнем значимости критерия. Для оценки гипотезы необходимо назначать уровень значимости – максимальное значение вероятности, которое принимается за практическую невозможность получения конкретной выборки с гипотетическими свойствами. Тогда вероятность правильного неотвергания проверяемой гипотезы (1-го исхода) равна 1 –.

Вероятность ошибки II рода, т.е. вероятность ошибки при условии неверности гипотезы, может быть оценена только после конкретизации альтернативной (конкурирующей) гипотезы, поскольку в этом случае решающее значение имеет "отдаленность" исходной гипотезы от ее альтернативы. Эту вероятность принято обозначать. При этом вероятность правильного отвергания проверяемой гипотезы (2-й исход) равна 1 –, эта величина называется мощностью критерия.

Рассмотрим более подробно аппарат проверки статистических гипотез на примере параметрических критериев для проверки гипотез о значении математического ожидания. Итак, в этом случае речь идет о проверке гипотезы H0: a = a0.

Для дальнейших рассуждений нам понадобится вид функции плотности распределения f ( x, a ) f [( x 1, x 2,..., x N ), a ] вероятности появления наблюдаемого значения выборочной функции в предположении равенства математического ожидания a значению a 0 (в соответствии с выдвинутой гипотезой). Пусть такое распределение, полученное с помощью табл. 10, изображено на рис. 44. В нашем примере такой выборочной функцией выступает среднее выборочное всех наблюN даемых результатов: x ( x 1, x 2,..., x N ) x i. (Для оценки других параметров следует использовать соответствующие выборочные функции, содержащие вместо x оцениваемый параметр, принципиальные рассуждения остаются теми же.) Тогда вероятность ошибки I рода распределится на две в общем случае неравные части 1 и – 1, которым соответствуют две части критической области, заштрихованной на рис. 44. Так как погрешность определения математического ожидания обычно рассматривается одинаковой в отрицательную и положительную стороны, то обе части критической области будем считать начинающимися на равном удалении от оценки a0. Средняя часть значений x, вне критической области, соответствует допустимым оценкам математического ожидания, которые могут считаться неотличимыми от принятой a0. Такая оценка может, например, быть получена вычислением выборочного среднего или иным способом.

Если полученное в эксперименте выборочное среднее x (вычисленное в качестве оценки математического ожидания a0) попадет в критическую область, то это будет означать, что различие между x и a0 значимо (существенно, неслучайно, проистекает от каких-то неучтенных факторов, им нельзя пренебречь), и гипотеза H0: a = a0 не может быть принята.

Если выборочное среднее x не попадет в критическую область, то это будет означать, что различие между x и a0 незначимо (несущественно, случайно, им можно пренебречь) и нет оснований отвергнуть гипотезу H0: a = a0, она может быть принята.

Проведенное разбиение критической области на две части на самом деле подразумевает введение дополнительного момента в наши построения: предположения о том, что отклонение от a0 в любую сторону на любую величину одинаково неприемлемо. Т.е. вводится вторая – альтернативная (конкурирующая) гипотеза вида H0: a a0, которая не оговаривает направление отклонения.

Именно применение такой альтернативы позволяет конкретизировать вид и расположение критической области, как симметричной – "двухсторонней". В этом случае критерий принято называть также двухсторонним.

Рис. 45 иллюстрирует ситуацию с альтернативной гипотезой H0: a < a0, а рис. 46 – с H0: a > a0. В этих случаях дополнительных пояснений не требуется.

Но возможен еще один вид альтернативной гипотезы: H1: a = a1, когда фактически ставится задача оценки одного варианта из двух, различающихся на некоторую величину a1 – a0. Этот случай мы рассмотрим подробнее с помощью рис. 47, на котором для определенности a1 > a0.

Как и прежде, граница критической области проводится по распределению, соответствующему исходной гипотезе, исходя из заданного уровня значимости. При попадании x в нее (правее границы x*) исходную гипотезу H0: a = a0 следует отвергнуть, а левее – нет таких оснований. На рис. 47 вероятности ошибки I рода соответствует область под левой кривой правее границы x* критической области. Однако аналогичные рассуждения можно провести с той же границей x* для альтернативной гипотезы H1: a = a1 при заданном значении. Вероятность ошибки II рода соответствует области под правой кривой левее границы критической области x*. Очевидно, что в этом случае выбирать произвольно три величины:, и a1 – a0 нельзя. Формулировка альтернативной гипотезы необходима для конкретизации практической задачи и для разумного выбора и, исходя из оценки важности каждого из четырех возможных исходов. Эта графическая интерпретация помогает при анализе возможных исходов и выборе параметров и.

Практическая реализация проверки статистических гипотез осуществляется с помощью вычисления критерия значимости, представляющего собой некоторую из выборочных функций, закон распределения которой известен. Таким образом, алгоритм проверки статистических гипотез с помощью параметрических критериев может выглядеть следующим образом:

1 выдвижение оцениваемой гипотезы H0;

2 выдвижение альтернативной гипотезы H1;

3 установление подходящего уровня значимости ;

4 выбор подходящей выборочной функции по следующим признакам:

– подчиненность известному закону распределения (хотя бы с контролируемым приближением), – простота вычислений, – обеспечение наилучшего критерия (наиболее мощного: 1 – 1);

5 определение (вычисление или построение) распределения используемой выборочной функции в предположении гипотезы H0;

6 определение критической области для проверки гипотезы H0 с учетом альтернативной H1;

7 получение выборки и вычисление значения выборочной функции (вычисление "статистики");

8 принятие решения: если вычисленное в предыдущем пункте значение ("статистика") попало в критическую область, то гипотезу следует отвергнуть, в противоположном случае нет оснований отвергнуть гипотезу.

Однако есть специальные случаи, когда указанный алгоритм не имеет ярко выраженного завершенного вида.

В последнем из рассмотренных случаев альтернативных критериев несогласованность задаваемых параметров, и a1 – a0 может приводить к такой ситуации, когда невозможно сделать определенный вывод. Тогда, если задаваемые параметры, и a1 – a0 выбраны на основании физического смысла и требований, то указанное неопределенное состояние может свидетельствовать только об одном: статистическая информация не соответствует поставленной задаче исследований. В этом случае ее необходимо обновлять или расширять.

Подобные вопросы возникают и в случае невозможности обосновать априорное значение. Простейший подход к этой проблеме состоит в построении специального, отдельного эксперимента для нахождения его оценки, степени ее достоверности и значимости. Только после этого можно применять математический аппарат для решения практической задачи. Но здравый смысл подсказывает, что в принципе должна быть возможность объединить такую сугубо предварительную процедуру с собственно экспериментом. Чисто механическое объединение здесь, конечно, невозможно: достаточно вспомнить (см. § 5.3), что число степеней свободы при вычислении статистической оценки существенно зависит от количества проведенных опытов (наблюдений) и способов определения других точечных характеристик распределения.

Такая ситуация характерна для последовательного анализа и применения секвенциальных (последовательных) критериев. Ниже рассматривается один пример такого критерия – критерий Вальда. Однако применение последовательного анализа следует рассматривать значительно шире: на каждой стадии эксперимента необходимо оценить его результаты с точки зрения ответа на поставленный вопрос и, если уверенного ответа ни в положительном, ни в отрицательном смысле не удается получить, продолжать эксперимент.

Для выбора между двумя гипотезами H0: a = a0 и H1: a = a1, где a1 > a0, задаются вероятности ошибочного их отвергания: и, соответственно. Тогда с помощью секвенциального (последовательного) критерия можно сделать один из трех выводов: принять проверяемую гипотезу, принять альтернативную гипотезу, продолжить эксперимент для увеличения объема выборки. При соблюдении условий: вид функции распределения известен, гипотезы фиксированы, и выбраны – А. Вальд предложил секвенциальный критерий отношения вероятностей:

где p0m и p1m – плотности вероятностей состоявшихся m наблюдений, вычисленные по функциям распределения с параметрами a0 и a1 соответственно. Если это неравенство выполняется, то следует продолжать эксперимент. При выходе отношения вероятностей за левую границу следует принять основную гипотезу H0: a = a0, при выходе за правую границу следует принять альтернативную гипотезу H1: a = a1. Алгоритмы секвенциальных критериев всегда заканчиваются принятием гипотез, причем требуют, как правило, вдвое меньшего объема эксперимента, чем классические критерии для оценки тех же гипотез (см. табл. 17).

Необходимо отметить, что на практике последним двухсторонним неравенством пользоваться не очень удобно: для малых и левое отношение много меньше 1, а правое – много больше. Поэтому отношение вероятностей выражают непосредственно через проверяемые законы распределения и алгебраическими преобразованиями сводят к неравенству для x m – выборочному среднему параметра x по результатам состоявшихся m наблюдений. Границы критерия для этой величины зависят только от m, причем с ростом m сближаются, как показано на рис. 48, обеспечивая сходимость метода. Для этой иллюстрации принято: a1 – a0 = 1, = 3,5, = = 0,05.

Все рассмотренные выше методы проверки гипотез относились к случаям оценки параметров выборочного закона распределения, вид которого предполагался известным хотя бы приближенно. В случае неизвестного закона распределения параметрические критерии не могут дать ответа на вопрос о справедливости статистических гипотез, поэтому применяются непараметрические критерии. Гипотезы, которые можно проверить с помощью непараметрических критериев, не касаются каких-либо числовых значений, а носят обобщенный характер, позволяющий применять их в областях, далеких от математики.

Основной задачей, где применяются непараметрические критерии, является задача сравнения двух совокупностей результатов: эмпирических с теоретическими или двух связанных или независимых эмпирических между собой. Если параметрические критерии для такого сравнения оперировали с числовыми характеристиками и известными законами распределения, то непараметрические критерии опираются на ранги – специфические числовые характеристики упорядоченных результатов эксперимента. Под упорядочением можно понимать и математические: больше – меньше, и нематематические классификационные признаки.

Простейший ранговый критерий – критерий знаков – использует только два ранга: да – нет или больше – меньше. Характерная двухранговая ситуация встречается в результатах опросов или тестирования. Здесь мы сформулируем критерий знаков для сопоставления двух непрерывных случайных величин и. Пусть имеются парные выборки одного объема N, в которых значения случайных величин и встречаются прами: (x 1, y1 ), ( x 2, y 2 ),..., ( x N, y N ). В силу их непрерывности вероятность одинаковых значений в паре равна нулю, поэтому случаи практического совпадения из-за неточностей регистрации или округления отбрасываются. Если проверять гипотезу об одинаковом распределении величин и, как независимых, то должны совпадать вероятности:

Вероятность того, что среди этих N пар более m имеют положительные разности xi – yi > 0, легко подсчитывается в теории вероятностей через число сочетаний из N по j:

(В специальной литературе можно найти таблицы этой "функции накопления" биномиального распределения.) По заданному (выбранному) уровню значимости определяется m() – наименьшее значение m, при котором pN(m).

Если альтернативной является гипотеза о том, что случайная величина >, то критерий знаков выглядит следующим образом: для опровержения исходной гипотезы необходимо, чтобы число положительных разностей xi – yi > было больше m() – т.е. в этом случае превосходство значений xi над yi неслучайно – знчимо. (При альтернативной гипотезе < следует просто поменять случайные величины местами.) Если альтернативной является гипотеза о том, что случайная величина существенно отличается от случайной величины в любую сторону ( ), то критерий знаков требует отвергнуть исходную гипотезу, если число положительных или число отрицательных разностей окажется больше m() – при заданном уровне значимости 2.

Этот же критерий знаков можно использовать для проверки гипотезы о значении медианы ~ эмпирического распределения: достаточно рассматривать разности полученных выборочных значений случайной величины и гипотетического значения медианы. Он применяется и для проверки симметрии закона распределения.

Другим из наиболее известных непараметрических критериев является критерий согласия К. Пирсона 2 для сравнения законов (не важно какого вида!) распределения двух случайных величин. Покажем его применение при проверке подчиненности полученной экспериментальной выборки определенному теоретическому (гипотетическому) закону распределения.

Весь диапазон N данных эксперимента разделим на r интервалов таким образом, чтобы обеспечить приемлемое число степеней свободы, т.е. число попаданий в i-й интервал наблюдаемых значений N i 5 (см. § 5.3). По этому же принципу число таких интервалов должно быть не менее 6, т.е. N 30. Тогда наблюдаемое значение критерия Пирсона 2 определяется формулой:

где pi – вероятность попадания в i-й интервал случайной величины, вычисленная по проверяемому теоретическому закону распределения. По специальной таблице распределения 2 при уровне значимости (вероятности совершить ошибку первого рода: отвергнуть верную гипотезу) с n = r – 2 степенями свободы определяется величина крит., n.

Если наблюдаемое 2., n, то различие статистического и гипотетичекрит ского законов распределения незнчимо. Т.е. при заданном уровне значимости нет оснований отвергнуть гипотезу о совпадении законов распределения, т.е.

можно принять гипотезу о подчиненности экспериментальных данных гипотетическому закону распределения. В случае противоположного неравенства:

наблюдаемое крит., n расхождение знчимо (не может считаться случайным) и гипотезу следует отвергнуть, т.е. результаты эксперимента не описываются гипотетическим законом распределения.

5.7. Статистическая проверка адекватности математических моделей В § 2.2 разработан общий подход к оценке адекватности математических моделей механических систем и процессов. Для адекватности математической модели реальному поведению оригинала рассогласование соответствующих параметров должно удовлетворять двум критериям: точности и непротиворечивости. Таким образом, необходим алгоритм проверки этих двух критериев для величины рассогласования результатов контрольного вычислительного эксперимента с результатами натурного эксперимента в тех же условиях:

u = uмодели – Uоригинала. Эта величина на практике принимает дискретные значения, так как данные об оригинале регистрируются аппаратурой в конечном числе точек замера. Задачей контрольного вычислительного эксперимента в этом случае является получение данных о тех же параметрах в тех же узловых точках. В результате для статистического анализа предлагается множество значений рассогласования {ui; i = 1, 2,..., N} – выборка из генеральной совокупности истинной величины рассогласования.

Как известно даже на бытовом уровне, для повышения точности измерений проводят не одно измерение, а несколько. Это делается не из-за того, что какое-то из них может оказаться ошибочным, а из-за замечательного свойства дисперсии средней арифметической величины измерений: уменьшаться с ростом числа повторений опытов:

где D и – дисперсия и среднее квадратическое отклонение в одном опыте (измерении), D N и N – дисперсия и среднее квадратическое отклонение результата осреднения замеров по N опытам. В справедливости этих формул нетрудно убедиться на основании математических определений указанных величин (см. § 5.1).

Поэтому с помощью бльшего числа опытов достигают меньшего рассеивания (среднего квадратического отклонения) данных, т.е. большей точности.

Однако одной величины среднего квадратического отклонения для оценки точности результатов недостаточно. Такая оценка страдает неполнотой, так как не учитывает, насколько часто встречаются большие и малые, положительные и отрицательные рассогласования.

Итак, точность следует определять единой оценкой всего множества наблюдаемых значений случайной величины рассогласования результатов вычислительного эксперимента и "истинного" значения наблюдаемой величины. По своему смыслу в качестве такой "истинной" единой оценки должно выступать математическое ожидание рассогласования, которое обозначим a. Но об этом "истинном" значении рассогласования мы ничего не можем знать достоверно, остается о нем судить лишь с определенной вероятностью по ограниченному числу опытов.

Поэтому наиболее полную оценку точности (вернее, погрешности) вычислительного эксперимента дает доверительный интервал (§ 5.5) для математического ожидания рассогласования. Так, например, может звучать вывод о точности в этом случае: с доверительной вероятностью 0,98 гарантируется погрешность угла атаки не более 0,3. Критерием оценки точности тогда является соблюдение этой парой значений условий, приемлемых с точки зрения целей исследования.

Единственным практическим недостатком такой оценки может быть лишь необходимость знать закон распределения исследуемого рассогласования.

Однако, во-первых, для оценки погрешности по подавляющему большинству параметров механических систем можно считать такое распределение нормальным, хотя бы приблизительно в некоторой области, а во-вторых, можно практиковать построение несимметричных доверительных интервалов, отражающих разную степень строгости требований по точности.

Доверительный интервал для оценки истинного значения рассогласования a по найденному значению выборочной средней величины рассогласования u при неизвестном значении, но известной несмещенной выборочной оценке среднего квадратического отклонения s, можно построить аналогично примеру § 5.5 на основании 5-ой строки табл. 10:

а t(, N–1) определяется по распределению Стьюдента; N j – число попаданий в j-й интервал (из r) наблюдаемых рассогласований u; u j – середина j-го интервала; N – общее число наблюдаемых значений u. Центр этого доверительного интервала определяется значением выборочной средней величины рассогласования u. Размер доверительного интервала тем меньше, чем меньше доверительная вероятность, и чем больше число опытов N.

Естественно, при планировании вычислительного эксперимента следует стремиться к тому, чтобы такая оценка погрешности (т.е. доверительный интервал) не выходила за границы требуемой с точки зрения целей исследования погрешности, чего можно добиться разумным увеличением числа опытов N и уменьшением доверительной вероятности. Иными словами, следует стремиться к тому, чтобы доверительный интервал целиком укладывался внутри допустимой погрешности (например, от до ).

Если такого условия не удается выполнить на данной серии опытов, то следует или увеличить число опытов N, или уменьшить доверительную вероятность. Однако последнее значительно слабее влияет на результат, тем более, что значения доверительной вероятности < 0,7 применять не желательно, так как это означает, что почти треть значений рассогласований может выходить за границы доверительного интервала (треть рассогласований принимает неконтролируемые значения).

Однако оценки точности с помощью доверительного интервала для математического ожидания рассогласования тоже недостаточно. Даже в том случае, когда рассеивание результатов мало, и гарантируется с определенной доверительной вероятностью, может существовать систематическая погрешность. Ее присутствие свидетельствует о закономерности рассогласования между оригиналом и моделью и не позволяет пользоваться ею.

Оценка систематической ошибки делается по величине выборочного среднего рассогласований, так как эта точечная оценка по своему смыслу характеризует среднее значение рассогласований, "присутствующее постоянно".

Указанную оценку можно получить с помощью критерия Стьюдента, построенного на t-распределении из 5-ой строки табл. 10 в предположении идеального случая: истинное значение математического ожидания погрешности равно нулю a = 0. По указанному критерию сравниваются две величины:

где tкрит.(1 –, N – 1) – предельное значение критерия, определяемое по таблице распределения Стьюдента при уровне значимости (вероятности совершить ошибку первого рода: отвергнуть верную гипотезу об a = 0) с N – 1 степенями свободы.

Если |t| < tкрит., то систематическая ошибка незнчима, т.е. несущественна и можно считать a = 0. В случае противоположного неравенства: |t| > tкрит. систематическая ошибка знчима, т.е. не может считаться нулевой. В последнем случае математическая модель может считаться достаточно точной только при выполнении двух условий: доверительный интервал не выходит за границы требуемой с точки зрения целей исследования погрешности, а выборочное среднее погрешностей u пренебрежимо мало с точки зрения целей исследования, чтобы учитывать такую систематическую (закономерную) ошибку.

Непротиворечивость со статистической точки зрения может означать незначимость рассогласования, иными словами, неподверженность каким-либо закономерностям, непринципиальность – хаотичность. Последний термин и служит основой для построения критерия оценки непротиворечивости с помощью критерия согласия Пирсона 2 (§ 5.6). Для этого достаточно, чтобы рассогласование между моделью и оригиналом имело характер простой ошибки измерений, т.е. подчинялось нормальному закону распределения с нулевым математическим ожиданием a = 0.

По критерию Пирсона 2 для этого сравниваются две величины:

где p j – вероятность попадания в j-й интервал (из r) нормально распределенной случайной величины с математическим ожиданием a = 0 и средним квадратическим отклонением = s, а крит., n – определяется по таблице распределения 2 при уровне значимости (вероятности совершить ошибку первого рода: отвергнуть верную гипотезу о нормальном распределении рассогласования) с n = r – 2 степенями свободы.

Если наблюдаемое 2., n, то различие статистического и гипотетичекрит ского (нормального) законов распределения незнчимо. Т.е. при заданном уровне значимости гипотезу о поведении рассогласования эксперимента и "истины", как случайной ошибки измерений, можно принять и можно считать результаты вычислительного эксперимента не противоречащими реальному наблюдаемое крит., n расхождение знчимо (закономерно, не может считаться случайным) и гипотезу следует отвергнуть, т.е. результаты вычислительного эксперимента противоречат реальному поведению оригинала.

Только в том случае, когда выполнены условия и требуемой точности, и непротиворечивости, можно считать результаты вычислительного эксперимента адекватными реальному поведению оригинала с доверительной вероятностью и уровнем значимости в эксперименте из N опытов.

Таким образом, можно составить алгоритм проверки адекватности математической модели реальному поведению оригинала с помощью статистических критериев, предварительно задав допустимую погрешность, уровни значимости m, и доверительную вероятность, исходя из целей исследования. В этом алгоритме строго соблюдается последовательность проверки статистических критериев, каждый следующий из которых опирается на вывод предыдущего.

1 Выбирается один из параметров объекта, для которого есть результаты наблюдения {Ui} в N точках, и соответствующий параметр {ui}, полученный в контрольном вычислительном эксперименте в тех же условиях в тех же точках.

2 Вычисляются разности ui = ui – Ui.

3 Вся область значений u разбивается на r интервалов таким образом, чтобы в каждый из них попало не менее пяти значений u i.

4 Производится расчет количества попадания u i в каждый j-й (1 j r) интервал – частот N j.

5 Определяются статистические оценки параметров распределения дина j-го интервала; и несмещенная оценка дисперсии s 2 6 Для проверки непротиворечивости, т.е. подчиненности рассогласования нормальному закону распределения, применяется критерий согласия Пирсона. Вычисленное значение набл.

нормально распределенной случайной величины с математическим ожиданием a = 0 и средним квадратическим отклонением s в j-й интервал, сравнивается с табличным значением распределения Пирсона крит (; r 2), где наиболее употребительные значения = 0,05 или = 0,01. Здесь число степеней свободы уменьшено на единицу, так как кроме выборочной средней используется найденная из выборки несмещенная оценка дисперсии. Если набл крит (; r 2), то распределение u незначимо отличается от нормального, т.е. результаты вычислительного эксперимента можно считать не противоречащими реальному поведению оригинала. Если набл 2 (; r 2), то значимое отличие распределения u от нормального свидетельствует о противоречии результатов вычислительного эксперимента реальному поведению оригинала и исследования адекватности следует прекратить.

Замечание. Проверка непротиворечивости (пригодности нормального закона распределения) проводится первой среди всех применяемых в данном алгоритме критериев и интервальных оценок, так как критерий согласия К. Пирсона 2 не требует сведений о законах распределения, а все последующие пункты требуют знания закона распределения и основаны на том, что u распределено по нормальному закону распределения с нулевым математическим ожиданием a = 0 и средним квадратическим отклонением s.

7 Для оценки систематической ошибки проверяется гипотеза о равенстве нулю математического ожидания (a = 0) рассогласования u с помощью нивается с t(1 – m; N – 1), определяемым по таблице распределения Стьюдента при уровне значимости m (0,05 или 0,01) и числе степеней свободы N – 1. Если |t| > t(1 – m; N – 1), то дальнейшие исследования адекватности нужно прекратить, так как это означает существование недопустимой систематической погрешности между результатами вычислительного эксперимента и реальным поведением оригинала. Если |t| < t(1 – m; N – 1), то систематическая погрешность отсутствует и можно продолжать исследования.

Замечание. Вывод об отсутствии систематической ошибки (a = 0) лишь подтверждает возможность исследования непротиворечивости в п. 6, а противоположный вывод – опровергает, т.е. делает его ничтожным.

8 Для оценки точности математической модели строится доверительный интервал для математического ожидания рассогласования при заданной доверительной вероятности (обычно 0,8; 0,9; 0,99; или 0,999):

где t (, N 1) определяется по таблице распределения Стьюдента. Если радиус доверительного интервала не превосходит допустимой погрешности то математическую модель можно считать достаточно точной по отношению к оригиналу.

В дополнение к этому можно построить доверительный интервал для среднего квадратического отклонения рассогласования:

используя распределение 2.

9 Если по п. 7 можно считать математическую модель не противоречащей оригиналу, а по п. 8 и достаточно точной, то результаты расчетов адекватны реальному поведению оригинала.

Замечание. Если оценка точности математической модели оказывается во много раз лучше допустимой (иными словами, погрешность практически неразличима), то даже в отсутствии непротиворечивости математическую модель можно признать адекватной. Правда, получить с помощью предложенного алгоритма оценки систематической ошибки и точности можно только в том случае, если есть возможность загрубить требования непротиворечивости (т.е. задать существенно меньший уровень значимости ).

5.8. Основы статистического контроля качества технологических процессов Рассмотренные в предыдущих параграфах статистические методы позволяют поставить любой технологический процесс под математически строгий контроль. Это означает, что, организуя специальным образом сбор статистического материала о параметрах производства, можно делать научно обоснованные (с оценкой ошибок) выводы о качестве процесса, тенденциях его изменения и о качестве продукции.

Регулирование качества технологических процессов на основе текущего контроля получило широкое развитие в 60-х годах ХХ века в основном в виде техники контрольных карт. Сбор и обработка статистической информации для них предельно формализованы, а преднамеренная ее фальсификация требует серьезной математической подготовки и недоступна на производстве. В последние годы стали появляться новые статистические методы контроля, учитывающие экономику и безопасность, что особенно важно в авиационной и космической технике.

В основе разработки контрольных карт лежат известные законы распределения. Так, по строкам 4 или 5 табл. 10 можно построить доверительный интервал как для математического ожидания по выборочному среднему, так и наоборот – для выборочного среднего по известному математическому ожиданию:

Если в качестве математического ожидания a рассматривать нормативное значение контролируемого параметра технологического процесса (на которое он должен быть настроен), то за соблюдением этой настройки можно будет следить на основании замеров выборочной средней x. Тогда, исходя из заданной доверительной вероятности и величин допуска в меньшую и в большую сторону можно будет отмечать случаи нарушения заданных требований к технологическому процессу.

Если закон распределения не удается подобрать даже приближенно, то используется неравенство Чебышева:

правда, в этом случае необходимо знание дисперсии 2, которую можно оценить дополнительными предварительными исследованиями процесса. Это же может понадобиться и при традиционном построении доверительных интервалов.

Методы оценки основываются на теории точечных оценок (§ 5.3) и предлагают в качестве использовать одно из следующих значений:

где ~, c *, d – поправки на смещение [33].

Собственно контрольная карта представляет собой график изменения контролируемого параметра по времени, на котором заранее нанесены контрольные границы (границы допуска) в соответствии с границами доверительного интервала. На рис. 49 показана для примера контрольная карта средних x.

Контроль заключается в нанесении статистических данных на карту и принятии решения о вмешательстве в технологический процесс. Процесс считается статистически подконтрольным, пока значения x лежат внутри контрольных границ. При выходе x за эти пределы производство следует приостановить для перенастройки или переналадки оборудования.

Подготовительная работа требует для определения границ допуска знания не только, но и объемов выборок для контроля Ni, и доверительной вероятности (или уровня значимости – вероятности ошибки = 1 – ). Кроме того, если используется гипотеза о каком-либо определенном законе распределения, то ее необходимо проверить по критерию Пирсона 2 (§ 5.6).

Для объемов контрольных выборок Ni следует назначать постоянно одно и то же небольшое нечетное число N, например, 5 или 7, что позволит упростить расчеты среднего и определение медианы и размаха.

В качестве доверительной вероятности на практике принимаются "удобные" для применяемого закона распределения числа, например, для нормального закона: 0,9973 (из правила 3), 0,99 или 0,95, а для неравенства Чебышева 0,89 (из правила 3).

Приведем перечень распространенных видов контрольных карт по контролируемым параметрам:

1) карта средних значений " x ";

2) карта индивидуальных значений "xi" – при объеме выборки N = 1 решение принимается после выхода за границы 4 – 6 последовательных значений;

3) карта медиан " ~ " – основывается на приблизительно нормальном расx пределении медианы с математическим ожиданием a и дисперсией 2 ;

4) карта " x /s", являющаяся комбинацией из двух карт: для x и для s, имеющей контрольные границы 5) карта " x /R", являющаяся комбинацией из двух карт: для x и для R, 6) карта " ~ /R", являющаяся комбинацией из двух карт: для ~ и для R, 7) карта "p" – среднего процента брака с контрольными границами в этом случае N необходимо брать достаточно большим, 8) карта "Np" – модификация карты p, 9) карта "c" – дефектов, отказов, распределенных по закону Пуассона, с контрольными границами где c – параметр распределения Пуассона, 10) карта "u" – обобщение карты "c" на процент дефектов, отказов.

Карты 1 – 6 называются контрольными картами по измеримым признакам, карты 7 – 10 – по неизмеримым.

Техника контрольных карт не всегда позволяет обеспечить приемлемый уровень текущего контроля. Это особенно ярко проявляется в сложных наукоемких и дорогостоящих технологических процессах, где практически невозможно отследить все существенные параметры. Кроме того, и сам процесс контроля становится дорогостоящим и высокотехнологичным, если строго следовать технологии контрольных карт.

Поэтому усилия ученых в последние годы сосредоточились на разработке таких статистических методов, которые позволяли бы по минимуму выходных параметров, определяющих потребительские свойства продукции, оптимально с экономической точки зрения осуществлять и контроль, и управление сложным технологическим процессом.

Отечественные ученые разработали ряд методов контроля и управления случайными процессами [2], основной целью которых было обеспечить экономичное обслуживание по состоянию. Следует особо отметить, что все эти математически строгие результаты доведены до алгоритмов, пригодных к практическому использованию. Здесь излагаются два из этих методов, сформулированные в виде теорем.

Один из них пригоден для управления техническим состоянием сложной системы с монотонным показателем ее работоспособности. Рассматривается (t) – случайный монотонно неубывающий во времени t процесс, о развитии которого можно судить по некоторому контролируемому признаку, наблюдаемое значение которого в момент времени tk обозначено xk. Это соответствует обычной технологической практике, когда контрольные мероприятия проводятся через определенные промежутки времени, не обязательно равные. Суммарные затраты на наблюдение и регулировку системы в период ее работоспособности, т.е. пока xk < L (L – пороговое значение, соответствующее отказу) составляют сумму C, а штраф (потери при отказе, т.е. выходе системы за порог отказа, когда xk > L) – величину A.

Если для такого процесса изменение признака xk = xk – xk–1 на очередном интервале времени контроля не зависит от текущего времени, т.е. не зависит от предыстории, и распределено по известному (хотя бы эмпирически) закону: P(xk < z) = F(z), то минимум удельных затрат на контроль и обслуживание достигается при прекращении эксплуатации (для ремонта, замены и т.п.) в момент времени t * 1, когда впервые будет нарушено неравенство:

или, что то же самое, когда впервые выполнится неравенство:

Алгоритм действий при организации управления качеством по такому методу рассмотрим на численном примере, проиллюстрированном на рис. 50. На левом графике приведен эмпирический закон распределения F(z), полученный предварительным сбором статистической информации, по которому с помощью единичного жребия (§ 3.5) можно сымитировать разовое изменение контролируемого признака xk. На правом графике представлено монотонное развитие процесса от состояния полностью исправной системы (признак x = 0) к отказу (признак x = L), характерное для большинства реальных функциональных систем авиационной и космической техники. Видно, как с течением времени контролируемый признак ("дефектность", количество отказавших подсистем и т.п.) стремится к порогу L, за которым система считается отказавшей. Если, как это обычно бывает, затраты на наблюдение и регулировку в процессе нормальной эксплуатации C меньше штрафа при отказе A, то момент времени t* прекращения эксплуатации настанет до того, как контролируемый признак достигнет порогового значения. А это именно та стратегия, которая необходима при эксплуатации по состоянию.

Графики рис. 50 построены по данным расчетной табл. 12 с помощью последовательности случайных чисел (во втором столбце) при заданных значениях: L = 10, C/A = 0,5. Момент времени t* наступает в нашем примере при k = 6, когда второе из приведенных в теореме условий впервые выполняется (см. последние два столбца табл. 12), но пороговое значение контролируемого показателя еще не вышло за предел L = 10, т.е. отказ еще не наступил.

Ступенчатость графика изменения xk по k отображает дискретность профилактических работ, когда на следующий межконтрольный период предполагается постоянство показателя. На самом деле он может расти постоянно и опасность выхода за предельное значение присутствует сразу после k-го момента (с этого момента остаток до отказа L – xk может быть "перекрыт" за один межконтрольный период – см. табл. 12), поэтому именно в этот момент времени систему необходимо снять с эксплуатации и произвести мероприятия по ее обновлению: замену, ремонт, переналадке, настройке и т.п. Однако следует заметить, что приведенный алгоритм имеет математически строгое доказательство, т.е. он гарантирует недостижение отказной ситуации в реальных условиях при соблюдении условий применимости.

Второй рассматриваемый здесь метод весьма перспективен для учета изменения интенсивности отказов, когда она растет у стареющей системы. Пусть интенсивность отказов не постоянна const, (t) 0, т.е. увеличивается со временем по известному (хотя бы эмпирическому) закону: = (t). Обозначим:

T1 – среднее время замены исправной системы, T2 – среднее время замены неисправной системы (обычно на практике T2 > T1 из-за затрат на ликвидацию последствий отказа), T3 – момент времени предупредительной замены системы (пока еще исправной), F() 1 e 0 – вероятность безотказной работы системы в момент времени, p(t, t) – вероятность того, что в момент времени t система исправна и проработает еще в течение времени t, p(t, t) max – критерий оптимальности на всем сроке жизни системы с учетом многократного ее восстановления. Тогда оптимальное T3 определится из нелинейного уравнения:

Приемочный контроль, в отличие от текущего, осуществляется изготовителем (выходной контроль) или потребителем (приемка) по готовой продукции для отбраковки и не имеет непосредственной обратной связи с производством. Если объем продукции велик или она сложна, возникает необходимость по результатам проверки ее части сделать заключение о ее пригодности. Это позволяет сделать выборочный метод, разработанный именно для такого рода задач и предназначенный для получения выводов о свойствах генеральной совокупности по свойствам выборки.

Основой выборочного метода является правильный отбор (§ 5.2) информации. При этом для приемочного контроля используются как однократные, так и многократные выборки. Рассмотрим применение однократных выборок, для которых необходимо определить объем N и приемочное число c – норму браковки. Т.е.

для принятия всей партии из M изделий будем считать необходимым, чтобы в проверяемой выборке объема N число бракованных изделий было меньше c.

Для определения N и c необходимо вспомнить, что при N < M возможны два вида ошибок (когда выборка неверно отражает качество всей партии):

– ошибка I рода, когда по результатам выборочного контроля бракуется годная партия, ее вероятность обозначим, – ошибка II рода, когда по результатам выборочного контроля негодная партия принимается, ее вероятность обозначим.

Поэтому вместо одного критического значения p* доли брака приходится назначать два: p – допускаемый уровень качества, и p – недопустимый уровень качества. Между ними ( p p ) находится область неопределенности, которую необходимо исключить при организации приемочного контроля.

Именно для замены этих двух границ вычисляется приемочное число c.

Из теории вероятностей известно, что если доля брака определяется вероятностью p, то вероятность обнаружения среди N изделий, отобранных из M, ровно k бракованных вычисляется по формуле:

Это гипергеометрическое распределение при больших M и малых p аппроксимируется распределением Пуассона:

Тогда вероятность принятия партии с допускаемым уровнем качества p, т.е. случая, когда в выборке качества p число бракованных изделий не превосходит приемочного числа c, определится суммой:

а вероятность принятия партии с недопустимым уровнем качества p, т.е. случая, когда в выборке качества p число бракованных изделий не превосходит приемочного числа c, определится суммой:

В этих двух уравнениях присутствуют два неизвестных N и c, которые из них и определяются. Таким образом, строится однократная выборка для приемочного контроля качества.

При многократных выборках появляется возможность построить процедуру последовательного анализа для принятия решения, когда на каждом i-м шаге по результатам очередной i-й выборки можно сделать три вывода:

а) в случае числа бракованных изделий k < c i принять партию, б) в случае числа бракованных изделий k > ci забраковать партию, в) в случае c i < k < ci продолжить контроль.

Глава 6. Основы многомерного статистического анализа 6.1. Классификация задач многомерного статистического анализа В предыдущей главе рассматривались методы первичной обработки информации и приемы анализа единственной случайной величины – этот материал иногда называют одномерным статистическим анализом. В этом смысле установление статистических закономерностей, как цель статистического анализа, завершалось решением небольшого круга задач, связанных с оценкой вероятности тех или иных предположений – гипотез о поведении единичных случайных величин. Однако на практике значительно чаще встречаются объекты с двумя и более случайными величинами, и при разработке моделей сложных систем необходимость многомерного статистического анализа становится очевидной. В таких моделях приходится изучать не только характерные особенности отдельных случайных факторов, но и их взаимодействие. При этом возможны различные подходы к выявлению и оценке такого взаимодействия.

Объект исследования можно представить в виде "черного ящика" с "входами" и "выходами" (рис. 51), среди которых различают:

X = (x1, x2,..., xk) – вектор входных контролируемых переменных, которыми можно управлять в исследовании;

Z = (z1, z2,..., zp) – вектор входных контролируемых переменных, которыми невозможно управлять в исследовании;

E = (e1, e2,..., ef) – вектор входных неконтролируемых и неуправляемых переменных (шум);

Y = (y1, y2,..., yg) – вектор выходных переменных.

Переменные X, Z и Y называются факторами. Если фактор принимает фиксированные, детерминированные значения, то они называются уровнями фактора. Факторы Z могут быть случайными. Переменные E тоже случайные, хотя могут и не описываться законами распределения (могут быть не стохастического, не вероятностного вида), но происхождение их не является предметом исследования, они проистекают из-за погрешностей эксперимента или моделирования. Если факторы Z случайны, то и выходные переменные Y необходимо рассматривать как случайные. В частности, такого рода случайности могут проистекать из-за наложения шума E.

Рассмотрим некоторые виды задач многомерного статистического анализа, которые могут возникнуть при изучении сложных многофакторных систем.



Pages:     || 2 | 3 |


Похожие работы:

«Утверждено приказом Министром образования и науки Республики Казахстан от 17 августа 2000 года № 827 Методическое пособие об учете библиотечного фонда библиотек организаций образования Министерства образования и науки Республики Казахстан Настоящее методическое пособие обязательно для применения в библиотеках всех типов организации образовании Республики Казахстан Оно определяет общие правила учета документов, составляющих библиотечный фонд, независимо от статуса библиотеки, структуры ее фонда....»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное автономное образовательное учреждение высшего профессионального образования Уральский федеральный университет имени первого Президента России Б.Н.Ельцина Институт государственного управления и предпринимательства Кафедра государственного и муниципального управления ЗАДАНИЯ ДЛЯ ВЫПОЛНЕНИЯ КОНТРОЛЬНЫХ РАБОТ ДЛЯ СТУДЕНТОВ ЗАОЧНОЙ ФОРМЫ ОБУЧЕНИЯ И МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ К НИМ ЭКОНОМИЧЕСКАЯ ТЕОРИЯ Учебный план...»

«УЧЕБНИК ДЛЯ ВУЗОВ ХРЕСТОМАТИЯ по истории России с древнейших времен до 1618 г. Под редакцией доктора исторических наук, профессора А.Г. Кузьмина; доктора исторических наук С.В. Перевезенцева Рекомендовано Учебно методическим объединением по специальностям педагогического образования в качестве учебного пособия для студентов высших учебных заведений, обучающихся по специальности 032600 История МОСКВА ГУМАНИТАРНЫЙ ИЗДАТЕЛЬСКИЙ ЦЕНТР ВЛАДОС УДК 94(47)”14” ББК 63.3(2) Х Автор предисловия и...»

«Как правильно работать в сфере государственных закупок Методическое пособие СОДЕРЖАНИЕ 02 Предисловие от автора 03 Общее: 03 1.Роли в государственных закупках 04 2. Какой способ закупок применить? 05 2.1.конкурс посредством электронных закупок 06 2.2. аукцион 07 2.3. ценовые предложения 07 2.4. из одного источника 08 2.5. без применения норм закона 08 2.6. специальный/особый порядок 09 3. Участие в государственных закупках отдельных категорий поставщиков 10 4. Демпинг в государственных закупках...»

«Институт стратегического управления социальными системами Бойцов А.А. www.ismss.ru ОТКРЫТЫЙ УНИВЕРСИТЕТ 9 КЛЮЧЕЙ БИЗНЕСА www.ismc-spb.org ПРОГРАММА ДИСТАНЦИОННОГО ОБУЧЕНИЯ Приложение 1 Список литературы Агафонов С. А. Анализ стратегий и разработка комплексных программ. – М.: Экономика. – 1990. 1. Ансофф И. Стратегическое управление. – М.: Экономика. – 1989. 2. Анцупов А.Л., Шипилов А.И. Конфликтология. М., 1999. 3. Армстронг М. Основы менеджмента. М., 1998. 4. Артемов Ю. М. Материальное...»

«DESIGNER’S PRINTING C O M PA N I O N by Heidi Tolliver Nigro National Association for Printing Leadership Paramus, New Jersey КОМПАНЬОН ДИЗАЙНЕРА Хайди Толивер Нигро ТЕХНОЛОГИИ ПЕЧАТИ Рекомендовано Учебно методическим объединением по образованию в области полиграфии и книжного дела в качестве учебного пособия для студентов высших учебных заведений, обучающихся по специальностям в области техники и технологии полиграфии. Москва 2006 Книга Технологии печати — пятое издание, подго товленное ПРИНТ...»

«В. Е. Зюбин ПРОГРАММИРОВАНИЕ ИНФОРМАЦИОННО-УПРАВЛЯЮЩИХ СИСТЕМ НА ОСНОВЕ КОНЕЧНЫХ АВТОМАТОВ http://reflex-language.narod.ru ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Факультет информационных технологий Кафедра информационно-измерительных систем В. Е. Зюбин ПРОГРАММИРОВАНИЕ ИНФОРМАЦИОННО-УПРАВЛЯЮЩИХ СИСТЕМ НА ОСНОВЕ КОНЕЧНЫХ АВТОМАТОВ Учебно-методическое пособие Новосибирск http://reflex-language.narod.ru ББК В185.12 + З- УДК 811.93+62-529+004. З- Зюбин В. Е....»

«О.Л. Гнатюк ОСНОВЫ ТЕОРИИ КОММУНИКАЦИИ Допущено УМО по направлениям педагогического образования в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению 050400 Социально экономическое образование МОСКВА 2010 УДК 316.77(075.8) ББК 60.56я73 Г56 Рецензенты: И.П. Яковлев, проф. кафедры теории коммуникации Санкт Петербургского госу дарственного университета, д р филос. наук, А.В. Соколов, засл. деятель науки РФ, засл. работник культуры России, проф. ка федры...»

«Учреждение образования БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ УТВЕРЖДЕНА Ректором БГТУ, профессором И.М. Жарским 22 марта 2010 г. Регистрационный № УД –273/баз. ХИМИЧЕСКАЯ ТЕХНОЛОГИЯ КЕРАМИКИ И ОГНЕУПОРОВ Учебная программа для специальности 1-48 01 01 Химическая технология неорганических веществ, материалов и изделий для специализаций 1–48 01 01 09 Технология тонкой функциональной и строительной керамики, 1–48 01 01 11 Химическая технология огнеупорных материалов Минск УДК...»

«СМОЛЕНСКИЙ ГУМАНИТАРНЫЙ УНИВЕРСИТЕТ Капиренкова О.Н. Экологическая психология Учебно-методическое пособие (для студентов заочной формы обучения, обучающихся по специальности 030301.65 (020400)-Психология) Смоленск, 2008 1. ПРОГР АММА (СОДЕРЖАНИЕ) УЧЕБНОЙ ДИСЦИПЛИНЫ Разделы курса: Введение в экологическую психологию (экопсихологию). Краткая характеристика основных направлений экологической психологии. Понятие об объекте, предмете и методе экопсихологии. Экологический подход к зрительному...»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ АКАДЕМИЯ АРХИТЕКТУРЫ И ИСКУССТВ ЮЖНОГО ФЕДЕРАЛЬНОГО УНИВЕРСИТЕТА Лишневский А.А. МЕТОДИЧЕСКИЕ УКАЗАНИЯ К КУРСОВОЙ РАБОТЕ Вывеска и витрина дисциплина Дизайнерское проектирование курсовая работа 6, семестр 3. направление подготовки 072500 Дизайн (бакалавриат) профиль подготовки...»

«1. Методические указания по написания контрольной работы В соответствии с планом изучения курса студенты заочного отделения должны выполнить контрольную работу. Кафедра предлагает десять вариантов, из которых студент выбирает один. При подготовке и написании контрольной работы студент изучает и прорабатывает нормативные акты, статьи, монографии, учебные пособия, указанные в данных заданиях, и другие материалы по теме, в том числе опубликованные после подготовки данных заданий. Студентам...»

«Министерство образования и науки Российской Федерации Южно-Уральский государственный университет Юридический факультет Кафедра трудового и социального права Х93.я7 С138 МЕЖДУНАРОДНОЕ ПРАВОВОЕ СОТРУДНИЧЕСТВО В СФЕРЕ ТРУДА Методические указания Челябинск Издательский центр ЮУрГУ 2011 2 ББК Х627.я7 + Х935.я7 С138 Одобрено учебно-методической комиссией юридического факультета Южно-Уральского государственного университета Рецензент: Майоров В.И., доктор юридических наук, профессор, заведующий...»

«Учебный фонд библиотеки Университета машиностроения (ул. Б. Семеновская) Раздел 629.11 Автомобилестроение Учебники: год издания 2005-2014гг. 1. Бахмутов С.В. Колесные транспортные средства: общие характеристики конструкции: учебник для студ. вузов, обуч. по спец. Автомобиле- и тракторостроение (УМО) / С.В. Бахмутов, Н.В. Гусаков.- М., 2012. 220 экз. 2. Балашов В.Н. Технология производства деталей автотракторной техники: учебное пособие для студ. Учреждений среднего проф. Образования (УМО)/...»

«ПРОФЕССИОНАЛЬНЫЙ СОЮЗ РАБОТНИКОВ ЗДРАВООХРАНЕНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ МЕТОДИЧЕСКОЕ ПОСОБИЕ Введение эффективного контракта в государственных (муниципальных) учреждениях здравоохранения Утверждено постановлением Президиума ЦК профсоюза работников здравоохранения Российской Федерации от 13 мая 2014 года № 18-12 Материал подготовлен отделом правовой и социальной защиты аппарата Профсоюза г. Москва Приложение № 1 к постановлению Президиума ЦК Профсоюза от 13 мая 2014 г. № 18-12 Методическое пособие...»

«ИНСТИТУТ КВАНТОВОЙ МЕДИЦИНЫ ПРОИЗВОДСТВЕННО-КОНСТРУКТОРСКОЕ ПРЕДПРИЯТИЕ ГУМАНИТАРНЫХ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ (МИЛТА-ПКП ГИТ) Б.А. Пашков БИОФИЗИЧЕСКИЕ ОСНОВЫ КВАНТОВОЙ МЕДИЦИНЫ Методическое пособие к курсам по квантовой медицине Москва 2004 Б.А. Пашков. Биофизические основы квантовой медицины. /Методическое пособие к курсам по квантовой медицине. Изд. 2-е испр. и дополн.– М.: ЗАО МИЛТАПКП ГИТ, 2004. – 116 с. Кратко описана история развития квантово-волновой теории электромагнитных колебаний....»

«НАЦИОНАЛЬНАЯ АССОЦИАЦИЯ ЦЕНТРОВ ОХРАНЫ ТРУДА Серия: Обучение требованиям охраны труда отдельных категорий застрахованных работников ОХРАНА ТРУДА КУРС ЛЕКЦИЙ для руководителей бюджетных учреждений Москва 2008 УДК 331.45+331.458 (075) О 926 Охрана труда: курс лекций для руководителей бюджетных организаций / д.э.н., профессор А.Л. Сафонов, В.К.Свиридов, д.э.н., профессор Н.П. Пашин, д.т.н., профессор. Г.З. Файнбург, д.т.н., профессор С.С. Тимофеева, к.т.н., профессор Ю.А. Федченко., к.т.н., доцент...»

«Государственное образовательное учреждение Высшего профессионального образования Липецкий государственный технический университет Металлургический институт УТВЕРЖДАЮ Директор металлургического института В.Б. Чупров _2011 г. РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ (МОДУЛЯ) ПОДЪЕМНО-ТРАНСПОРТНЫЕ МАШИНЫ Направление подготовки: 151000 Технологические машины и оборудование Профиль подготовки: Металлургические машины и оборудование Квалификация (степень) выпускника: бакалавр Форма обучения: очная г. Липецк –...»

«МИНОБРАУКИ РОССИИ ФГБОУ ВПО Уральский государственный лесотехнический университет Кафедра истории и социально-политических дисциплин Одобрен: Утверждаю: Кафедрой истории и СПД Декан_факультета Протокол от _ Зав. кафедрой_ В.Д. Шмелев __20 г. Методическая комиссия гуманитарного факультета Протокол от Председатель Е.В. Бородина УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС Дисциплина Психология и педагогика ГСЭ.Ф.03. Специальность: 250401 (260100) Лесоинженерное дело, 250300 (553700) Технология...»

«Учреждение образования БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ БИБЛИОГРАФИЯ Рекомендовано учебно-методическим объединением высших учебных заведений Республики Беларусь по химико-технологическому образованию в качестве пособия для студентов высших учебных заведений, обучающихся по специальности 1-47 01 01 Издательское дело 2-е издание, дополненное и переработанное Минск 2008 УДК 01(075.8) ББК 78.5я73 Б 59 Автор-составитель З. М. Клецкая Р е ц е н з е н т ы: доцент кафедры русской...»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.