clean-tool.ru

Планирование экспериментального исследования. Экспериментальная психология: конспект лекций

1 Планы для одной независимой переменной

План «истинного» экспериментального исследования отличается от других следующими важнейшими признаками:

1) применением одной из стратегий создания эквивалентных групп, чаще всего - рандомизации;

2) наличием экспериментальной и, как минимум, одной контрольной группы;

3) завершением эксперимента тестированием и сравнением поведения группы, получившей экспериментальное воздействие (X1), с группой, не получившей воздействия Х0.

Классическим вариантом плана является план для 2 независимых групп. В психологии планирование эксперимента начинает применяться с первых десятилетий XXв.

Существуют три основные версии этого плана. При их описании будем пользоваться символизацией, предложенной Кэмпбеллом.

Таблица 5.1

Здесь R- рандомизация, Х- воздействие, О1 - тестирование первой группы, О2 - тестирование второй группы.

1) План для двух рандомизированных групп с тестированием после воздействия. Его автор - известный биолог и статистик Р. А. Фишер . Структура плана показана в табл. 5.1.

Равенство экспериментальной и контрольной групп является совершенно необходимым условием применения этого плана. Чаще всего для достижения эквивалентности групп применяют процедуру рандомизации (см. гл. 4). Этот план рекомендуют использовать в том случае, когда нет возможности или необходимости проводить предварительное тестирование испытуемых. Если рандомизация проведена качественно, то этот план является наилучшим, позволяет контролировать большинство источников артефактов; кроме того, для него применимы различные варианты дисперсионного анализа.

После проведения рандомизации или иной процедуры уравнивания групп осуществляется экспериментальное воздействие. В простейшем варианте используется лишь две градации независимой переменной: есть воздействие, нет воздействия.

Если необходимо использовать не 1 уровень воздействия, то применяются планы с несколькими экспериментальными группами (по числу уровней воздействия) и одной контрольной.

Если же нужно контролировать влияние одной из дополнительных переменных, то применяют план с 2 контрольными группами и 1-й экспериментальной. Измерение поведения дает материал для сравнения 2 групп. Обработка данных сводится к применению традиционных для математической статистики оценок. Рассмотрим случай, когда измерение проводится интервальной шкалой. Для оценки различия в средних показателях групп используют t-критерий Стьюдента. Оценивание различий в вариации измеряемого параметра между экспериментальной и контрольной группами проводится с помощью критерия F. Соответствующие процедуры подробно рассмотрены в учебниках математической статистики для психологов.


Применение плана для 2 рандомизированных групп с тестированием после воздействия позволяет контролировать основные источники внутренней невалидности (как их определяет Кэмпбелл). Поскольку предварительное тестирование отсутствует, исключен эффект взаимодействия процедуры тестирования и содержания экспериментального воздействия и сам эффект тестирования. План позволяет контролировать влияние состава групп, стихийного выбывания, влияние фона и естественного развития, взаимодействие состава группы с другими факторами, позволяет также исключить эффект регрессии за счет рандомизации и сравнения данных экспериментальной и контрольной групп. Однако при проведении большинства педагогических и социально-психологических экспериментов необходимо жестко контролировать исходный уровень зависимой переменной, будь то интеллект, тревожность, знания или статус личности в группе. Рандомизация - лучшая процедура из возможных, но она не дает абсолютной гарантии правильности выбора. Когда существуют сомнения в результатах рандомизации, применяют план с предварительным тестированием.

Таблица 5.2

2) План для двух рандомизированных групп с предварительным и итоговым тестированием. Рассмотрим структуру этого плана (табл. 5.2).

План с предварительным тестированием пользуется популярностью у психологов. Биологи больше доверяют процедуре рандомизации. Психолог прекрасно знает, что каждый человек своеобразен и отличен от других, и подсознательно стремится уловить эти различия с помощью тестов, не доверяя механической процедуре рандомизации. Однако гипотеза большинства психологических исследований, особенно в области психологии развития («формирующий эксперимент»), содержит прогноз определенного изменения свойства индивида под влиянием внешнего фактора. Поэтому план «тест-воздействие-ретест» с применением рандомизации и контрольной группой очень распространен.

При отсутствии процедуры уравнивания групп этот план преобразуется в квазиэкспериментальный (он будет рассмотрен в разделе 5.2).

Главный источник артефактов, нарушающий внешнюю валидность процедуры, - взаимодействие тестирования с экспериментальным воздействием. Например, тестирование уровня знаний по определенному предмету перед проведением эксперимента по заучиванию материала может привести к актуализации исходных знаний и к общему повышению продуктивности запоминания. Достигается это за счет актуализации мнемонических способностей и создания установки на запоминание.

Однако с помощью этого плана можно контролировать другие внешние перемен-ные. Контролируется фактор «истории» («фона»), так как в промежутке между первым и вторым тестированием обе группы подвергаются одинаковым («фоновым») воздействиям. Вместе с тем Кэмпбелл отмечает необходимость контроля «внутригрупповых событий», а также эффекта неодновременности тестирования в обеих группах. В реальности невозможно добиться, чтобы тест и ретест проводились в них одновременно. План превращается в квазиэкспериментальный, например:

Обычно контроль неодновременности тестирования осуществляют два экспериментатора, проводящие тестирование двух групп одновременно. Оптимальной считается процедура рандомизации порядка тестирования: тестирование членов экспериментальной и контрольной групп производится в случайном порядке. То же самое делается и с предъявлением - не предъявлением экспериментального воздействия. Разумеется, такая процедура требует наличия значительного числа испытуемых в экспериментальной и контрольной выборках (не менее 30-35 человек в каждой).

Естественное развитие и эффект тестирования контролируются за счет того, что они одинаково проявляются в экспериментальной и контрольной группах, а эффекты состава групп и регрессии [Кэмпбелл, 1980] контролируются при помощи процедуры рандомизации.

Результаты применения плана «тест-воздействие-ретест» представлены в таблице.

При обработке данных обычно используются параметрические критерии t и F (для данных в интервальной шкале). Вычисляются три значения t: сравнение 1) О1 и О2 ; 2) О3 и О4; 3) О2 и О4. Гипотезу о значимом влиянии независимой переменной на зависимую можно принять в том случае, если выполняются два условия: а) различия между О1 и О2 значимы, а между О3 и О4 - незначимы и б) различия между О2 и О4 значимы. Гораздо удобнее сравнивать не абсолютные значения, а величины прироста показателей от первого тестирования ко второму (δ(i)). Вычисляются δ(i12) и δ(i34) и сравниваются по t-критерию Стьюдента. В случае значимости различий принимается экспериментальная гипотеза о влиянии независимой переменной на зависимую (табл. 5.3).

Рекомендуется также применять ковариационный анализ по Фишеру. При этом показатели предварительного тестирования берутся в качестве дополнительной переменной, а испытуемые разбиваются на подгруппы в зависимости от показателей предварительного тестирования. Тем самым получается следующая таблица для обработки данных по методу MANOVA (табл. 5.4).

Применение плана «тест-воздействие-ретест» позволяет контролировать влияние «побочных» переменных, нарушающих внутреннюю валидность эксперимента.

Внешняя валидность связана с возможностью переноса данных на реальную ситуацию. Главным же моментом, отличающим экспериментальную ситуацию от реальной, является введение предварительного тестирования. Как мы уже отметили, план «тест-воздействие-ретест» не позволяет контролировать эффект взаимодействия тестирования и экспериментального воздействия: предварительно тестируемый испытуемый «сенсибилизируется» - становится более чувствительным к воздействию, так как мы измеряем в эксперименте именно ту зависимую переменную, на которую собираемся воздействовать с помощью варьирования независимой переменной.

Таблица 5.5

Для контроля внешней валидности используется план Р. Л. Соломона, который был предложен им в 1949 г.

3) План Соломона используется при проведении эксперимента на четырех группах:

1. Эксперимент1: R О1 Х О2

2. Контроль 1: R О3 О4

3. Эксперимент 2: R X О5

4. Контроль 2: R О6

План включает исследование двух экспериментальных и двух контрольных групп и по сути является мультигрупповым (типа 2 х 2), но для удобства изложения он рассматривается в этом разделе.

План Соломона представляет собой объединение двух ранее рассмотренных планов: первого, когда не производится предварительное тестирование, и второго - «тест-воздействие-ретест». С помощью «первой части» плана можно контролировать эффект взаимодействия первого тестирования и экспериментального воздействия. Соломон с помощью своего плана выявляет эффект экспериментального воздействия четырьмя разными способами: при сравнении 1) О2 - О1 ; 2) О2 - О4 ; 3) О5 - О6 и 4) О5 - О3 .

Если провести сравнение О6 с О1 и О3, то можно выявить совместное влияние эффектов естественного развития и «истории» (фоновых воздействий) на зависимую переменную.

Кэмпбелл, критикуя предложенные Соломоном схемы обработки данных, предлагает не обращать внимания на предварительное тестирование и свести данные к схеме 2 х 2, пригодной для применения дисперсионного анализа (табл. 5.5).

Сравнение средних по столбцам позволяет выявлять эффект экспериментального воздействия - влияние независимой переменной на зависимую. Средние по строкам показывают эффект предварительного тестирования. Сравнение средних по ячейкам характеризует взаимодействие эффекта тестирования и экспериментального воздействия, что свидетельствует о мере нарушения внешней валидности.

В том случае, когда эффектами предварительного тестирования и взаимодействия можно пренебречь, переходят к сопоставлению О4 и О2 методом ковариационного анализа. В качестве дополнительной переменной берутся данные предварительного тестирования по схеме, приведенной для плана «тест-воздействие-ретест».

Наконец, в некоторых случаях необходимо проверить сохранение во времени эф-фекта воздействия независимой переменной на зависимую: например, выяснить, приводит ли новый метод обучения к долгосрочному запоминанию материала Для этих целей применяют следующий план:

1 Эксперимент 1 R О1 Х О2

2 Контроль 1 R О3 О4

3 Эксперимент 2 R О5 Х О6

4 Контроль 2 R О7 О8

2. Планы для одной независимой переменной и нескольких групп

Иногда сравнения двух групп недостаточно для подтверждения или опровержения экспериментальной гипотезы. Такая проблема возникает в двух случаях: а) при необходимости контроля внешних переменных; б) при необходимости выявления количественных зависимостей между двумя переменными.

Для контроля внешних переменных используются различные варианты факторного экспериментального плана. Что касается выявления количественной зависимости между двумя переменными, то необходимость ее установления возникает при проверке «точной» экспериментальной гипотезы. В эксперименте с участием двух групп в лучшем случае можно установить факт причинной связи между независимой и зависимой переменными. Но между двумя точками можно провести бесконечное множество кривых. Для того чтобы убедиться в наличии линейной зависимости между двумя переменными, следует иметь хотя бы три точки, соответствующие трем уровням независимой переменной. Следовательно, экспериментатор должен выделить несколько рандомизированных групп и поставить их в различные экспериментальные условия. Простейшим вариантом является план для трех групп и трех уровней независимой переменной:

Эксперимент 1: R Х1 О1

Эксперимент 2: R Х2 О2

Контроль: R О3

Контрольная группа в данном случае - это третья экспериментальная группа, для которой уровень переменной Х = 0.

При реализации этого плана каждой группе предъявляется лишь один уровень независимой переменной. Возможно и увеличение числа экспериментальных групп соответственно числу уровней независимой переменной. Для обработки данных, полученных с помощью такого плана, применяются те же статистические методы, что были перечислены выше.

Простые «системные экспериментальные планы», как ни удивительно, очень редко используются в современных экспериментальных исследованиях. Может быть, исследователи «стесняются» выдвигать простые гипотезы, помня о «сложности и многомерности» психической реальности? Тяготение к использованию планов с многими независимыми переменными, более того - к проведению многомерных экспериментов, не обязательно способствует лучшему объяснению причин человеческого поведения. Как известно, «умный поражает глубиной идеи, а дурак - размахом строительства». Лучше предпочесть простое объяснение любому сложному, хотя регрессионные уравнения, где все всему равняется, и запутанные корреляционные графы могут произвести впечатление на некоторые диссертационные советы.

3 Факторные планы

Факторные эксперименты применяются тогда, когда необходимо проверить сложные гипотезы о взаимосвязях между переменными. Общий вид подобной гипотезы: «Если А1, А2,..., Аn, то В». Такие гипотезы называются комплексными, комбинированными и др. При этом между независимыми переменными могут быть различные отношения: конъюнкции, дизъюнкции, линейной независимости, аддитивные или мультипликативные и др. Факторные эксперименты являются частным случаем многомерного исследования, в ходе проведения которого пытаются установить отношения между несколькими независимыми и несколькими зависимыми переменными. В факторном эксперименте проверяются одновременно, как правило, два типа гипотез:

1) гипотезы о раздельном влиянии каждой из независимых переменных;

2) гипотезы о взаимодействии переменных, а именно - как присутствие одной из независимых переменных влияет на эффект воздействия на другой.

Факторный эксперимент строится по факторному плану. Факторное планирование эксперимента заключается в том, чтобы все уровни независимых переменных сочетались друг с другом. Число экспериментальных групп равно числу сочетаний уровней всех независимых переменных.

Сегодня факторные планы наиболее распространены в психологии, поскольку простые зависимости между двумя переменными в ней практически не встречаются.

Существует множество вариантов факторных планов, но на практике применяются далеко не все. Чаще всего используются факторные планы для двух независимых переменных и двух уровней типа 2х2. Для составления плана применяется принцип балансировки. План 2х2 используется для выявления эффекта воздействия двух независимых переменных на одну зависимую. Экспериментатор манипулирует возможными сочетаниями переменных и уровней. Данные приведены в простейшей таблице (табл. 5.6).

Реже используются четыре независимые рандомизированные группы. Для обработки результатов применяется дисперсионный анализ по Фишеру.

Так же редко используются другие версии факторного плана, а именно: 3х2 или 3х3. План 3х2 применяется в тех случаях, когда нужно установить вид зависимости одной зависимой переменной от одной независимой, а одна из независимых переменных представлена дихотомическим параметром. Пример такого плана - эксперимент по выявлению воздействия внешнего наблюдения на успех решения интеллектуальных задач. Первая независимая переменная варьируется просто: есть наблюдатель, нет наблюдателя. Вторая независимая переменная - уровни трудности задачи. В этом случае мы получаем план 3х2 (табл. 5.7).

Вариант плана 3х3 применяется в том случае, если обе независимые переменные имеют несколько уровней и есть возможность выявить виды связи зависимой переменной от независимых. Этот план позволяет выявлять влияние подкрепления на успешность выполнения задании разной трудности (табл. 5.8).

В общем случае план для двух независимых переменных выглядит как N х М. Применимость таких планов ограничивается только необходимостью набора большого числа рандомизированных групп. Объем экспериментальной работы чрезмерно возрастает с добавлением каждого уровня любой независимой переменной.

Планы, используемые для исследования влияния более двух независимых переменных, применяются редко. Для трех переменных они имеют общий вид L х М х N.

Чаще всего применяются планы 2х2х2: «три независимые переменные - два уровня». Очевидно, добавление каждой новой переменной увеличивает число групп. Общее их число 2, где п - число переменных в случае двух уровней интенсивности и К - в случае К-уровневой интенсивности (считаем, что число уровней одинаково для всех независимых переменных). Примером этого плана может быть развитие предыдущего. В случае, когда нас интересует успешность выполнения экспериментальной серии заданий, зависящая не только от общей стимуляции, которая производится в форме наказания - удара током, но и от соотношения поощрения и нака-зания, мы применяем план 3х3х3.

Упрощением полного плана с тремя независимыми переменными вида L х М х N является планирование по методу «латинского квадрата». «Латинский квадрат» применяют тогда, когда нужно исследовать одновременное влияние трех переменных, имеющих два уровня или более. Принцип «латинского квадрата» состоит в том, что два уровня разных переменных встречаются в экспериментальном плане только один раз. Тем самым процедура значительно упрощается, не говоря о том, что экспериментатор избавляется от необходимости работать с огромными выборками.

Предположим, что у нас есть три независимые переменные, с тремя уровнями каждая:

План по методу «латинского квадрата» представлен в табл. 5.9.

Такой же прием используется для контроля внешних переменных (контрбалан-сировка). Нетрудно заметить, что уровни третьей переменной N (А, В, С,) встречаются в каждой строке и в каждой колонке по одному разу. Комбинируя результаты по строкам, столбцам и уровням, можно выявить влияние каждой из независимых переменных на зависимую, а также степень попарного взаимодействия переменных.

«Латинский квадрат» позволяет значительно сократить число групп. В частности, план 2х2х2 превращается в простую таблицу (табл. 5.10).

Применение латинских букв в клеточках для обозначения уровней 3-й переменной (А - есть, В - нет) традиционно, поэтому метод назван «латинский квадрат».

Более сложный план по методу «греко-латинского квадрата» применяется очень редко. С его помощью можно исследовать влияние на зависимую переменную четырех независимых. Суть его в следующем: к каждой латинской группе плана с тремя переменными присоединяется греческая буква, обозначающая уровни четвертой переменной.

Рассмотрим пример. У нас четыре переменные, каждая из которых имеет три уровня интенсивности. План по методу «греко-латинского квадрата» примет такой вид (табл. 5.11).

Для обработки данных применяется метод дисперсионного анализа по Фишеру. Методы «латинского» и «греко-латинского» квадрата пришли в психологию из агробиологии, но большого распространения не получили. Исключением являются некоторые эксперименты в психофизике и психологии восприятия.

Главная проблема, которую удается решить в факторном эксперименте и невозможно решить, применяя несколько обычных экспериментов с одной независимой переменной, - определение взаимодействия двух переменных.

Рассмотрим возможные результаты простейшего факторного эксперимента 2х2 с позиций взаимодействий переменных. Для этого нам надо представить результаты опытов на графике, где по оси абсцисс отложены значения первой независимой переменной, а по оси ординат - значения зависимой переменной. Каждая из двух прямых, соединяющих значения зависимой переменной при разных значениях первой независимой переменной (А), характеризует один из уровней второй независимой переменной (В). Применим для простоты результаты не экспериментального, а корреляционного исследования. Условимся, что мы исследовали зависимость статуса ребенка в группе от состояния его здоровья и уровня интеллекта. Рассмотрим варианты возможных отношений между переменными.

Первый вариант: прямые параллельны - взаимодействия переменных нет (рис. 5.1).

Больные дети имеют более низкий статус, чем здоровые, независимо от уровня интеллекта. Интеллектуалы имеют всегда более высокий статус (независимо от здоровья).

Второй вариант: физическое здоровье при наличии высокого уровня интеллекта увеличивает шанс получить более высокий статус в группе(рис 5.2).

В этом случае получен эффект расходящегося взаимодействия двух независимых переменных. Вторая переменная усиливает влияние первой на зависимую переменную.

Третий вариант: сходящееся взаимодействие - физическое здоровье уменьшает шанс интеллектуала приобрести более высокий статус в группе. Переменная «здоровье» уменьшает влияние переменной «интеллект» на зависимую переменную. Есть и другие случаи этого варианта взаимодействия:

переменные взаимодействуют так, что увеличение значения первой приводит к уменьшению влияния второй с изменением знака зависимости (рис. 5.3).

У больных детей, обладающих высоким уровнем интеллекта, меньше шанс получить высокий статус, чем у больных детей с низким интеллектом, а у здоровых - связь интеллекта и статуса позитивная.

Теоретически возможно представить, что больные дети будут иметь больший шанс получить высокий статус при высоком уровне интеллекта, чем их здоровые низкоинтеллектуальные сверстники.

Последний, четвертый, возможный вариант наблюдаемых в исследованиях отношений между независимыми переменными: случай, когда между ними существует пересекающееся взаимодействие, представленное на последнем графике (рис. 5.4).

Итак, возможны следующие взаимодействия переменных: нулевое; расходящееся (с различными знаками зависимости); пересекающееся.

Оценка величины взаимодействия проводится с помощью дисперсионного анализа, а t-критерий Стьюдента используется для оценки значимости различий групповых X.

Во всех рассмотренных вариантах планирования эксперимента применяется способ балансировки: различные группы испытуемых ставятся в разные экспериментальные условия. Процедура уравнивания состава групп позволяет производить сравнение результатов.

Однако во многих случаях требуется планировать эксперимент так, чтобы все его участники получили все варианты воздействия независимых переменных. Тогда на помощь приходит техника контрбалансировки.

Планы, в которых воплощается стратегия «все испытуемые - все воздействия», Мак-Колл называет ротационными экспериментами, а Кэмпбелл - «сбалансированными планами». Чтобы не было путаницы между понятиями «балансировка» и «контрбалансировка», будем использовать термин «ротационный план».

Ротационные планы строятся по методу «латинского квадрата», но, в отличие от рассмотренного выше примера, по строкам обозначены группы испытуемых, а не уровни переменной, по столбцам - уровни воздействия первой независимой переменной (или переменных), в клеточках таблицы - уровни воздействия второй независимой переменной.

Пример экспериментального плана для 3 групп (А, B, С) и 2 независимых переменных (X,Y) с 3 уровнями интенсивности (1-й, 2-й, 3-й) приводим ниже. Нетрудно заметить, что этот план можно переписать и так, чтобы в клеточках стояли уровни переменной Y (табл. 5.12).

Кэмпбелл включает этот план в число квазиэкспериментальных на основании того, что неизвестно, контролируется ли с его помощью внешняя валидность. Действительно, вряд ли в реальной жизни испытуемый может получить серию таких воздействий, как в эксперименте.

Что касается взаимодействия состава групп с другими внешними переменными, источниками артефактов, то рандомизация групп, согласно утверждению Кэмпбелла, должна минимизировать влияние этого фактора.

Суммы по столбцам в ротационном плане свидетельствуют о различиях в уровне эффекта при разных значениях одной независимой переменной (X или Y), а суммы по строкам должны характеризовать различия между группами. Если группы рандомизированы удачно, то межгрупповых различий быть не должно. Если же состав группы является дополнительной переменной, возникает возможность ее проконтролировать. Схема контрбалансировки не позволяет избежать эффекта тренировки, хотя данные многочисленных экспериментов с применением «латинского квадрата» не позволяют делать такой вывод.

Подводя итог рассмотрению различных вариантов экспериментальных планов, предлагаем их классификацию. Экспериментальные планы различаются по таким основаниям:

1. Число независимых переменных: одна или больше. В зависимости от их числа применяется либо простой, либо факторный план.

2. Число уровней независимых переменных: при 2 уровнях речь идет об установлении качественной связи, при 3 и более - количественной связи.

3. Кто получает воздействие. Если применяется схема «каждой группе - своя комбинация», то речь идет о межгрупповом плане. Если же применяется схема «все группы - все воздействия», то речь идет о ротационном плане. Готтсданкер называет его кросс-индивидуальным сравнением.

Схема планирования эксперимента может быть гомогенной или гетерогенной (в зависимости от того, равно или не равно число независимых переменных числу уровней их изменения).

4 Планы экспериментов для одного испытуемого

Эксперименты на выборках с контролем переменных - ситуация, которую широкого стали использовать в психологии с 1910-1920-х гг. Особое распространение экспериментальные исследования на уравненных группах получили после создания выдающимся биологом и математиком Р. А. Фишером теории планирования экспериментов и обработки их результатов (дисперсионный и ковариационный анализы). Но психологи применяли эксперимент задолго до появления теории планирования исследования выборок. Первые экспериментальные исследования проводились с участием одного испытуемого - им являлся сам экспериментатор либо его ассистент. Начиная с Г. Фехнера (1860), в психологию пришла техника экспериментирования для проверки теоретических количественных гипотез.

Классическим экспериментальным исследованием одного испытуемого стала работа Г. Эббингауза, которая была проведена в 1913 г. Эббингауз исследовал явление забывания с помощью заучивания бессмысленных слогов (изобретенных им же). Он заучивал серию слогов, а затем пытался их воспроизвести через определенное время. В итоге была получена классическая кривая забывания: зависимость объема сохраненного материала от времени, прошедшего с момента заучивания (рис. 5.5).

В эмпирической научной психологии взаимодействуют и борются три исследовательские парадигмы. Представители одной из них, традиционно идущей от естественнонаучного эксперимента, считают единственно достоверным знанием только то, которое добывается в экспериментах на эквивалентных и репрезентативных выборках. Основной аргумент сторонников этой позиции - необходимость контроля внешних переменных и нивелирования индивидуальных различий для нахождения общих закономерностей.

Представители методологии «экспериментального анализа поведения» критикуют сторонников статистического анализа и планирования экспериментов на выборках. По их мнению, нужно проводить исследования с участием одного испытуемого и с применением определенных стратегий, которые позволят в ходе эксперимента редуцировать источники артефактов. Сторонниками этой методологии являются такие известные исследователи, как Б. Ф. Скиннер, Г. А. Мюррейидр.

Наконец, классическое идиографическое исследование противопоставляется как экспериментам с участием одного испытуемого, так и планам, изучающим поведение в репрезентативных выборках. Идиографическое исследование предусматривает изучение индивидуальных случаев: биографий или особенностей поведения отдельных людей. Примером являются замечательные работы Лурии «Потерянный и возвращенный мир» и «Маленькая книжка о большой памяти».

Во многих случаях исследования, проводимые с участием одного испытуемого, являются единственно возможным вариантом. Методология исследования одного испытуемого разрабатывалась в 1970-1980-е гг. многими авторами: А. Кезданом, Т. Кратохвиллом, Б. Ф. Скиннером, Ф.-Дж. МакГиганом и др.

В ходе эксперимента выявляются два источника артефактов: а) ошибки в стратегии планирования и в проведении исследования; б) индивидуальные различия.

Если создать «правильную» стратегию проведения эксперимента с одним испытуемым, то вся проблема сведется лишь к учету индивидуальных различий. Эксперимент с одним испытуемым возможен тогда, когда: а) индивидуальными различиями можно пренебречь в отношении переменных, изучаемых в эксперименте, все испытуемые признаются эквивалентными, поэтому возможен перенос данных на каждого члена популяции; б) испытуемый уникален, и проблема прямого переноса данных неактуальна.

Стратегия экспериментирования с одним испытуемым разработана Скиннером для исследования процесса обучения. Данные в ходе исследования представляются в форме «кривых обучения» в системе координат «время» - «общее число ответов» (кумулятивная кривая). Кривая обучения первоначально анализируется визуально; рассматриваются ее изменения во времени. Если функция, описывающая кривую, изменяется при изменении воздействия А на В, то это может свидетельствовать о наличии причинной зависимости поведения от внешних воздействий (А или В).

Исследование по схеме «один испытуемый» (single-subject research) называется также планированием временных серий. Основным показателем влияния независимой переменной на зависимую при реализации такого плана является изменение характера ответов испытуемого от воздействия на него изменения условий эксперимента во времени. Существует ряд основных схем применения этой парадигмы. Простейшая стратегия - схема А-В. Испытуемый первоначально выполняет деятельность в условиях А, а затем - в условиях В (см. рис. 5.8).

При использовании этого плана возникает закономерный вопрос: а сохранила бы кривая ответов прежний вид, если бы не было воздействия? Проще говоря, эта схема не контролирует эффект плацебо. Кроме того, неясно, что привело к эффекту: может быть, воздействие оказала не переменная В, а какая-либо иная переменная, не учтенная в эксперименте.

Поэтому чаще применяется другая схема: А-В-А. Первоначально регистрируется поведение испытуемого в условиях А, затем условия изменяются (В), а на третьем этапе происходит возвращение прежних условий (А). Изучается изменение функциональной связи между независимой и зависимой переменными. Если при изменении условий на третьем этапе восстанавливается прежний вид функциональной зависимости между зависимой и зависимой переменными, то независимая переменная считается причиной, которая может модифицировать поведение исп ытуемого (рис. 5.9).

Однако и первый, и второй варианты планирования временных серий не позволяют учесть фактор кумуляции воздействий. Возможно, к эффекту приводит сочетание - последовательность условий (А и В). Неочевидно и то, что после возврата к ситуации В кривая примет тот же вид, каким он был при первом предъявлении условий В.

Примером плана, который дважды воспроизводит один и тот же экспериментальный эффект, является схема А-В-А-В. Если при 2-м переходе от условий А к условиям В будет воспроизведено изменение функциональной зависимости ответов испытуемого от времени, то это станет доказательством экспериментальной гипотезы: независимая переменная (А, В) влияет на поведение испытуемого.

Рассмотрим простейший случай. В качестве зависимой переменной выберем общий объем знаний студента. В качестве независимой - занятия физкультурой по утрам (например, гимнастикой ушу). Предположим, что комплекс ушу благоприятно влияет на общее психическое состояние студента и способствует лучшему запоминанию (рис. 5.10).

Очевидно, что занятие гимнастикой благоприятно отразилось на обучаемости.

Существуют различные варианты планирования по методу временных серий. Различают схемы регулярного чередования серий (АВ-АВ), серии стохастических последовательностей и схемы позиционного уравнивания (пример: АВВА). Модификациями схемы А-В-А-В являются схема А-В-А-В-А или более длительная: А- В- А- В- А- В- А.

Применение более «длинных» временных планов увеличивает гарантию обнаружения эффекта, но приводит к утомлению испытуемого и другим кумулятивным эффектам.

Кроме того, план А-В-А-В и его различные модификации не снимают три важнейшие проблемы:

1. Что было бы с испытуемым, если бы никакого воздействия не было (эффект плацебо)?

2. Не является ли последовательность воздействий А-В сама по себе еще одним воздействием (побочной переменной)?

3. Какая причина привела к эффекту: если на месте В не было бы воздействия, повторился бы эффект?

Для контроля эффекта плацебо в серию А-В-А-В включают условия, «имитирующие» либо воздействие А, либо воздействие В. Рассмотрим решение последней проблемы. Но сначала проанализируем такой случай: допустим, студент постоянно занимается ушу. Но периодически на стадионе или в спортивном зале появляется симпатичная девушка (просто зритель) - воздействие В. План А- В- А- В выявил повышение эффективности учебных занятий студента в периоды появления переменной В. Что является причиной: присутствие зрителя как такового или конкретной симпатичной девушки? Для проверки гипотезы о наличии конкретной причины эксперимент строится по следующей схеме: А-В-А-С-А. Например, в четвертый временной период на стадион приходит другая девушка или скучающий пенсионер. Если эффективность занятий значительно снизится (не та мотивация), то это будет свидетельствовать о конкретной причине ухудшения обучаемости. Возможен и вариант проверки воздействия условия А (занятия ушу без зрителей). Для этого надо применить план А-В-С-В. Пусть студент какое-то время в отсутствие девушки прекратит занятия. Если же повторное появление ее на стадионе приведет к тому же эффекту, что и в первый раз, то причина повышения успеваемости - в ней, а не только в занятиях ушу (рис. 5.11).

Прошу не принимать пример всерьез. В действительности происходит как раз все наоборот: увлечение девушками резко снижает успеваемость студентов.

Существует множество приемов проведения исследований с участием одного испытуемого. Примером развития плана А-В является «план альтернативных воздействий». Воздействия А и В рандомизированно распределяются во времени, например по дням недели, если речь идет о разных способах избавления от курения. Затем определяются все моменты, когда было воздействие А; строится кривая, соединяющая соответствующие последовательные точки. Выделяются все моменты времени, когда было «альтернативное» воздействие В, и в порядке следования во времени также соединяются; строится вторая кривая. Затем сравниваются обе кривые и выявляется, какое воздействие более эффективно. Эффективность определяется по величине роста или падения кривой (рис. 5.12).

Синонимами термина «план альтернативных воздействий» являются: «план сравнения серий», «план синхронизированных воздействий», «план множественных расписаний» и т.д.

Другой вариант - реверсивный план. Он применяется для исследования двух альтернативных форм поведения. Первоначально регистрируется базовый уровень проявления обеих форм поведения. Первое поведение может актуализироваться с помощью специфического воздействия, а второе, несовместимое с ним, провоцируется одновременно другим типом воздействия. Эффект двух воздействий оценивается. Через определенное время сочетание воздействий реверсируется так, что первая форма поведения получает воздействие, которое инициировало вторую форму поведения, а вторая - воздействие, релевантное первой форме поведения. Такой план используется, например, при исследовании поведения маленьких детей (рис.5.13).

В психологии обучения применяют метод смены критериев, или «план возрастания критериев». Суть его состоит в том, что регистрируется изменение поведения испытуемого в ответ на прирост (фазы) воздействия. Увеличение регистрируемого параметра поведения фиксируется, и следующее воздействие осуществляется лишь после выхода испытуемого на заданный уровень критерия. После стабилизации уровня исполнения испытуемому предъявляют следующую градацию воздействия. Кривая успешного эксперимента (подтверждающего гипотезу) напоминает сбитую каблуками лестницу, где начало ступени совпадает с началом уровня воздействия, а конец ее - с выходом испытуемого на очередной критерий.

Способом, позволяющим нивелировать «эффект последовательности», является инверсия последовательности воздействий - план А-В-В-А. Эффекты последовательности связаны с влиянием предшествующего воздействия на последующее (иное название - эффекты порядка, или эффекты переноса). Перенос может быть положительным или отрицательным, симметричным или асимметричным. Последовательность А-В-В-А называется позиционно уравненной схемой. Как отмечает Готтсданкер, воздействие переменных А и В обусловлено эффектами раннего или позднего переноса. Воздействие А связано с поздним переносом, а В - с ранним. Кроме того, если присутствует кумулятивный эффект, то два идущих подряд воздействия В могут влиять на субъекта как единое суммарное воздействие. Эксперимент может быть удачным лишь в том случае, если эти эффекты незначительны. Рассмотренные выше варианты планов с регулярным чередованием или со случайными последовательностями чаще всего очень длинны, поэтому их трудно реализовать.

Если подвести краткий итог, можно сказать, что схемы предъявления воздействия применяются в зависимости от возможностей, которые есть у экспериментатора.

Случайная последовательность воздействий получается путем рандомизации заданий. Ее применяют в экспериментах, требующих большого числа проб. Случайное чередование воздействий гарантирует от проявления эффектов последовательности.

При малом числе проб рекомендуется схема регулярного чередования типа А- В-А-В. Следует обратить внимание на периодичность фоновых воздействий, которые могут совпадать с действием независимой переменной. Например, если давать один тест на интеллект утром, а второй - всегда вечером, то под влиянием утомления эффективность выполнения второго теста будет понижаться.

Позиционно уравненная последовательность может быть пригодна лишь тогда, когда число воздействий (заданий) мало и влияние раннего и позднего переноса несущественно.

Но ни одна из схем не исключает проявления дифференцированного асимметричного переноса, когда влияние предшествующего воздействия А на эффект от воздействия В больше, чем влияние предшествующего воздействия В на эффект от воздействия А (или же наоборот).

Разнообразные варианты планов для одного испытуемого обобщили Д. Барлоу и М. Херсен в монографии «Экспериментальные планы для единичных случаев» (Single case experimental designs, 1984)(табл. 5.13).

Таблица 5.13

Основные артефакты в исследовании на одном испытуемом практически неустранимы. Трудно представить, как можно устранить эффекты, связанные с необратимостью событий. Если эффекты порядка или взаимодействия переменных в какой-то мере поддаются контролю, то уже упомянутый эффект асимметричности (дифференцированного переноса) неустраним.

Не меньше проблем возникает и при установлении изначального уровня интенсивности регистрируемого поведения (уровня зависимой переменной). Исходный уровень агрессивности, который мы зарегистрировали у ребенка в лабораторном эксперименте, может быть нетипичным для него, поскольку вызван недавними предшествующими событиями, например ссорой в семье, подавлением его активности сверстниками или воспитателями в детском саду.

Главная же проблема - возможности переноса результатов исследования одного испытуемого на каждого из представителей популяции. Речь идет об учете значимых для исследования индивидуальных различий. Теоретически возможен следующий ход: представление индивидуальных данных в «безразмерном» виде; при этом индивидуальные значения параметра нормируются на величину, равную разбросу значений в популяции.

Рассмотрим пример. В начале 1960-х гг. в лаборатории Б. Н. Теплова возникла проблема: почему все графики, описывающие изменения времени реакции в зависимости от интенсивности раздражителя, у испытуемых различны В. Д. Небылицын [Небылицын В. Д., 1966] предложил предъявлять испытуемым сигнал, который изменяется не в единицах физической интенсивности, а в единицах предварительно измеренного индивидуального абсолютного порога («один порог», «два порога» и т.д.). Результаты эксперимента блестяще подтвердили гипотезу Небылицына: кривые зависимости времени реакции от уровня воздействия, измеренного в единицах индивидуального абсолютного порога, оказались идентичными у всех испытуемых.

Аналогичная схема применяется и при интерпретации данных. В Институте психологии РАН А. В. Дрынков проводил исследования процесса формирования простых искусственных понятий. Кривые научения показывали зависимость успешности от времени. Они оказались различными у всех испытуемых: описывались степенными функциями. Дрынков предположил, что нормировка индивидуальных показателей на величину начального уровня обученности (по оси Y) и на индивидуальное время достижения критерия (по оси X) позволяет получить функциональную зависимость успешности от времени, одинаковую для всех испытуемых. Это подтвердилось: показатели изменения индивидуальных результатов испытуемых, представленные в «безразмерном» виде, подчинялись степенному квадратному закону.

Следовательно, выявление общей закономерности путем нивелирования индивидуальных различий решается каждый раз на основе содержательной гипотезы о влиянии дополнительной переменной на интериндивидуальную вариацию результатов эксперимента.

Остановимся еще раз на одной особенности экспериментов с участием одного испытуемого. Результаты этих экспериментов очень зависят от предубеждений экспериментатора и отношении, которые складываются между ним и испытуемым. При проведении длительной серии последовательных воздействии экспериментатор может неосознанно или осознанно действовать так, чтобы у испытуемого актуализировалось поведение, подтверждающее экспериментальную гипотезу. Вот почему в подобного рода исследованиях рекомендуют применять «слепые опыты» и «двойной слепой опыт». При первом варианте экспериментатор знает, а испытуемый не знает, когда последний получает плацебо, а когда - воздействие. «Двойной слепой опыт» состоит в том, что эксперимент проводит исследователь, незнакомый с гипотезой и не знающий, когда испытуемый получает плацебо или воздействие.

Эксперименты с участием одного испытуемого играют важную роль в психофизиологии, психофизике, психологии научения, когнитивной психологии. Методология таких экспериментов проникла в психологию программированного обучения и социального управления, в клиническую психологию, особенно - в поведенческую терапию, главным пропагандистом которой выступает Айзенк[Айзенк Г. Ю., 1999].

Выше всех умозрительных знаний и искусств стоит умение производить опыты, и эта наука есть царица наук.

Р. Бэкон

Планирование эксперимента - это процесс выбора условий, процедуры и методов проведения опытов, их числа и условий, необходимых и достаточных для решения поставленной задачи с требуемой точностью.

Требования к планированию эксперимента:

  • 1) число опытов должно быть минимальным, чтобы не усложнять процедуру эксперимента и не увеличивать его стоимость, но не в ущерб точности результата;
  • 2) необходимо определить совокупность факторов, влияющих на результаты эксперимента, ранжировать их, выявить главные, а несущественные переменные можно исключить;
  • 3) условием корректности эксперимента следует считать одновременное варьирование всеми переменными (факторами), оказывающими взаимное влияние на исследуемый процесс;
  • 4) ряд действий в эксперименте может быть заменен их моделями (прежде всего математическими), при этом адекватность моделей должна быть проверена и оценена;
  • 5) необходимо разработать стратегию эксперимента и алгоритм се реализации: серии эксперимента должны анализироваться после завершения каждой из них перед переходом к последующей серии.

План проведения эксперимента должен включать следующие разделы:

  • 1. Наименование темы исследования.
  • 2. Цель и задачи эксперимента.
  • 3. Условия проведения эксперимента: параметр оптимизации и варьируемые факторы.
  • 4. Методика проведения исследования.
  • 5. Обоснование количества опытов (объема эксперимента).
  • 6. Средства и методика проведения измерений.
  • 7. Материальное обеспечение эксперимента (перечень оборудования).
  • 8. Методика обработки и анализа экспериментальных данных.
  • 9. Календарный план проведения испытаний, в котором указываются сроки их выполнения, исполнители, представляемые данные эксперимента.
  • 10. Смета расходов.

Цель и задачи эксперимента - исходный пункт плана. Они формулируются на основе анализа научной гипотезы, теоретических результатов собственного исследования либо исследований других авторов.

Цель определяет конечный результат эксперимента, т. е. то, что исследователь должен получить в итоге. Например, подтвердить правильные научные гипотезы; проверить на практике адекватность, работоспособность и практическую пригодность моделей, методик; определить оптимальные условия технологического процесса и т. п.

В различных условиях цели требуют разных затрат, средств и методов измерения, времени эксперимента, отражаются на методике его проведения. Эти пункты плана будут различными, например, в условия лабораторного, полевого и производственного экспериментов.

Задачи эксперимента определяют частные цели, с помощью которых может быть достигнута конечная цель либо пути ее достижения. Например, определение оптимальных показателей температуры и давления при изготовлении фулиреновых нанотрубок; установление оптимального соотношения исходных материалов; обоснование скорости протекания технологического процесса и др.

Частными задачами эксперимента при его планировании могут быть:

  • - проверка теоретических положений с целью подтверждения их истинности;
  • - проверка (уточнение) констант математических либо иных моделей;
  • - поиск оптимальных (допустимых) условий какого-либо процесса;
  • - построение интерполяционных аналитических зависимостей.

Частные задачи эксперимента могут иметь несколько уровней, т. е. древовидную форму. Рекомендуется формулировать 2-4 сложные задачи и 10-15 более простых задач.

Формулирование условий проведении эксперимента - параметра оптимизации и варьируемых факторов.

Величина, описывающая результат проведенного эксперимента, называется параметром оптимизации (откликом) системы на воздействие. Множество значений, которые принимает параметр оптимизации, называется областью его определения.

Параметр оптимизации должен быть количественным, задаваться числом и быть измеримым при любом фиксированном наборе уровней факторов. Он обязан характеризоваться однозначно, т. е. заданному набору уровней факторов должно соответствовать, с точностью ошибки эксперимента, одно значение параметра оптимизации. Параметр оптимизации должен всесторонне характеризовать объект исследования, удовлетворять требованию универсальности и полноты. Он должен иметь физический смысл, чтобы обеспечить последующую интерпретацию результатов эксперимента, быть простым и легко вычисляемым.

Параметр оптимизации (отклик) зависит от факторов, влияющих на эксперимент. Фактор (лат .factor - производящий) - причина какого-либо процесса, явления, определяющая его влияние на объект исследования, его характер или отдельные черты. Это измеряемая величина, и каждое значение, которое может принимать фактор, называется уровнем фактора.

Каждый фактор в эксперименте может принимать одно из нескольких значений. Фиксированный набор уровней нескольких факторов будет определять какие-то конкретные условия проведения эксперимента. Изменение хотя бы одного из факторов приводит к изменению и условий, и, как следствие, к изменению значения параметра оптимизации.

Варьируемые факторы в многофакторном эксперименте определяют цели и условия исследования. Например, факторами в эксперименте по поиску оптимальных условий при производстве наноматериалов могут быть: температура, время воздействия, количество окисла и т. п.

Большое количество факторов делает эксперимент очень сложным и требует довольно много времени. Поэтому весьма важным при планировании эксперимента является сокращение числа факторов и выбор наиболее существенных. При этом можно руководствоваться принципом Парето, в соответствии с которым 20 % факторов определяют 80 % свойств системы.

Значимость факторов может быть определена опытным или аналитическим путем. В первом случае - проводится ограниченный эксперимент. При этом один фактор изменяется, а остальные нет, и т. д. Ранжирование «значимых» факторов осуществляется по силе их влияния на результат эксперимента. Те факторы, изменение которых сильнее отражается на конечном результате, считаются более важными. «Несущественными» факторами можно пренебречь.

Если факторов много, этот путь неэффективен, тогда используется аналитический путь, основанный на методах факторного анализа.

Если факторы зависимы, их можно рассчитать с помощью метода топологической декомпозиции и структуры по их влиянию на конечную цель. Задача определения рангов факторов заключается в выделении наиболее связной части графа. Она решается поэтапно.

Сначала определяются «достижимые множества» для каждой вершины графа (для каждого фактора). Затем определяются «контрдостижимые множества», каждое из которых включает все вершины, имеющие путь в вершину. В завершении определяют наиболее существенные вершины графа, составляющие сильно связанный граф. Самые существенные факторы оставляют, остальные отбрасывают.

Важнейшим требованием эксперимента является управляемость факторов, а экспериментатор должен иметь возможность выбрать нужное значение фактора и поддерживать его постоянным на протяжении всего эксперимента. Фактор также должен быть операциональным, чтобы его можно было указать последовательностью операций, необходимых для задания того или иного значения.

Формализуя условия проведения эксперимента, важно также определиться с областью его проведения. Для этого необходимо оценить границы областей определения факторов. Здесь возможны ограничения нескольких типов: которые не могут быть нарушены ни при каких условиях (например, температура нс может оказаться ниже абсолютного нуля); техникоэкономические ограничения (например, стоимость оборудования или продолжительность исследуемого процесса); конкретные условия процесса.

Под моделью эксперимента обычно понимают модель черного ящика, в которой используется функция отклика, устанавливающая зависимость между параметром оптимизации и факторами: у = f(x y X 2 > ...,Jc n).

Выбрать модель - значит выбрать вид этой функции и записать ее уравнение. Тогда останется только провести эксперимент по вычислению численных коэффициентов данной модели. Главное требование к модели эксперимента - способность предсказывать дальнейшее направление опытов с требуемой точностью. Среди всех возможных адекватных моделей необходимо выбирать ту, которая представляется наиболее простой.

Наиболее часто в планировании эксперимента выбирают полиномиальные модели первой (линейный) или второй степени:

Методика проведения эксперимента - ключевая часть плана эксперимента. Она включает:

  • - последовательность действий исследователя;
  • - основные приемы и правила осуществления каждого этапа, использование приборов и оборудования;
  • - порядок измерения, фиксации результатов и методы их обработки;
  • - порядок анализа результатов эксперимента и формулирования выводов.

При разработке методики важно правильно обосновать количество опытов,

которое гарантирует требуемую точность результата, а с другой стороны - не ведет к неоправда!тому перерасходу средств и времени на избыточные испытания.

При более чем десяти испытаниях обоснование количества опытов может быть осуществлено на основе неравенства Чебышева:

где X - среднее значение случайно измеряемой величины; М{х) - математическое ожидание величины; е - требуемая точность результата; D(x) - дисперсия величины х, рассчитанная по результатам N проведенных опытов.

Неравенство можно сформулировать следующим образом: «вероятность того, что разность между математическим ожиданием и среднестатистическим значением случайной величины X не превысит требуемую точность результата - е, равна разности между единицей и отношением D(x): Ne 2 ».

В неравенстве три неизвестных: N и статистические характеристики, зависящие от N. Поэтому процесс расчета N является итеративным.

Если неравенство выполняется, то количество опытов достаточно. В противном случае количество опытов увеличивается.

Достаточное количество наблюдений (опытов) может быть определено при помощи таблицы достаточно больших чисел (табл. 8.1). Она показывает, что достаточное количество наблюдений зависит от степени уверенности в результатах эксперимента (доверительной вероятности), величины допустимой ошибки (доверительного интервала). Иными словами, степень уверенности определяется величиной вероятности, с которой делается соответствующее заключение .

Относительно выбора величины вероятности Р нет какого-либо общего решения, одинакового при всех исследованиях. Чем ближе к единице будет величина рассматриваемой вероятности, тем надежнее будет заключение. В практике научных исследований доверительная вероятность обычно принимается Р = 0,9-0,99. Требуемая точность при исследованиях устанавливается в зависимости от природы изучаемого явления. В большинстве случаев требуемая точность принимается равной е = 0,01-0,05.

Например, если величина доверительной вероятности принята равной Р = 0,95, а допустимая ошибка равна е = 0,05, то достаточное число наблюдений в ходе эксперимента будет равно 384.

Другой важной составляющей плана эксперимента является обоснование средств и методики измерений. Она предполагает выбор измерительных приборов, аппаратуры и оборудования, позволяет фиксировать данные эксперимента; преобразовывать их к удобному виду; хранить, обеспечивать выдачу по запросам и т. п.

Система измерений должна формироваться с учетом требований метрологии науки о методах и средствах измерений, выборе единиц, шкал и систем измерений; проблемах точности измерений. Методы измерений, которые могут быть применены в различных экспериментах, рассмотрены в предыдущей главе.

Эти методы измерения могут быть сведены в две группы: прямых (искомая величина измеряется непосредственно в ходе эксперимента) и косвенных измерений (искомая величина, полученная на основе результатов прямых измерений). Кроме того, по признаку единиц измерений различают абсолютные измерения, проводимые в единицах исследуемой величины, и относигельные измерения, предполагающие фиксацию отношения измеряемой величины к ее некоторому предельному значению.

Рассмотренные основы организации и проведения эксперимента носят лишь обзорный характер, а сущность, содержание, условия применения вышеизложенных рекомендаций и последовательность использования того или иного метода проведения эксперимента требуют более детального изучения. Кроме того, следует четко понимать, что каждый метод проведения эксперимента будет иметь и свои особенности в зависимости от объекта исследования.

1. История возникновения планирования эксперимента

Планирование эксперимента – продукт нашего времени, однако истоки его теряются в глубине веков.

Истоки планирования эксперимента уходят в глубокую древность и связаны с числовой мистикой, пророчествами и суевериями.

Это собственно не планирование физического эксперимента, а планирование числового эксперимента, т.е. расположение чисел так, чтобы выполнялись некоторые строгие условия, например, на равенство сумм по строкам, столбцам и диагоналям квадратной таблицы, клеточки которой заполнены числами натурального ряда.

Такие условия выполняются в магических квадратах, которым, по-видимому, принадлежит первенство в планировании эксперимента.

Согласно одной легенде примерно в 2200 г. до н.э. китайский император Ю выполнял мистические вычисления с помощью магического квадрата, который был изображен на панцире божественной черепахи.

Квадрат императора Ю

Клетки этого квадрата заполнены числами от 1 до 9, и суммы чисел по строкам, столбцам и главным диагоналям равны 15.

В 1514 г. немецкий художник Альбрехт Дюрер изобразил магический квадрат в правом углу своей знаменитой гравюры-аллегории «Меланхолия». Два числа в нижнем горизонтальном ряду A5 и 14) составляют год создания гравюры. В этом состояло своеобразное «приложение» магического квадрата.

Квадрат Дюрера

В течение нескольких веков построение магических квадратов занимало умы индийских, арабских, немецких, французских математиков.

В настоящее время магические квадраты используются при планировании эксперимента в условиях линейного дрейфа, при планировании экономических расчетов и составлении рационов питания, в теории кодирования и т.д.

Построение магических квадратов является задачей комбинаторного анализа, основы которого в его современном понимании заложены Г. Лейбницем. Он не только рассмотрел и решил основные комбинаторные задачи, но и указал на большое практическое применение комбинаторного анализа: к кодированию и декодированию, к играм и статистике, к логике изобретений и логике геометрии, к военному искусству, грамматике, медицине, юриспруденции, технологии и к комбинации наблюдений. Последняя область применения наиболее близка к планированию эксперимента.

Одной из комбинаторных задач, имеющей прямое отношение к планированию эксперимента, занимался известный петербургский математик Л. Эйлер. В 1779 г. он предложил задачу о 36 офицерах как некоторый математический курьез.

Он поставил вопрос, можно ли выбрать 36 офицеров 6 рангов из 6 полков по одному офицеру каждого ранга от каждого полка и расположить их в каре так, чтобы в каждом ряду и в каждой шеренге было бы по одному офицеру каждого ранга и по одному от каждого полка. Задача эквивалентна построению парных ортогональных 6x6 квадратов. Оказалось, что эту задачу решить невозможно. Эйлер высказал предположение, что не существует пары ортогональных квадратов порядка п=1 (mod 4).

Задачей Эйлера, в частности, и латинскими квадратами вообще занимались впоследствии многие математики, однако почти никто из них не задумывался над практическим применением латинских квадратов.

В настоящее время латинские квадраты являются одним из наиболее популярных способов ограничения на рандомизацию при наличии источников неоднородностей дискретного типа в планировании эксперимента. Группировка элементов латинского квадрата, благодаря своим свойствам (каждый элемент появляется один и только один раз в каждой строке и в каждом столбце квадрата), позволяет защитить главные эффекты от влияния источника неоднородностей. Широко используются латинские квадраты и как средство сокращения перебора в комбинаторных задачах.

Возникновение современных статистических методов планирования эксперимента связано с именем Р. Фишера.

С 1918 г. он начал свою известную серию работ на Рочемстедской агробиологической станции в Англии. В 1935 г. появилась его монография «Design of Experiments», давшая название всему направлению.

Среди методов планирования первым был дисперсионный анализ (кстати, Фишеру принадлежит и термин «дисперсия»). Фишер создал основы этого метода, описав полные классификации дисперсионного анализа (однофакторный и многофакторный эксперименты) и неполные классификации дисперсионного анализа без ограничения и с ограничением на рандомизацию. При этом он широко использовал латинские квадраты и блок-схемы. Вместе с Ф. Йетсом он описал их статистические свойства. В 1942 г. А. Кишен рассмотрел планирование по латинским кубам, которое явилось дальнейшим развитием теории латинских квадратов.

Затем Р. Фишер независимо опубликовал сведения об ортогональных гипер-греко-латинских кубах и гипер-кубах. Вскоре после этого 1946–1947 гг.) Р. Рао рассмотрел их комбинаторные свойства. Дальнейшему развитию теории латинских квадратов посвящены работы X. Манна A947–1950 гг.).

Исследования Р. Фишера, проводившиеся в связи с работами по агробиологии, знаменуют начало первого этапа развития методов планирования эксперимента. Фишер разработал метод факторного планирования. Йегс предложил для этого метода простую вычислительную схему. Факторное планирование получило широкое распространение. Особенностью полного факторного эксперимента является необходимость ставить сразу большое число опытов.

В 1945 г. Д. Финни ввел дробные реплики от факторного эксперимента. Это позволило резко сократить число опытов и открыло дорогу техническим приложениям планирования. Другая возможность сокращения необходимого числа опытов была показана в 1946 г. Р. Плакеттом и Д. Берманом, которые ввели насыщенные факторные планы.

В 1951 г. работой американских ученых Дж. Бокса и К. Уилсона начался новый этап развития планирования эксперимента.

Эта работа подытожила предыдущие. В ней ясно сформулирована и доведена до практических рекомендаций идея последовательного экспериментального определения оптимальных условий проведения процессов с использованием оценки коэффициентов степенных разложений методом наименьших квадратов, движения по градиенту и отыскания интерполяционного полинома (степенного ряда) в области экстремума функции отклика («почти стационарной» области).

В 1954–1955 гг. Дж. Бокс, а затем Дж. Бокс и П. Юл показали, что планирование эксперимента можно использовать при исследовании физико-химических механизмов процессов, если априори высказаны одна или несколько возможных гипотез. Здесь планирование эксперимента пересекалось с исследованиями по химической кинетике. Интересно отметить, что кинетику можно рассматривать как метод описания процесса с помощью дифференциальных уравнений, традиции которого восходят к И. Ньютону. Описание процесса дифференциальными уравнениями, называемое детерминистическим, нередко противопоставляется статистическим моделям.

Бокс и Дж. Хантер сформулировали принцип ротатабельности для описания «почти стационарной» области, развивающейся в настоящее время в важную ветвь теории планирования эксперимента. В той же работе показана возможность планирования с разбиением на ортогональные блоки, указанная ранее независимо де Бауном.

Дальнейшим развитием этой идеи было планирование, ортогональное к неконтролируемому временному дрейфу, которое следует рассматривать как важное открытие в экспериментальной технике – значительное увеличение возможностей экспериментатора.


2. Математическое планирование эксперимента в научных исследованиях

2.1 Основные понятия и определения

Под экспериментом будем понимать совокупность операций совершаемых над объектом исследования с целью получения информации о его свойствах. Эксперимент, в котором исследователь по своему усмотрению может изменять условия его проведения, называется активным экспериментом. Если исследователь не может самостоятельно изменять условия его проведения, а лишь регистрирует их, то это пассивный эксперимент.

Важнейшей задачей методов обработки полученной в ходе эксперимента информации является задача построения математической модели изучаемого явления, процесса, объекта. Ее можно использовать и при анализе процессов и при проектировании объектов. Можно получить хорошо аппроксимирующую математическую модель, если целенаправленно применяется активный эксперимент. Другой задачей обработки полученной в ходе эксперимента информации является задача оптимизации, т.е. нахождения такой комбинации влияющих независимых переменных, при которой выбранный показатель оптимальности принимает экстремальное значение.

Опыт – это отдельная экспериментальная часть.

План эксперимента – совокупность данных определяющих число, условия и порядок проведения опытов.

Планирование эксперимента – выбор плана эксперимента, удовлетворяющего заданным требованиям, совокупность действий направленных на разработку стратегии экспериментирования (от получения априорной информации до получения работоспособной математической модели или определения оптимальных условий). Это целенаправленное управление экспериментом, реализуемое в условиях неполного знания механизма изучаемого явления.

В процессе измерений, последующей обработки данных, а также формализации результатов в виде математической модели, возникают погрешности и теряется часть информации, содержащейся в исходных данных. Применение методов планирования эксперимента позволяет определить погрешность математической модели и судить о ее адекватности. Если точность модели оказывается недостаточной, то применение методов планирования эксперимента позволяет модернизировать математическую модель с проведением дополнительных опытов без потери предыдущей информации и с минимальными затратами.

Цель планирования эксперимента – нахождение таких условий и правил проведения опытов при которых удается получить надежную и достоверную информацию об объекте с наименьшей затратой труда, а также представить эту информацию в компактной и удобной форме с количественной оценкой точности.

Пусть интересующее нас свойство (Y) объекта зависит от нескольких (n ) независимых переменных (Х 1 , Х 2 , …, Х n ) и мы хотим выяснить характер этой зависимости – Y=F(Х 1 , Х 2 , …, Х n) , о которой мы имеем лишь общее представление. Величина Y – называется «отклик», а сама зависимость Y=F(Х 1 , Х 2 , …, Х n) – «функция отклика».

Отклик должен быть определен количественно. Однако могут встречаться и качественные признаки Y . В этом случае возможно применение рангового подхода. Пример рангового подхода – оценка на экзамене, когда одним числом оценивается сложный комплекс полученных сведений о знаниях студента.

Независимые переменные Х 1 , Х 2 , …, Х n – иначе факторы, также должны иметь количественную оценку. Если используются качественные факторы, то каждому их уровню должно быть присвоено какое-либо число. Важно выбирать в качестве факторов лишь независимые переменные, т.е. только те которые можно изменять, не затрагивая другие факторы. Факторы должны быть однозначными. Для построения эффективной математической модели целесообразно провести предварительный анализ значимости факторов (степени влияния на функцию), их ранжирование и исключить малозначащие факторы.

Диапазоны изменения факторов задают область определения Y . Если принять, что каждому фактору соответствует координатная ось, то полученное пространство называется факторным пространством. При n=2 область определения Y представляется собой прямоугольник, при n=3 – куб, при n >3 – гиперкуб.

При выборе диапазонов изменения факторов нужно учитывать их совместимость, т.е. контролировать, чтобы в этих диапазонах любые сочетания факторов были бы реализуемы в опытах и не приводили бы к абсурду. Для каждого из факторов указывают граничные значения

, i =1,… n .

Регрессионный анализ функции отклика предназначен для получения ее математической модели в виде уравнения регрессии

где В 1 , …, В m – некоторые коэффициенты; е – погрешность.

Среди основных методов планирования, применяемых на разных этапах исследования, используют:

· планирование отсеивающего эксперимента, основное значение которого выделение из всей совокупности факторов группы существенных факторов, подлежащих дальнейшему детальному изучению;

· планирование эксперимента для дисперсионного анализа, т.е. составление планов для объектов с качественными факторами;

· планирование регрессионного эксперимента, позволяющего получать регрессионные модели (полиномиальные и иные);

· планирование экстремального эксперимента, в котором главная задача – экспериментальная оптимизация объекта исследования;

· планирование при изучении динамических процессов и т.д.

Инициатором применения планирования эксперимента является Рональд А. Фишер, другой автор известных первых работ – Френк Йетс. Далее идеи планирования эксперимента формировались в трудах Дж. Бокса, Дж. Кифера. В нашей стране – в трудах Г.К. Круга, Е.В. Маркова и др.

В настоящее время методы планирования эксперимента заложены в специализированных пакетах, широко представленных на рынке программных продуктов, например: StatGrapfics, Statistica, SPSS, SYSTAT и др.

2.2 Представление результатов экспериментов

При использовании методов планирования эксперимента необходимо найти ответы на 4 вопроса:

· Какие сочетания факторов и сколько таких сочетаний необходимо взять для определения функции отклика?

· Как найти коэффициенты В 0 , В 1 , …, B m ?

· Как оценить точность представления функции отклика?

· Как использовать полученное представление для поиска оптимальных значений Y ?

Геометрическое представление функции отклика в факторном пространстве Х 1 , Х 2 , …, Х n называется поверхностью отклика (рис. 1).


Рис. 1. Поверхность отклика

Если исследуется влияние на Y лишь одного фактора Х 1 , то нахождение функции отклика – достаточно простая задача. Задавшись несколькими значениями этого фактора, в результате опытов получаем соответствующие значения Y и график Y =F(X) (рис. 2).

Рис. 2. Построение функции отклика одной переменной по опытным данным

По его виду можно подобрать математическое выражение функции отклика. Если мы не уверены, что опыты хорошо воспроизводятся, то обычно опыты повторяют несколько раз и получают зависимость с учетом разброса опытных данных.

Если факторов два, то необходимо провести опыты при разных соотношениях этих факторов. Полученную функцию отклика в 3 х -мерном пространстве (рис. 1) можно анализировать, проводя ряд сечений с фиксированными значениями одного из факторов (рис. 3). Вычлененные графики сечений можно аппроксимировать совокупностью математических выражений.

Рис. 3. Сечения поверхности отклика при фиксированных откликах (а) и переменных (б, в)

При трех и более факторах задача становится практически неразрешимой. Если и будут найдены решения, то использовать совокупность выражений достаточно трудно, а часто и не реально.

2.3 Применение математического планирования эксперимента в научных исследованиях

В современной математической теории оптимального планирования эксперимента существует 2 основных раздела:

1. планирование эксперимента для изучения механизмов сложных процессов и свойств многокомпонентных систем.

2. планирование эксперимента для оптимизации технологических процессов и свойств многокомпонентных систем.

Планирование эксперимента – это выбор числа опытов и условий их проведения необходимых и достаточных для решения поставленной задачи с требуемой точностью.

Эксперимент, который ставится для решений задач оптимизации, называется экстремальным. Примерами задач оптимизации являются выбор оптимального состава многокомпонентных смесей, повышение производительности действующей установки, повышение качества продукции и снижение затрат на её получение. Прежде чем планировать эксперимент необходимо сформулировать цель исследования. От точной формулировки цели зависит успех исследования. Необходимо также удостовериться, что объект исследования соответствует предъявляемым ему требованиям. В технологическом исследовании целью исследования при оптимизации процесса чаще всего является повышение выхода продукта, улучшение качества, снижение себестоимости.

Эксперимент может проводиться непосредственно на объекте или на его модели. Модель отличается от объекта не только масштабом, а иногда природой. Если модель достаточно точно описывает объект, то эксперимент на объекте может быть перенесён на модель. Для описания понятия «объект исследования» можно использовать представление о кибернетической системе, которая носит название чёрный ящик.


Стрелки справа изображают численные характеристики целей исследования и называются выходными параметрами ( y ) или параметрами оптимизации .

Для проведения эксперимента необходимо воздействовать на поведение чёрного ящика. Все способы воздействия обозначаются через «x» и называются входными параметрами или факторами . Каждый фактор может принимать в опыте одно из нескольких значений, и такие значения называются уровнями . Фиксированный набор уровней и факторов определяет одно из возможных состояний чёрного ящика, одновременно они являются условиями проведения одного из возможных опытов. Результаты эксперимента используются для получения математической модели объекта исследования. Использование для объекта всех возможных опытов приводит к абсурдно большим экспериментам. В связи с этим эксперименты необходимо планировать.

Задачей планирования является выбор необходимых для эксперимента опытов, методов математической обработки их результатов и принятия решений. Частный случай этой задачи – планирование экстремального эксперимента. То есть эксперимента поставленного с целью поиска оптимальных условий функционирования объекта. Таким образом, планирование экстремального эксперимента – это выбор количества и условий проведения опытов, минимально необходимых для отыскания оптимальных условий. При планировании эксперимента объект исследования должен обладать обязательными свойствами:

1.управляемым

2.результаты эксперимента должны быть воспроизводимыми.

Эксперимент называется воспроизводимым , если при фиксированных условиях опыта получается один и тот же выход в пределах заданной относительно небольшой ошибки эксперимента (2%-5%). Эксперимент проводят при выборе некоторых уровней для всех факторов, затем он повторяется через неравные промежутки времени. И значения параметров оптимизации сравниваются. Разброс этих параметров характеризует воспроизводимость результатов. Если он не превышает заранее заданной величины, то объект удовлетворяет требованию воспроизводимости результатов.

При планировании эксперимента активное вмешательство предполагает процесс и возможность выбора в каждом опыте тех факторов, которые представляют интерес. Экспериментальное исследование влияния входных параметров (факторов) на выходные может производиться методом пассивного или активного эксперимента. Если эксперимент сводится к получению результатов наблюдения за поведение системы при случайных изменениях входных параметров, то он называется пассивным . Если же при проведении эксперимента входные параметры изменяются по заранее заданному плану, то такой эксперимент называется активным. Объект, на котором возможен активный эксперимент, называется управляемым. На практике не существует абсолютно управляемых объектов. На реальный объект обычно действуют как управляемый, так и неуправляемый факторы. Неуправляемые факторы действуют на воспроизводимость эксперимента. Если все факторы неуправляемы, возникает задача установления связи между параметром оптимизации и факторами по результатам наблюдений или по результатам пассивного эксперимента. Возможна также плохая воспроизводимость изменения факторов во времени.


3. Параметры оптимизации

3.1 Виды параметров оптимизации

Параметр оптимизации – это признак, по которому мы хотим оптимизировать процесс. Он должен быть количественным, задаваться числом. Множество значений, которые может принимать параметр оптимизации, называется областью его определения. Области определения могут быть непрерывными и дискретными, ограниченными и неограниченными. Например, выход реакции – это параметр оптимизации с непрерывной ограниченной областью определения. Он может изменяться в интервале от 0 до 100%. Число бракованных изделий, число кровяных телец в пробе крови – вот примеры параметров с дискретной областью определения, ограниченной снизу.

В зависимости от объекта и цели исследования параметры оптимизации могут быть весьма разнообразными (рис. 1).

Прокомментируем некоторые элементы схемы. Экономические параметры оптимизации, такие, как прибыль, себестоимость и рентабельность, обычно используются при исследовании действующих промышленных объектов, тогда как затраты на эксперимент имеет смысл оценивать в любых исследованиях, в том числе и лабораторных. Если цена опытов одинакова, затраты на эксперимент» пропорциональны числу опытов, которые необходимо поставить для решения данной задачи. Это в значительной мере определяет выбор плана эксперимента.

Среди технико-экономических параметров наибольшее распространение имеет производительность. Такие параметры, как долговечность, надежность и стабильность, связаны с длительными наблюдениями. Имеется некоторый опыт их использования при изучении дорогостоящих ответственных объектов, например радиоэлектронной аппаратуры.

Почти во всех исследованиях приходится учитывать количество и качество получаемого продукта. Как меру количества продукта используют выход, например, процент выхода готовой продукции.

Показатели качества чрезвычайно разнообразны. В нашей схеме они сгруппированы по видам свойств. Характеристики количества и качества продукта образуют группу технико-технологических параметров.

В группе «прочие» сгруппированы различные параметры, которые реже встречаются, но не являются менее важными. Сюда попали статистические параметры, используемые для улучшения характеристик случайных величин или случайных функций.

3.2 Требования к параметру оптимизации

Параметр оптимизации – это признак, по которому мы хотим оптимизировать процесс. Он должен быть количественным, задаваться числом. Мы должны уметь его измерять при любой возможной комбинации выбранных уровней факторов. Множество значений, которые может принимать параметр оптимизации, будем называть областью его определения. Области определения могут быть непрерывными и дискретными, ограниченными и неограниченными. Например, выход реакции – это параметр оптимизации с непрерывной ограниченной областью определения. Он может изменяться в интервале от 0 до 100%. Число бракованных изделий, число зерен на шлифе сплава, число кровяных телец в пробе крови – вот примеры параметров с дискретной областью определения, ограниченной снизу.

Уметь измерять параметр оптимизации – это значит располагать подходящим прибором. В ряде случаев такого прибора может не существовать или он слишком дорог. Если нет способа количественного измерения результата, то приходится воспользоваться приемом, называемым ранжированием (ранговым подходом). При этом параметрам оптимизации присваиваются оценки – ранги по заранее выбранной шкале: двухбалльной, пятибалльной и т.д. Ранговый параметр имеет дискретную ограниченную область определения. В простейшем случае область содержит два значения (да, нет; хорошо, плохо). Это может соответствовать, например, годной продукции и браку.

Ранг – это количественная оценка параметра оптимизации, но она носит условный (субъективный) характер. Мы ставим в соответствие качественному признаку некоторое число – ранг. Для каждого физически измеряемого параметра оптимизации можно построить ранговый аналог. Потребность в построении такого аналога возникает, если имеющиеся в распоряжении исследователя численные характеристики неточны или неизвестен способ построения удовлетворительных численных оценок. При прочих равных условиях всегда нужно отдавать предпочтение физическому измерению, так как ранговый подход менее чувствителен и с его помощью трудно изучать тонкие эффекты.

Пример: Технолог разработал новый вид продукта. Вам необходимо оптимизировать этот процесс.

Цель процесса – получение вкусного продукта, но такая формулировка цели еще не дает возможности приступить к оптимизации: необходимо выбрать количественный критерий, характеризующий степень достижения цели. Можно принять следующее решение: очень вкусный продукт получает отметку 5, просто вкусный продукт – отметку 4 и т.д.

Можно ли после такого решения переходить к оптимизации процесса? Нам важно количественно оценить результат оптимизации. Решает ли отметка эту задачу? Конечно, потому что, как мы договорились, отметка 5 соответствует очень вкусному продукту и т.д. Другое дело, что этот подход, называемый ранговым, часто оказывается грубым, нечувствительным. Но возможности такой количественной оценки результатов не должна вызывать сомнений.

Следующее требование: параметр оптимизации должен выражаться одним числом. Например: регистрация показания прибора.

Еще одно требование, связанное с количественной природой параметра оптимизации, – однозначность в статистическом смысле. Заданному набору значений факторов должно соответствовать одно с точностью до ошибки эксперимента значение параметра оптимизации. (Однако обратное неверно: одному и тому же значению параметра могут соответствовать разные наборы значений факторов.)

Для успешного достижения цели исследования необходимо, чтобы параметр оптимизации действительно оценивал эффективность функционирования системы в заранее выбранном смысле. Это требование является главным, определяющим корректность постановки задачи.

Представление об эффективности не остается постоянным в ходе исследования. Оно меняется по мере накопления информации и в зависимости от достигнутых результатов. Это приводит к последовательному подходу при выборе параметра оптимизации. Так, например, на первых стадиях исследования технологических процессов в качестве параметра оптимизации часто используется выход продукта. Однако в дальнейшем, когда возможность повышения выхода исчерпана, нас начинают интересовать такие параметры, как себестоимость, чистота продукта и т.д.

Говоря об оценке эффективности функционирования системы, важно помнить, что речь идет о системе в целом. Часто система состоит из ряда подсистем, каждая из которых может оцениваться своим локальным параметром оптимизации.

Следующее требование к параметру оптимизации – требование универсальности или полноты. Под универсальностью параметра оптимизации понимается его способность всесторонне характеризовать объект. В частности, технологические параметры оптимизации недостаточно универсальны: они не учитывают экономику. Универсальностью обладают, например, обобщенные параметры оптимизации, которые строятся как функции от нескольких частных параметров.

Желательно, чтобы параметр оптимизации имел физический смысл, был простым и легко вычисляемым.

Требование физического смысла связано с последующей интерпретацией результатов эксперимента.

Таким образом, параметр оптимизации должен быть:

– эффективным с точки зрения достижения цели;

– универсальным;

– количественным и выражаться одним числом;

– статистически эффективным;

– имеющим физический смысл, простым и легко вычисляемым.

В тех случаях, когда возникают трудности с количественной оценкой параметров оптимизации, приходится обращаться к ранговому подходу. В ходе исследования могут меняться априорные представления об объекте исследования, что приводит к последовательному подходу при выборе параметра оптимизации.

Из многих параметров, характеризующих объект исследования, только один, часто обобщенный, может служить параметром оптимизации. Остальные рассматриваются как ограничения.


4. Факторы оптимизации

4.1 Определение фактора

Фактором называется измеряемая переменная величина, принимающая в некоторый момент времени определенное значение. Факторы соответствуют способам воздействия на объект исследования.

Так же, как и параметр оптимизации, каждый фактор имеет область определения. Фактор считают заданным, если вместе с его названием указана область его определения.

Под областью определения понимается совокупность всех значений, которые в принципе может принимать данный фактор.

Совокупность значений фактора, которая используется в эксперименте, является подмножеством из множества значений, образующих область определения. Область определения может быть непрерывной и дискретной. Однако в основном, в задачах планирования эксперимента, используются дискретные области определения. Так, для факторов с непрерывной областью определения, таких, как температура, время, количество вещества и т.п., всегда выбираются дискретные множества уровней.

В практических задачах области определения факторов, как правило, ограничены. Ограничения могут носить принципиальный либо технический характер.

Факторы классифицируют в зависимости от того, является ли фактор переменной величиной, которую можно оценивать количественно: измерять, взвешивать, титровать и т.п., или же он – некоторая переменная, характеризующаяся качественными свойствами.

Факторы разделяются на количественные и качественные.

Качественные факторы – это разные вещества, разные технологические способы, аппараты, исполнители и т.д.

Хотя качественным факторам не соответствует числовая шкала в том смысле, как это понимается для количественных факторов, однако можно построить условную порядковую шкалу, которая ставит в соответствие уровням качественного фактора числа натурального ряда, т.е. производит кодирование. Порядок уровней может быть произволен, но после кодирования он фиксируется.

Качественным факторам не соответствует числовая шкала, и порядок уровней факторов не играет роли.

Время реакции, температура, концентрация реагирующих веществ, скорость подачи веществ, величина рН – это примеры наиболее часто встречающихся количественных факторов. Различные реагенты, адсорбенты, вулканизующие агенты, кислоты, металлы являются примером уровней качественных факторов.

4.2 Требования, предъявляемые к факторам при планировании эксперимента

При планировании эксперимента факторы должны быть управляемыми. Это значит, что экспериментатор, выбрав нужное значение фактора, может его поддерживать постоянным в течение всего опыта, т.е. может управлять фактором. Планировать эксперимент можно только в том случае, если уровни факторов подчиняются воле экспериментатора.

Пример: Вы изучаете процесс синтеза аммиака. Колонна синтеза установлена на открытой площадке. Является ли температура воздуха фактором, который можно включить в планирование эксперимента?

Температура воздуха – фактор неуправляемый. Мы еще не научились делать погоду по заказу. А в планировании могут участвовать только те факторы, которыми можно управлять, – устанавливать и поддерживать на выбранном уровне в течение опыта или менять по заданной программе. Температурой окружающей среды в данном случае управлять невозможно. Ее можно только контролировать.

Чтобы точно определить фактор, нужно указать последовательность действий (операций), с помощью которых устанавливаются его конкретные значения (уровни). Такое определение фактора будем называть операциональным. Так, если фактором является давление в некотором аппарате, то совершенно необходимо указать, в какой точке и с помощью какого прибора оно измеряется и как оно устанавливается. Введение операционального определения обеспечивает однозначное понимание фактора.

С операциональным определением связаны выбор размерности фактора и точность его фиксирования.

Точность замера факторов должна быть возможно более высокой. Степень точности определяется диапазоном изменения факторов. При изучении процесса, который длится десятки часов, нет необходимости учитывать доли минуты, а в быстрых процессах необходимо учитывать, быть может, доли секунды.

Факторы должны быть непосредственными воздействиями на объект. Факторы должны быть однозначны. Трудно управлять фактором, который, является функцией других факторов. Но в планировании могут участвовать сложные факторы, такие, как соотношения между компонентами, их логарифмы и т.п.

При планировании эксперимента обычно одновременно изменяется несколько факторов. Поэтому очень важно сформулировать требования, которые предъявляются к совокупности факторов. Прежде всего выдвигается требование совместимости. Совместимость факторов означает, что все их комбинации осуществимы и безопасны. Это очень важное требование.

При планировании эксперимента важна независимость факторов, т.е. возможность установления фактора на любом уровне вне зависимости от уровней других факторов. Если это условие невыполнимо, то невозможно планировать эксперимент.

Таким образом, установили, что факторы – это переменные величины, соответствующие способам воздействия внешней среды на объект.

Они определяют как сам объект, так и его состояние. Требования к факторам: управляемость и однозначность.

Управлять фактором – это значит установить нужное значение и поддерживать его постоянным в течение опыта или менять по заданной программе. В этом состоит особенность «активного» эксперимента. Планировать эксперимент можно только в том случае, если уровни факторов подчиняются воле экспериментатора.

Факторы должны непосредственно воздействовать на объект исследования.

Требования к совокупности факторов: совместимость и отсутствие линейной корреляции. Выбранное множество факторов должно быть достаточно полным. Если какой-либо существенный фактор пропущен, это приведет к неправильному определению оптимальных условий или к большой ошибке опыта. Факторы могут быть количественными и качественными.


5. Ошибки опыта

Изучение всех влияющих на исследуемый объект факторов одновременно провести невозможно, поэтому в эксперименте рассматривается их ограниченное число. Остальные активные факторы стабилизируются, т.е. устанавливаются на каких-то одинаковых для всех опытов уровнях.

Некоторые факторы не могут быть обеспечены системами стабилизации (например, погодные условия, самочувствие оператора и т.д.), другие же стабилизируются с какой-то погрешностью (например, содержание какого-либо компонента в среде зависит от ошибки при взятии навески и приготовления раствора). Учитывая также, что измерение параметра у осуществляется прибором, обладающим какой-то погрешностью, зависящей от класса точности прибора, можно прийти к выводу, что результаты повторностей одного и того же опыта у к будут приближенными и должны отличаться один от другого и от истинного значения выхода процесса. Неконтролируемое, случайное изменение и множества других влияющих на процесс факторов вызывает случайные отклонения измеряемой величины у к от ее истинного значения – ошибку опыта.

Каждый эксперимент содержит элемент неопределенности вследствие ограниченности экспериментального материала. Постановка повторных (или параллельных) опытов не дает полностью совпадающих результатов, потому что всегда существует ошибка опыта (ошибка воспроизводимости). Эту ошибку и нужно оценить по параллельным опытам. Для этого опыт воспроизводится по возможности в одинаковых условиях несколько раз и затем берется среднее арифметическое всех результатов. Среднее арифметическое у равно сумме всех n отдельных результатов, деленной на количество параллельных опытов n:


Отклонение результата любого опыта от среднего арифметического можно представить как разность y 2 – , где y 2 – результат отдельного опыта. Наличие отклонения свидетельствует об изменчивости, вариации значений повторных опытов. Для измерения этой изменчивости чаще всего используют дисперсию.

Дисперсией называется среднее значение квадрата отклонений величины от ее среднего значения. Дисперсия обозначается s 2 и выражается формулой:

где (n-1) – число степеней свободы, равное количеству опытов минус единица. Одна степень свободы использована для вычисления среднего.

Корень квадратный из дисперсии, взятый с положительным знаком, называется средним квадратическим отклонением, стандартом или квадратичной ошибкой:

Ошибка опыта является суммарной величиной, результатом многих ошибок: ошибок измерений факторов, ошибок измерений параметра оптимизации и др. Каждую из этих ошибок можно, в свою очередь, разделить на составляющие.

Все ошибки принято разделять на два класса: систематические и случайные (рисунок 1).

Систематические ошибки порождаются причинами, действующими регулярно, в определенном направлении. Чаще всего эти ошибки можно изучить и определить количественно. Систематическая ошибка – это ошибка, которая остаётся постоянно или закономерно изменяется при повторных измерениях одной и той же величины. Эти ошибки появляются вследствие неисправности приборов, неточности метода измерения, какого либо упущения экспериментатора, либо использования для вычисления неточных данных. Обнаружить систематические ошибки, а также устранить их во многих случаях нелегко. Требуется тщательный разбор методов анализа, строгая проверка всех измерительных приборов и безусловное выполнение выработанных практикой правил экспериментальных работ. Если систематические ошибки вызваны известными причинами, то их можно определить. Подобные погрешности можно устранить введением поправок.

Систематические ошибки находят, калибруя измерительные приборы и сопоставляя опытные данные с изменяющимися внешними условиями (например, при градуировке термопары по реперным точкам, при сравнении с эталонным прибором). Если систематические ошибки вызываются внешними условиями (переменной температуры, сырья и т.д.), следует компенсировать их влияние.

Случайными ошибками называются те, которые появляются нерегулярно, причины, возникновения которых неизвестны и которые невозможно учесть заранее. Случайные ошибки вызываются и объективными причинами и субъективными. Например, несовершенством приборов, их освещением, расположением, изменением температуры в процессе измерений, загрязнением реактивов, изменением электрического тока в цепи. Когда случайная ошибка больше величины погрешности прибора, необходимо многократно повторить одно и тоже измерение. Это позволяет сделать случайную ошибку сравнимой с погрешностью вносимой прибором. Если же она меньше погрешности прибора, то уменьшать её нет смысла. Такие ошибки имеют значение, которое отличается в отдельных измерениях. Т.е. их значения могут быть неодинаковыми для измерений сделанных даже в одинаковых условиях. Поскольку причины, приводящие к случайным ошибкам неодинаковы в каждом эксперименте, и не могут быть учтены, поэтому исключить случайные ошибки нельзя, можно лишь оценить их значения. При многократном определении какого-либо показателя могут встречаться результаты, которые значительно отличаются от других результатов той же серии. Они могут быть следствием грубой ошибки, которая вызвана невнимательностью экспериментатора.

Систематические и случайные ошибки состоят из множества элементарных ошибок. Для того чтобы исключать инструментальные ошибки, следует проверять приборы перед опытом, иногда в течение опыта и обязательно после опыта. Ошибки при проведении самого опыта возникают вследствие неравномерного нагрева реакционной среды, разного способа перемешивания и т.п.

При повторении опытов такие ошибки могут вызвать большой разброс экспериментальных результатов.

Очень важно исключить из экспериментальных данных грубые ошибки, так называемый брак при повторных опытах. Грубые ошибки легко обнаружить. Для выявления ошибок необходимо произвести измерения в других условиях или повторить измерения через некоторое время. Для предотвращения грубых ошибок нужно соблюдать аккуратность в записях, тщательность в работе и записи результатов эксперимента. Грубая ошибка должна быть исключена из экспериментальных данных. Для отброса ошибочных данных существуют определённые правила.

Например, используют критерий Стьюдента t(Р; f): Опыт считается бракованным, если экспериментальное значение критерия t по модулю больше табличного значения t(Р; f).

Если в распоряжении исследователя имеется экспериментальная оценка дисперсии S 2 (y k) с небольшим конечным числом степеней свободы, то доверительные ошибки рассчитываются с помощью критерий Стьюдента t(Р; f):

ε() = t (Р; f)* S(y k)/ = t (Р; f)* S()

ε(y k) = t(Р; f)* S(y k)


6. Результат прямого измерения – случайная величина, подчиняющаяся нормальному закону распределения

Результаты, которые получаются при экспериментальном исследовании какого-либо технологического процесса, зависят от целого ряда факторов. Поэтому результат исследования является случайной величиной, распределённой по нормальному закону распределения. Оно названо нормальным, т. к. именно это распределение для случайной величины является обычным и называется гаусовским или лапласским. Под распределением случайной величины понимают совокупность всех возможных значений случайной величины и соответствующих им вероятностей.

Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующим им вероятностям.

При экспериментальном исследовании какого-либо технологического процесса измеряемый результат последнего является случайной величиной, на которую оказывает влияние огромное число факторов (изменение погодных условий, самочувствие оператора, неоднородность сырья, влияние износа измерительной и стабилизирующей аппаратуры и т.д. и т.п.). Именно поэтому результат исследования является случайной величиной, распределенной по нормальному закону. Однако если исследователь какой-либо активный фактор не заметил или отнес его к неактивным, а неконтролируемое изменение этого фактора может вызвать несоразмерно большое изменение эффективности процесса и параметра, характеризующего эту эффективность, то распределение вероятности последнего может нормальному закону не подчиниться.

Точно так же приведет к нарушению нормальности закона распределения наличие в массиве экспериментальных данных грубых ошибок. Именно поэтому в первую очередь проводят анализ на наличие в экспериментальных данных грубых ошибок с принятой доверительной вероятностью.

Случайная величина будет распределена по нормальному закону, если она представляет собой сумму очень большого числа взаимно зависимых случайных величин, влияния каждой из которых ничтожно мало. Если измерения искомой величины y проведены много раз, то результат можно наглядно представить, построив диаграмму, которая показывала бы, как часто получались те или иные значения. Такая диаграмма называется гистограммой. Что бы построить гистограмму нужно разбить весь диапазон измеренных значений на равные интервалы. И посчитать сколько раз каждая величина попадает в каждый интервал.

Если измерения продолжать до тех пор, пока число измеренных значений n не станет очень большим, то ширину интервала можно сделать очень малой. Гистограмма перейдёт в непрерывную прямую, которая называется кривой распределения .

В основе теории случайных ошибок лежат два предположения:

1.при большом числе измерений случайные погрешности одинаково велики, но с разными знаками встречаются одинаково часто;

2.большие (по абсолютной величине) погрешности встречаются реже, чем малые. Т. е. вероятность появления погрешности уменьшается с ростом её величины.

Согласно закону больших чисел при бесконечно большом числе измерений n, истинное значение измеряемой величины y равно среднеарифметическому значению всех результатов измерений ỹ

Для всех m-повторностей можно записать:

Разделив это уравнение на число повторностей m, получим после подстановки:

За экспериментальную оценку истинного значения (математического ожидания) критерия оптимальности у принимается среднеарифметическая оценка результатов всех т повторностей:

Если число m велико (m→∞), то будет справедливо равенство:

Таким образом, при бесконечно большом числе измерений истинное значение измеряемой величины y равно среднеарифметическому значению ỹ всех результатов произведённых измерений: y═ỹ, при m→∞.

При ограниченном числе измерений (m≠∞) среднеарифметическое значение y будет отличаться от истинного значения, т.е. равенство y═ỹ будет неточным, а приближённым: y≈ỹ и величину этого расхождения необходимо оценить.

Если в распоряжении исследователя имеется только единичный результат измерения y k , то оценка истинного значения измеряемой величины будет менее точной. чем среднеарифметическая оценка при любом числе повторностей: |y─ỹ|<|y-yk|.

Появление того или иного значения yk в процессе измерения является случайным событием. Функция плотности нормального распределения случайной величины характеризуется двумя параметрами:

· истинным значением y;

· среднеквадратичным отклонением σ.

Рисунок – 1а – кривая плотности нормального распределения; 1б –кривая плотности вероятности нормально распределенной случайной величины при различных дисперсиях

Плотность нормального распределения (рис. 1а) симметрична относительно y и достигает максимального значения при yk= y, стремится к 0 при увеличении.

Квадрат среднеквадратичного отклонения называется дисперсией случайной величины и является количественной характеристикой разброса результатов вокруг истинного значения y. Мера рассеяния результатов отдельных измерений yk от среднего значения ỹ должна выражаться в тех же единицах, то и значения измеряемой величины. В связи с этим в качестве показателя разброса гораздо чаще используют величину σ:

Значения этой величины определяют форму кривой распределения py. Площади под тремя кривыми одинаковы, но при малых значения σ кривые идут более круто и имеют большее значение py. С увеличением σ значение py уменьшается и кривая распределения растягивается вдоль оси y. Т.о. кривая 1 характеризует плотность распределения случайной величины, воспроизводимость которой в повторных измерениях лучше, чем воспроизводимость случайных величин имеющих плотность распределения 2, 4. На практике не возможно произвести слишком много замеров. Поэтому нельзя построить нормальное распределение, чтобы точно определить истинное значение y. В этом случае хорошим приближением к истинному значению можно считать ỹ, а достаточно точной оценкой ошибки выборочную дисперсию ρ²n, вытекающую из закона распределения, но относящуюся к конечному числу измерения. Такое название величины ρ²n объясняется тем, что из всего множества возможных значений yk, т.е. из генеральной совокупности выбирают лишь конечное число значений равное m, называемых выборкой, которая характеризуется выборочным средним значением и выборочной дисперсией.


7. Экспериментальные оценки истинных значений измеряемой случайной величины и её среднеквадратичного отклонения

Если в распоряжении исследователя находится конечное число независимых результатов повторности одного и того же опыта, то он может получить лишь экспериментальные оценки истинного значения и дисперсии результата опыта.

Оценки должны обладать следующими свойствами:

1.Несмещённости, проявляющейся в том, что теоретическое среднее совпадает с истинным значением измеряемого параметра.

2.Состоятельности, когда оценки при неограниченном увеличении числа измерений могут иметь сколь угодно малый доверительный интервал при доверительной вероятности.

3.Эффективности, проявляющейся в том, что из всех несмешанных оценок данная оценка будет иметь наименьшее рассеяние (дисперсию).

Экспериментальная оценка среднеквадратичного отклонения обозначается S с указанием в скобках символа анализируемой величины, т.е.

S (yk) – среднеквадратичного отклонение единичного результата.

S (y) – среднеквадратичное отклонение среднего результата.

Квадрат экспериментальной оценки среднеквадратичного отклонения S² является экспериментальной оценкой дисперсии:

Для обработки результатов наблюдения можно использовать следующую схему:

Определение среднего значения полученных результатов:


Определение отклонения от среднего значения для каждого результата:

Эти отклонения характеризуют абсолютную ошибку определения. Случайные ошибки имеют разные знаки, когда значение результата опыта превышает среднее значение, ошибка опыта считается положительной, когда значение результата опыта меньше среднего значения, ошибка считается отрицательной.

Чем точнее произведены измерения, тем ближе значение отдельных результатов и среднее значение.

Если по m результатам рассчитывают оценку истинного значения , а затем, используя те же результаты, рассчитывают оценки абсолютных отклонений:

то оценку дисперсии единичного результата находят по зависимости:

Разность между числом т независимых результатов у к и числом уравнений, в которых эти результаты уже были использованы для расчета неизвестных оценок, называют числом степеней свободы f :

Для оценки дисперсии эталонного процесса f=m.

Поскольку средняя оценка является более точной, чем единичная у к, дисперсия средних будет меньше дисперсииединичных результатов в m раз, если рассчитано по всем m единичным результатам у к :

Если в распоряжении исследователя имеется экспериментальная оценка дисперсии S 2 (y к) с небольшим конечным числом степеней свободы, то доверительные ошибки рассчитывают с помощью критерия Стьюдента t(P; f):

,

где Р – доверительная вероятность (Р=1-q, q– уровень значимости).

Проверка надёжности полученных результатов по критерию Стьюдента для проведенного числа опытов m при избранной доверительной вероятности (надёжности) Р=0,95; 0,99. Это значит, что 95% или 99% абсолютных отклонений результатов лежит в указанных пределах. Критерий t(P; f) с доверительной вероятностью Р показывает во сколько раз модуль разности между истинным значением определённой величины y и средним значением ỹ больше стандартного отклонения среднего результата.


8. Определение грубых ошибок среди результатов повторностей опыта

При статистическом анализе экспериментальных данных для процессов, негативный результат которых не создает ситуаций, опасных для жизни людей или утраты больших материальных ценностей, доверительная вероятность обычно принимают равной Р=0,95

Среди результатов y k повторностей опыта могут быть результаты, значительно отличающиеся от других. Это может быть связано либо с какой-то грубой ошибкой, либо с неизбежным случайным влиянием неучтенных факторов на результат данной повторности опыта.

Признаком наличия «выделяющегося» результата среди других является большая величина отклонения │▲y k │= y k – yˉ.

Если ▲y k >y пред, то такие результаты относятся к грубым ошибкам. Предельное абсолютное отклонение определяют в зависимости от сложившейся ситуации различными методами. Если, например, проводиться статистический анализ экспериментальных данных опыта с эталонным процессом (известно истинное значение результата опыта и ▲y k =y k -y) и если исследователь имеет в своем распоряжении оценку дисперсии S 2 (y k) с таким большим числом степеней свободы, то может принять f→∞ и S 2 (y k)=σ 2 , то для определения грубых ошибок можно применить правило «2-х сигм»: все результаты, абсолютные отклонения которых по модулю превышают величину двух среднеквадратичных отклонений с надежностью 0,95 считаются грубыми ошибками и исключаются из массива экспериментальных данных (вероятность исключения достоверных результатов равна уровню значимости q=0,05).

Если доверительная вероятность отличается от 0,95 то пользуются правилом «одной сигмы» (Р=0,68) или правилом «трех сигм» (Р=0,997), или по заданной вероятности Р=2Ф(t) – 1 находят Ф(t) по справочным данным и параметр t, по которому и рассчитывают абсолютное отклонение:

Если в распоряжении исследователя имеется лишь приближенная оценка дисперсии с небольшим (конечным) числом степеней свободы, то применение правила «сигм» может привести либо к необоснованному исключению достоверных результатов либо к необоснованному оставлению ошибочных результатов.

В этой ситуации для определения грубых ошибок можно применить критерий максимального отклонения r max (P, m), взятый из соответствующих таблиц. Для этого r max сравнивают с величиной r, равной

(22)

Если r > r max , то данный результат должен исключаться из дальнейшего анализа, оценка y ˉ должна быть пересчитана, изменяются абсолютные отклонения ▲y k и соответственно оценка дисперсии S 2 (y k) и S 2 (yˉ). Анализ на грубые ошибки повторяют при новых значениях оценок yˉ и S 2 (y k), прекращают его при r <= r max .

При пользовании формулой (22) следует применять оценку дисперсии, полученную по результатам повторностей опыта, среди которых находится сомнительный результат.

Для определения грубых ошибок существуют и другие методы, среди которых наиболее быстрым является метод «по размаху» , основанный на оценке максимальных различий полученных результатов. Анализ по этому методу проводят в такой последовательности:

1)располагают результаты y k в упорядоченный ряд, в котором максимальному результату присваивается номер первый (y1), а максимальному – наибольший (y m).

2)Если результатом, вызывающим сомнение, будет y m , рассчитывают отношение

(23)

если сомнительным результатом будет y 1 – отношение

3)при заданном уровни значимости q и известном числе повторностей m по приложению 6 находят табличное значение критерия α Т.

4)если α > α Т, то подозреваемый результат является ошибочным и его следует исключить.

После исключения грубой ошибки находят по таблице новую величину α Т и решают судьбу следующего «подозреваемого» результата, сравнивая α Т и рассчитанный для него α.

Если есть основание предполагать, что 2 наибольших (2 наименьших) результата являются «промахами», то их можно выявить в один прием, используя соответствующий столбец таблицы приложения 6 для определения α Т и рассчитывая α по формуле:

(25)


Средневзвешенные оценки дисперсии. Анализ однородности исходных оценок дисперсии

Если в распоряжении экспериментатора имеются результаты многократных измерений величин критерия оптимальности в опытах при различных условиях ведения процесса, то появляется возможность расчета средневзвешенной оценки дисперсии единичного результата, единой для всех опытов эксперимента.

В каждом из N опытов (номер опыта и = 1+ N ) оценка дисперсии единичного результата равна

где т и – число повторностей и-го опыта.

Средневзвешенная оценка дисперсии единичного результата рассчитывается по всем оценкам дисперсии единичного результата опытов:

а) при различных т и


где - число степеней свободы средневзвешенной оценки дисперсии; т и – 1 = f u – «вес» соответствующей и-ой оценки дисперсии, равный числу степеней свободы f u ;

б) прит и = т = const

где N(m-1)=f– число степеней свободы средневзвешенной оценки дисперсии.

Прежде чем пользоваться соотношениями (28) и (29) для расчета средневзвешенных уточненных оценок дисперсии (чем больше число степеней свободы, тем более точной будет оценка дисперсии), надо доказать однородность исходных оценок дисперсии.

Определение «однородные» в статистике означает «являющиеся оценкой одного и того же параметра» (в данном случае – дисперсии σ 2).

Если измеряемая случайная величина у ик распределена по нормальному закону во всем исследуемом диапазоне, то независимо от значений и дисперсия σ не будет изменять своей величины и оценки этой дисперсии должны быть однородными. Однородность этих оценок проявляется в том, что они могут отличаться друг от друга лишь незначительно, в пределах, зависящих от принятой вероятности и объема экспериментальных данных.

Если т и = т и f = const, то однородность оценок дисперсий можно проанализировать при помощи критерия Кохрена G kp . Вычисляют отношение максимальной дисперсии S 2 ( y uk ) max к сумме всех дисперсий


и сравнивают это отношение с величиной критерия Кохрена G kp ( P ; f ; N ). Если G < Gkp , то оценки однородны.

Таблица значений критерия Кохрена в зависимости от числа степеней свободы числителя f u , числа сравниваемых дисперсий N и принятого уровня значимости q = 1 – Р дана в приложении.

Если число повторностей в опытах различно ( f lt const), однородность оценок дисперсии можно проанализировать с помощью критерия Фишера F Т. Для этого из N оценок дисперсии выбирают 2: максимальную S 2 (y uk) max и минимальную S 2 (y uk) min . Если вычисленное значение F их отношения меньше Ft ,

то все N оценок дисперсии будут однородны.

Значения критерия Фишера F T даны в приложении в зависимости от принятого уровня значимости q и числа степеней свободы f 1 иf 2 оценок S 2 (y uk) max и S 2 (y uk) min соответственно.

Если оценки дисперсии непосредственно измеряемого параметра у оказались неоднородными, т.е. оценками различных дисперсий, то средневзвешенная оценка не может быть рассчитана. И кроме того, величины у к уже нельзя считать подчиняющимися нормальному закону, при котором дисперсия может быть лишь одной и неизменной при любом у.

Причиной нарушения нормального закона распределения может быть наличие оставшихся грубых ошибок (анализ на грубые ошибки либо не проводился, либо проведен недостаточно тщательно).

Другой причиной может быть наличие активного фактора, ошибочно отнесенного исследователем к неактивным и не снабженного системой стабилизации. Поскольку условия изменились, этот фактор стал значимо влиять на процесс.


9. Планирование и обработка результатов однофакторных экспериментов

9.1 Формализация экспериментальных данных методом наименьших квадратов

Влияние какого-либо фактора на выход процесса может быть выражено зависимостью у = f(C). Если конкретному значению С и соответствует единственное значение у и, то такая зависимость называется функциональной. Эту зависимость получают путем строгих логических доказательств, не нуждающихся в опытной проверке. Например, площадь квадрата ω может быть представлена функциональной зависимостью от размера стороны квадрата а: ω = а 2 .

Если у и остается неизменным в то время как С и изменяется, то у не зависит от С. Например, угол при вершине квадрата равный π/2, не зависит от размера стороны а и.

Если для оценки величин у и и С и используются данные наблюдений, величины случайные, то функциональная зависимость между ними существовать не может.

Измерив отдельно сторону а и площадь ω квадрата, можно убедиться, что полученные результаты не могут быть представлены с абсолютной точностью зависимостью ω = а 2 .

К формализации экспериментальных данных, т.е. построению по ним описывающей процесс зависимости, исследователь прибегает, когда не может составить эвристическую (детерминированную) математическую модель из-за недостаточного понимания механизма процесса или его чрезмерной сложности.

Полученная в результате формализации экспериментальных данных эмпирическая математическая модель имеет меньшую ценность, чем отражающая механизм процесса эвристическая математическая модель, которая может предсказать поведение объекта за пределами изученного диапазона изменения переменных.

Приступая к эксперименту с целью получения эмпирической математической модели, исследователь должен определить необходимый объем опытных данных с учетом количества принятых к исследованию факторов, воспроизводимости процесса, предполагаемой структуры модели и обеспечения возможности проверки адекватности уравнения.

Если по результатам эксперимента, состоящего из двух опытов, получено линейное однофакторное уравнение у = b 0 + b 1 С , то построенная по этому уравнению прямая обязательно пройдет через эти экспериментальные точки. Следовательно, для того чтобы проверить, насколько хорошо эта зависимость описывает данный процесс, надо поставить опыт хотя бы еще в одной точке. Этот дополнительный опыт дает возможность осуществить корректную процедуру проверки пригодности уравнения. Однако проверку обычно проводят не по одной дополнительной точке, которая не участвовала в определении коэффициентов уравнения, а по всем экспериментальным точкам, число которых (N) должно превышать число коэффициентов уравнения (N ")

Так как N > N ", решение такой системы требует специального подхода.

9.2 Симметричный и равномерный план однофакторного эксперимента

Задача в значительной степени упростится, если при планировании эксперимента, можно будет обеспечить условие:

При натуральной размерности факторов выполнить условие ΣC u =0 невозможно, т. к. в этом случае величина фактора должна иметь как положительные значения, так и отрицательные.

Если же точку отсчета величины фактора перенести в середину диапазона изменения фактора (центр эксперимента)

то появляется возможность удовлетворить условию в виде , где С " u =С u – С 0.

Для равномерного плана С u – С (u -1) = λ = const,

где λ – интервал варьирования фактора.

Условие может быть выполнено, если для обозначения величины фактора использовать безразмерные выражения:

отсюда легко увидеть, что условие эквивалентно условию и такие планы называют симметричными.

При составлении плана диапазон фактора ориентировочно ограничивают величинами С min и С max , назначенными после изучения литературы по теме исследования. От опыта к опыту предусматривают такое изменение величины фактора, которое позволило бы достоверно уловить имеющимися в распоряжении исследователя приборами изменение выхода процесса .

С учетом величины λ и диапазона (С max – C min) определяют число опытов, округляя его до нечетного N:


.

Затем определяют величины факторов в каждом из N опытов и уточняют исследуемый диапазон фактора С N – С 1:

=,

где х u – безразмерное выражение фактора, аналогичное полученному по соотношению

Для расчета коэффициентов уравнения используем формулу:

множители а ju и знаменатель l j берем из приложения.

Число опытов эксперимента может быть четным или нечетным, и, как правило, должно быть больше числа коэффициентов N" уравнения.

Чем больше разность (N – N"), тем с большей точностью можно получить оценки коэффициентов данного уравнения и тем в большей степени эти оценки будут освобождены от влияния случайных неуточненных факторов.

Краткое описание

Факторным называется такой план, согласно которому одновременно изучается влияние на зависимую переменную двух или более факторов. Т. к. несколько факторов рассматриваются в рамках одного плана, то в добавление к возможности оценить их воздействие на зависимую переменную по отдельности (главные эффекты) появляется возможность измерить эффекты их совместного влияния на эту переменную (взаимодействия).
Дробные 2**(k-p) факторные планы, вероятно, наиболее часто используемые планы в промышленных экспериментах. Предмет рассмотрения любого 2**(k-p) дробного факторного эксперимента включает число исследуемых факторов, число опытов в эксперименте и наличие блоков опытов эксперимента. После этих основных вопросов следует также определить, позволяет ли число опытов найти план требуемого разрешения и степень смешивания для критического порядка взаимодействий, для данного разрешения.

Введение
1 Простые факторные планы
2 Простые сравнивающие эксперименты
Вывод
Список использованных источников

Содержимое работы - 1 файл

Критерий минимальной аберрации плана. Критерий минимальной аберрации плана является другим необязательным критерием, используемым при поиске 2**(k-p) плана. В некоторых отношениях этот критерий похож на критерий максимальной несмешанности. Формально план с минимальной аберрацией определяется как план с максимальным разрешением "с минимальным числом слов в определяющем взаимоотношении, которое имеет минимальную длину" (Fries & Hunter, 1984). Менее формально, действие критерия основано на выборе генераторов, которые дают наименьшее число пар смешанных взаимодействий критического порядка. Например, план разрешения IV с минимальной аберрацией имел бы минимальное число пар смешанных 2-факторных взаимодействий.

Для пояснения различия между критериями максимальной несмешанности и минимальной аберрации рассмотрим максимально несмешанный план 2**(9-4) и план 2**(9-4) с минимальной аберрацией, как в примере, данном Box, Hunter, и Hunter (1978). Если вы сравните эти два плана, вы увидите, что в максимально несмешанном плане 15 из 36 2-факторных взаимодействий не смешаны с любыми другими 2-факторными взаимодействиями, в то время как в плане с минимальной аберрацией только 8 из 36 2-факторных взаимодействий не смешаны с любыми другими 2-факторными взаимодействиями. План с минимальной аберрацией, однако, дает 18 пар смешанных взаимодействий, в то время как максимально несмешанный план дает 21 пару смешанных взаимодействий. Таким образом, эти критерии приводят к выделению генераторов, дающих различные "лучшие" планы.

К счастью, выбор между критерием максимальной несмешанности и критерием минимальной аберрации не вносит различия в выбранном плане (за исключением, возможно, переобозначения факторов), когда имеется 11 или меньше факторов, - единственное исключение составляет план 2**(9-4), описанный выше (смотрите Chen, Sun, & Wu, 1993). Для планов с более чем 11 факторами оба критерия приводят к весьма различным планам, и нет лучшего совета, как использовать оба критерия, а затем сравнить полученные планы и выбрать план, наиболее отвечающий вашим потребностям. Добавим, что максимизация числа полностью несмешанных эффектов часто имеет больший смысл, чем минимизация числа пар смешанных эффектов.

2 Простые сравнивающие эксперименты

Эксперименты представляют собой запланированное введение фактора в ситуацию с целью установить его связь с изменением в данной ситуации. Вводимый фактор обычно называют вмешательством, воздействием и ли независимой переменной; тогда наблюдаемое изменение будет мерой зависимой переменной. Эксперименты включают подробное описание того, сколько (и каких) групп испытуемых должно быть создано и каким образом предполагается исключить наиболее правдоподобные альтернативные объяснения. Главные задачи сравнивающих экспериментов - связать вмешательство с эффектом и исключить все другие объяснения наблюдаемого изменения. Простейшие эксперименты заключаются в воздействии, оказываемом на одного испытуемого или группу испытуемых, вместе с наблюдениями до и после этого воздействия, проводимыми с целью установления изменение в их состоянии. Эксперименты используются не только для установления связи переменных с их эффектами, но и для исключения альтернативных объяснений, в которых, если употреблять терминологию теории планирования эксперимента, переменные смешиваются. Только когда мы разделяем эти эффекты, мы можем приписать наблюдаемое изменение определенному воздействию, например, цвету фона дисплея; в противном случае мы вынуждены прибегать к смешанному альтернативному объяснению, например, приписывая то же самое изменение влиянию практики. На языке теории планирования эксперимента мы бы сказали, что контролируем смешивание переменных. Как можно этого добиться? Существует четыре общепринятых метода контроля: а) исключение смешиваемого фактора; б) измерение эффекта смешиваемого фактора и введение соответствующей поправки; в) сравнение эквивалентных ситуаций, одна из которых подвергается влиянию смешиваемой переменной и экспериментальному воздействию, тогда как на другую влияет только смешиваемая переменная ; г) варьирование эксперимента воздействия при поддержании смешиваемой переменной на одном уровне, чтобы посмотреть, соответствует ли изменение эффекта схеме изменения воздействия. Несмотря на то, что существуют и др. методы контроля, чаще всего используются именно эти четыре. Базисная логика экспериментальных планов. 1. Стабилизировать ситуацию, ввести воздействие и наблюдать изменение. 2. Если ситуация не может быть стабилизирована и изменяется, то проследить характер изменений, ввести воздействие и установить, привело ли оно к каким-либо нарушениям в характере изменений. 3. Стабилизировать две (или более) эквивалентные ситуации; выбрать одну из них и поддерживать ее постоянство на одном уровне с оставшейся (или оставшимися), за исключением эксперимента воздействия; ввести экспериментальное воздействие в другую ситуацию (или его варианты в оставшиеся ситуации) и отметить различия. 4. Соотнести схему подачи/прекращения эксперимента воздействия с характером наблюдаемого изменения; если можно измерить степень воздействия или силу вмешательства, то соотнести силу или интенсивность вмешательств а с таким релевантным аспектом как величина или предел изменения. (Этот принцип работает только в том случае, если зависимая переменная возвращается в прежнее состояние при прекращении вмешательства, но не действует в таких ситуациях как ситуация научения, эффекты которого отличаются устойчивостью .) Случайное распределение испытуемых на эксперименте и контрольную группы гарантирует, что эти группы, в среднем, "совместно уравниваются по каждому условию", включительно и предположительно связанные с изучаемым явлением , и непредвиденные, даже иррелевантные условия, такие как число кожных пор и длина ногтей. Действительно, Кэмпбелл и Стэнли считают случайное распределение испытуемых по группам довольно важным вследствие того, что оно обеспечивает защиту от "скрытых" переменных, и называют планы, в которых оно не используется, "квазиэкспериментальными", в отличие от использующих его "подлинно экспериментальных планов". Такие факторы как уровень образования, способность к научению, мотивация и социоэкономический статус , часто оказываются альтернативными объяснениями, которые хотели бы исключить посредством обеспечения эквивалентности групп. Это достигается путем стратификации, формирования блоков или попарного уравнивания на основе измерения этих переменных с последующим случайным распределением испытуемых по экспериментам и контрольным группам. Логика сохранения общности всех условий за исключением одного используется и в более сложных планах, таких, например, как факторные. Такие планы позволяют одновременно проверять эффект нескольких переменных, но в них всегда есть одна или более групп, которые отличаются от другой или других групп испытуемых только одним условием или переменной. Милль отмечал, что когда одно явление изменяется по мере изменения другого, то либо одно из них является причиной, а другое следствием (или наоборот), либо оба они связаны с общей причиной. Этой логике следуют такие планы как план с разрывом регрессии (служащим признаком экспериментального эффекта) и план типа АБА/АБАБ, а также корреляционные исследования, цель которых - выяснить насколько тесно величина одной переменной связана с величиной другой переменной. Сделать вывод о причинности на основе корреляции весьма затруднительно, так как ковариация может быть обусловлена действием третьей переменной.

Вывод

Экспериментальные методы широко используются как в науке, так и в промышленности, однако нередко с весьма различными целями. Обычно основная цель научного исследования состоит в том, чтобы показать статистическую значимость эффекта воздействия определенного фактора на изучаемую зависимую переменную.

В условиях промышленного эксперимента основная цель обычно заключается в извлечении максимального количества объективной информации о влиянии изучаемых факторов на производственный процесс с помощью наименьшего числа дорогостоящих наблюдений. Если в научных приложениях методы дисперсионного анализа используются для выяснения реальной природы взаимодействий, проявляющейся во взаимодействии факторов высших порядков, то в промышленности учет эффектов взаимодействия факторов часто считается излишним в ходе выявления существенно влияющих факторов.

Основные принципы планирования эксперимента, обеспечивающие получение максимума информации при минимуме опытов. Отказ от полного перебора возможных входных состояний. Выбор числа уровней варьирования по каждому фактору на основании вида аппроксимации функции отклика. Принцип последовательного планирования, предусматривающий получение простейшей математической модели на основании небольшого числа опытов и, если полученная модель не удовлетворяет исследователя, постепенное усложнение математической модели на основе проведения новых (дополнительных) опытов до тех пор, пока не будет получена модель, которую исследователь признает достаточно хорошей.

Список использованных источников

  1. Encyclopedia of Computer Science. 4th edition. 2000. Grove"s Dictionaries N.Y.
  2. Белоцерковский О.М. 1994. Численное моделирование в механике сплошных сред. М.: Наука
  3. Петров А. А. 1996. Экономика. Модели. Вычислительный эксперимент. М.: Наука
  4. Самарский А.А., Михайлов А.П.. 1997. Математическое моделирование. Идеи. Методы. Примеры. - М., Наука.
  5. Буянов Б. Б., Легович Ю. С., Лубков Н. В., Поляк Г.Л. 1996. Построение систем подготовки управляющих решений с использованием имитационного моделирования Приборы и системы управления. 12: 36 - 40.
  6. Бахур А.Б. 2000. Системные идеи в современной инженерной практике. М.: Пров-пресс.
  7. Попов Ю. П., Самарский А.А. 1983. Вычислительный эксперимент. М. Знание.
  8. Трахтенгерц Э. Л. 1998. Компьютерная поддержка принятия решений. М., Синтэг.
  9. Мандель А.С. 1996. Экспертно-статистические системы в задачах управления и обработки информации. Часть I. Приборы и системы управления. 12: 34-36.

Статистический подход, рассмотренный в предыдущем разделе, можно использовать в любом случае, когда требуется выяснить, отличается ли реально или, во всяком случае, статистически значимо некоторая полученная в эксперименте величина - среднее значение, коэффициент корреляции и т. п. от ее теоретического значения. Нас, скажем, может интересовать, достаточно ли отличается от 0,5 наблюдаемая частота рекомбинаций между двумя генетическими локусами в потомстве от возвратного скрещивания для того, чтобы можно было заключить, что данные локусы лежат в одной и той же хромосоме. Или, например, требуется выяснить, значимо ли статистически наблюдаемое различие между числом образующихся мужских и женских гамет. Далее, может возникнуть необходимость в определении частоты случаев выздоровления после какого-то заболевания - либо при испытании того или иного препарата, либо при сравнении эффективности двух препаратов. Замечательная особенность такого статистического анализа состоит в том, что все виды неизбежной естественной изменчивости, составляющей как бы «фон», на котором проявляется изменчивость, связанная с исследуемым фактором, учитываются в комплексе путем использования соответствующего распределения вероятностей.

Если фоновая изменчивость очень велика, то для получения окончательных результатов может потребоваться очень большое число наблюдений, а когда она сравнительно мала, результат будет получен значительно быстрее.

Если какой-либо эффект вызывается очень большим числом различных факторов, то вполне возможно, что фоновая изменчивость будет весьма велика. В таких случаях целесообразно попытаться выделить некоторые из этих факторов, даже если их невозможно полностью контролировать или исключить. Часто оказывается возможным разбить общую изменчивость на отдельные компоненты, из которых один соответствует исследуемому фактору, несколько других - другим воздействиям, допускающим возможность раздельной оценки, и последний - остальным воздействиям, раздельная оценка которых невозможна. Поскольку влияние последней группы факторов, безусловно, будет слабее, чем влияние исследуемого фактора, то это обеспечивает более точную статистическую проверку. Искусство располагать наблюдения в определенном порядке или проводить специально спланированные проверки с целью полного использования возможностей этих методов и составляет содержание предмета «планирование эксперимента». Детальное изложение существующих методов планирования эксперимента можно найти в литературе (см., например, ). В настоящем разделе мы осветим лишь некоторые основные преимущества сознательного и продуманного планирования эксперимента.

Допустим, например, что требуется сравнить болеутоляющее действие двух различных лекарственных препаратов А и В. Пусть подобрано 16 больных и принято решение разделить их случайным образом (во избежание какой-либо сознательно или непроизвольно вносимой систематической ошибки) на две группы, по 8 больных в каждой. Одна группа получает препарат А, а другая - препарат В. Затем измеряют время, в течение которого каждый из больных испытывает облегчение, и сравнивают средние значения по обеим группам. Если среднее время для препарата А значимо превышает среднее время для препарата В, то можно сделать вывод, что первый препарат более эффективен. (В данном случае несущественно, какой статистический критерий используется. Поскольку рассматривается небольшое число объектов, это может быть один из критериев Стьюдента.) Известно, что больные по-разному реагируют на один и тот же лекарственный препарат, поэтому продолжительность периода облегчения обычно сильно варьирует, что значительно понижает точность сравнения этих двух препаратов.

Однако в данном эксперименте различия между больными не представляют для нас особого интереса, и этот источник погрешности можно исключить следующим образом. Вместо того чтобы делить больных на две группы, проверяют на каждом из них оба препарата, назначая их последовательно через достаточно большие промежутки времени (чтобы избежать взаимодействия) и в случайном порядке (или, возможно, в одном порядке для одной половины больных и в другом порядке для другой). Теперь для каждого больного определяют относительное преимущество препарата А перед препаратом В, для чего вычисляют суммарную продолжительность периода облегчения для каждого из них и находят разность этих двух величин. Таким образом получают 16 чисел, характеризующих относительное преимущество одного препарата перед другим, что позволяет проверить, значимо ли отличается от нуля их среднее значение. Положительная разность свидетельствует о статистически значимом преимуществе препарата А, отрицательная - об обратном соотношении. Рассматривая показатели относительного преимущества, мы исключаем влияние реакции отдельных больных и в общем случае добиваемся более эффективного сравнения этих двух лекарств.

Такая простая проверка методом попарного сравнения представляет собой простейший план эксперимента, имеющий целью извлечь максимальное количество информации из данного числа наблюдений. Заметим, что этот план имеет и свои дополнительные особенности, так как требует особого внимания к ряду практических вопросов, например к тому, чтобы препараты назначались в случайном порядке (во избежание нежелательной систематической ошибки) и через достаточно большие промежутки времени (для исключения эффектов взаимодействия); однако здесь мы не можем детально рассматривать эти вопросы.

Мы показали, каким образом при проверке методом попарного сравнения можно контролировать или исключать из рассмотрения какой-либо один важный и явный источник изменчивости. В более общем случае могут быть спланированы факторные эксперименты, с помощью которых можно определить вклад каждого из нескольких факторов в общую изменчивость. Некоторые из этих факторов могут представлять особый интерес, тогда как другие имеют второстепенное значение. Идея и практическое применение этого нового подхода, принадлежащего главным образом Р. Фишеру, получили широкое распространение после появления его книги «Планирование экспериментов», вышедшей первым изданием в 1935 г. Большинство фундаментальных работ в области планирования эксперимента было посвящено сельскохозяйственным приложениям.

Допустим, требуется сравнить среднюю урожайность нескольких сортов пшеницы при применении различных удобрений в различной концентрации, учитывая при этом колебания в плодородии почвы на достаточно больших участках земли, которые можно разбить на делянки подходящих размеров. Для начала можно попытаться составить план эксперимента, в котором будут рассматриваться все возможные комбинации значений, или уровней, различных факторов. Так, если имеются четыре сорта пшеницы и три различных вида удобрений, применяемых в трех различных концентрациях, то общее число комбинаций условий будет равно 36. Таким образом, исходное число делянок в одном блоке факторного эксперимента будет равно 36 - по одной делянке на каждую комбинацию условий. Вследствие возможного колебания в плодородии почвы от одного блока к другому может оказаться целесообразным иметь не менее двух полных блоков.

Применение факторного плана вместо классической схемы, согласно которой каждый раз изменяется только один фактор, имеет ряд серьезных и даже несколько неожиданных преимуществ. Прежде всего в этом случае становится значительно более полной картина влияния каждого фактора, поскольку оно изучается в самых различных условиях (вследствие одновременного изменения других факторов). Во-вторых, большое число комбинаций факторов, используемых в эксперименте, облегчает предсказание результатов, которые могут быть достигнуты при определенной комбинации условий. В-третьих, если эффекты, вызываемые каждым фактором, включаемым в эксперимент, статистически независимы, то о каждом факторе можно получить не меньше информации, чем если бы в процессе эксперимента изменялся только один этот фактор, а остальные оставались постоянными. В-четвертых, если (как это часто бывает) различные факторы не являются независимыми, а вызывают эффекты, которые в большей или меньшей степени коррелированы, то в этом случае только факторный эксперимент может дать информацию о характере этих взаимодействий. При наличии нескольких взаимосвязанных существенных факторов обойтись без постановки факторного эксперимента невозможно. Для ряда часто встречающихся специальных задач разработано большое число стандартных планов такого типа.

Согласно некоторым из этих простейших планов, эксперимент проводят на нескольких блоках и внутри каждого из них на отдельных делянках проверяют влияние всех уровней какого-то одного фактора. При правильном планировании получают рандомизированный блочный план. В сельскохозяйственных задачах блоками могут служить участки земли на различных полях, а уровнями одного фактора - ступенчатая последовательность концентраций удобрений или просто различные сорта пшеницы.

В лабораторном эксперименте, в котором, скажем, проверяется влияние различных рационов питания на крыс, рационы питания будут испытываемыми условиями, а крысы - отдельными экспериментальными единицами (соответствующими делянкам в сельскохозяйственном эксперименте). Если бы мы могли использовать в эксперименте животных отдельных пометов, подвергая каждому воздействию по одному животному из каждого помета, то каждый помет можно было бы рассматривать как отдельный блок.

В рассмотренной выше простой проверке методом попарного сравнения также можно было бы применить рандомизированный блочный план; тогда каждого больного можно было бы рассматривать как отдельный блок, а лекарственные препараты - как условия эксперимента.

Хотя иногда бывает трудно перенести планы экспериментов, разработанные для одной области, особенно для сельского хозяйства, в совершенно другую область, лежащая в их основе логическая схема часто оказывается весьма сходной. Поэтому целесообразно тщательно обдумать возможность того, чтобы при надлежащей интерпретации элементов какого-либо определенного плана эксперимента можно было обеспечить его успешное применение в задачах совершенно иного характера. Это иллюстрирует большие возможности математических методов планирования эксперимента. В основе планирования должна, разумеется, лежать некоторая исходная математическая модель. Опишем самую простую из них, которая в том или ином варианте используется наиболее широко. Пусть требуется исследовать влияние только двух факторов А и В. Допустим, что наблюдаемое на некоторой экспериментальной единице влияние уровня фактора А и уровня фактора В можно записать в виде

где - наблюдаемая величина, - общее среднее, - относительные вклады этих двух факторов при заданных уровнях каждого из них, - случайное изменение, налагаемое на основную линейную аддитивную схему. Кроме того, часто принимается, что все величины имеют одно и то же нормальное распределение и независимы друг от друга. Эти ограничения весьма серьезны, однако часто принятие их в качестве первого приближения вполне оправданно. Так, если влияние этих факторов мало, то заметную величину будут иметь только линейные члены и возможными членами второго порядка можно пренебречь. При независимости факторов формула (2.4) вполне удовлетворительна. Но если они взаимодействуют друг с другом, то следует включить в нее дополнительные члены с, учитывающие это взаимодействие.

Можно, однако, выполнить проверку значимости на основе формулы (2.4), чтобы убедиться, нужны ли члены, характеризующие взаимодействие. Кроме того, если случайные величины не распределены по нормальному закону, то можно использовать какую-либо функцию эмпирических результатов (например, квадратные корни или логарифмы), для которой сохраняется нормальный закон распределения.

На основе элементарной формулы (2.4) легко построить модели, учитывающие множество факторов, блоков, взаимодействий и других усложнений, вызываемых практической необходимостью в каждом данном эксперименте. Дело в том, что в очень многих случаях необходимые вычисления относительно просты и выполняются непосредственно. Обычно приходится производить повторяющиеся вычисления сумм и сумм квадратов данных, выбранных соответствующим образом. Результаты представляют в виде таблицы дисперсионного анализа, с помощью которой можно установить значимость всех различных факторов, влияющих на результаты эксперимента.

Одним из современных вариантов планирования экспериментов, который следует рассмотреть особо, является последовательностная схема эксперимента. В эксперименте стандартного типа необходимо заранее решить, сколько наблюдений нужно набрать. Если после анализа обнаружится, что число наблюдений слишком мало, то нужно попытаться продолжить эксперимент, однако может оказаться, что на данном этапе сделать это трудно или невозможно. Если же выяснится, что получено значительно больше наблюдений, чем необходимо для достижения требуемой точности, то будут потеряны время и деньги. В медицинских задачах это имеет особенно существенное значение. Ни один врач не заинтересован в том, чтобы эксперимент длился дольше, чем это строго необходимо, так как его цель - дать своим больным наилучший из существующих препаратов, как только он пройдет клинические испытания. Таким образом, в медицине выбор и планирование эксперимента теснейшим образом связаны с этическими соображениями. Последовательностная схема предусматривает проведение эксперимента отдельными сериями. Оценка результатов производится на каждом этапе, с тем чтобы немедленно можно было решить, применять препарат А, препарат В или же продолжать эксперимент, поскольку окончательного вывода сделать еще нельзя. При такой схеме эксперимента длительность его будет минимальна и он закончится значительно раньше, чем в любом другом случае. Кроме того, в медицине часто бывает очень трудно или даже вообще невозможно провести обычную экспериментальную проверку, так как после нескольких неудачных исходов, которые могут закончиться смертью больного, начинаются острые споры о том, следует ли продолжать эксперимент вообще.

Последовательностная схема означает, что заранее можно тщательно и спокойно рассмотреть различные линии поведения, обусловливаемые различными исходами эксперимента. При этом значительно легче выбрать наилучшие решения непосредственно в ходе эксперимента и совместить требования этики со статистической эффективностью. Более детально методы последовательностного анализа в медицине рассмотрены в книге Эрмитажа .

Недостаток места не позволяет продолжать здесь изложение теории планирования эксперимента, тем более что этому предмету посвящена уже огромная литература г. Наша основная цель состояла в том, чтобы показать, каким образом с помощью простой математической модели процесса, на который одновременно воздействуют несколько факторов (носящих, возможно, в значительной мере вероятностный характер), можно с достаточной точностью выяснить степень влияния каждого из этих факторов в отдельности. Это позволяет применять для проверки значимости влияния крайне изменчивых и одновременно действующих факторов простые статистические критерии, описанные в разд. 2.2. А именно такой подход и необходим для исследования всего огромного многообразия явлений, встречающихся в биологии и медицине.


Загрузка...