Оптимальная форма управления. Оптимальное управление
6.2.1. Постановка и классификация задач теории оптимального управления. В подавляющем большинстве рассмотренных нами задач факторы, связанные с изменением изучаемых объектов и систем в течение времени, выносились за скобки. Возможно, при выполнении определенных предпосылок такой подход является конструктивным и правомерным. Однако очевидно и то, что это допустимо далеко не всегда. Существует обширный класс задач, в которых необходимо найти оптимальные действия объекта, учитывающие динамику его состояний во времени и пространстве. Методы их решения составляют предмет математической теории оптимального управления.
В весьма общем виде задача оптимального управления может быть сформулирована следующим образом:
Имеется некоторый объект, состояние которого характеризуется двумя видами параметров - параметрами состояния и параметрами управления, причем в зависимости от выбора последних процесс управления объектом протекает тем или иным образом. Качество процесса управления оценивается с помощью некоторого функционала*, на основе чего ставится задача: найти такую последовательность значений управляющих параметров, для которой данный функционал принимает экстремальное значение.
* Функционалом называется числовая функция, аргументами которой, как правило, служат другие функции.
С формальной точки зрения многие проблемы оптимального управления могут быть сведены к задачам линейного или нелинейного программирования большой размерности, так как каждой точке пространства состояний соответствует свой вектор неизвестных переменных. Все же, как правило, движение в данном направлении без учета специфики соответствующих задач не приводит к рациональным и эффективным алгоритмам их решения. Поэтому методы решения задач оптимального управления традиционно связаны с другим математическим аппаратом, берущим свое начало от вариационного исчисления и теории интегральных уравнений. Следует также заметить, что опять-таки в силу исторических причин теория оптимального управления была ориентирована на физические и технические приложения, и ее применение для решения экономических задач носит в определенном смысле вторичный характер. В то же время в целом ряде случаев модели исследования, применяющие аппарат теории оптимального управления, могут привести к содержательным и интересным результатам.
К сказанному выше необходимо добавить замечание о тесной связи, существующей между методами, применяемыми для решения задач оптимального управления, и динамическим программированием. В одних случаях они могут использоваться на альтернативной основе, а в других довольно удачно дополнять друг друга.
Существуют различные подходы к классификации задач оптимального управления. Прежде всего, их можно классифицировать в зависимости от объекта управления:
Ø Ø задачи управления с сосредоточенными параметрами;
Ø Ø задачи управления объектами с распределенными параметрами.
Примером первых является управление самолетом как единым целым, а вторых - управление непрерывным технологическим процессом.
В зависимости от типа исходов, к которым приводят применяемые управления, выделяют детерминированные и стохастические задачи. В последнем случае результатом управления является множество исходов, описываемых вероятностями их наступления.
По характеру изменения управляемой системы во времени различают задачи:
Ø Ø с дискретно изменяющимся временем ;
Ø Ø с непрерывно изменяющимся временем .
Аналогично классифицируются задачи управления объектами с дискретным или непрерывным множеством возможных состояний. Задачи управления системами, в которых время и состояния меняются дискретно, получили название задач управления конечными автоматами . Наконец, при определенных условиях могут ставиться задачи управления смешанными системами.
Многие модели управляемых систем основаны на аппарате дифференциальных уравнений как в обыкновенных, так и в частных производных. При исследовании систем с распределенными параметрами, в зависимости от вида используемых дифференциальных уравнений в частных производных, выделяют такие типы задач оптимального управления, как параболические, эллиптические или гиперболические.
Рассмотрим два простейших примера задач управления экономическими объектами.
Задача распределения ресурсов. Имеется т складов с номерами i (i ∊1:m ), предназначенных для хранения однородного продукта. В дискретные моменты времени t ∊0:(T -l) происходит его распределение между объектами-потребителями (клиентами) с номерами j , j ∊1:n . Пополнение запаса в пунктах хранения продукта в t -й момент времени определяется величинами a i t , i ∊1:m , а потребности клиентов в нем равняются b j t , j ∊1:n . Обозначим через c t i,j - затраты на доставку единицы продукта из i -го склада j -му потребителю в момент времени t. Также предполагается, что продукт, поступивший на склад в момент t , может быть использован, начиная со следующего момента (t +l). Для сформулированной модели ставится задача найти такой план распределения ресурсов {х t i,j } T m xn , который минимизирует суммарные расходы на доставку потребителям продукции со складов в течение полного периода функционирования системы.
Обозначив через х t i,j количество продукта, поставляемое j -му клиенту с i -го склада в t -й момент времени, а через z t i - общее количество продукта на i -м складе, описанную выше проблему можно представить как задачу нахождения таких совокупностей переменных
которые обращают в минимум функцию
при условиях
где объемы начальных запасов продукта на складах z 0 i = ž i . предполагаются заданными.
Задачу (6.20)-(6.23) называют динамической транспортной задачей линейного программирования . С точки зрения приведенный выше терминологии независимые переменные х t i,j представляют собой параметры управления системой, а зависящие от них переменные z t i - совокупность параметров состояния системы в каждый момент времени t. Ограничения z t i ≥ 0 гарантируют, что в любой момент времени с любого склада не может быть вывезен объем продукта, превышающий его фактическое количество, а ограничения (6.21) задают правила изменения этого количества при переходе от одного периода к другому. Ограничения данного вида, которые задают условия на значения параметров состояния системы, принято называть фазовыми.
Отметим также, что условие (6.21) служит простейшим примером фазовых ограничений, поскольку связываются значения параметров состояния для двух смежных периодов t и t +l. В общем случае может устанавливаться зависимость для группы параметров, принадлежащих нескольким, возможно несмежным, этапам. Такая потребность может возникнуть, например, при учете в моделях фактора запаздывания поставок.
Простейшая динамическая модель макроэкономики. Представим экономику некоторого региона как совокупность п отраслей (j ∊1:п ), валовой продукт которых в денежном выражении на некоторый момент t может быть представлен в виде вектора z t =(z t 1 , z t 2 ,..., z t n ), где t ∊0:(Т -1). Обозначим через A t матрицу прямых затрат, элементы которой a t i,j , отражают затраты продукции i -й отрасли (в денежном выражении) на изготовление единицы продукции j -й отрасли в t -й момент времени. Если X t = ║x t i,j ║ n xm - матрица, задающая удельные нормы продукции i -й отрасли, идущей на расширение производства в j -й отрасли, а у t = (у t 1 , у t 2 , ..., у t n ) - вектор объемов продукции отраслей потребления, идущей на потребление, то условие расширенного воспроизводства можно записать как
где z 0 = ž - исходный запас продукции отраслей предполагается заданным и
В рассматриваемой модели величины z t являются параметрами состояния системы, а X t - управляющими параметрами. На ее базе могут быть поставлены различные задачи, типичным представителем которых является задача оптимального вывода экономики на момент Т к некоторому заданному состоянию z *. Данная задача сводится к отысканию последовательности управляющих параметров
удовлетворяющих условиям (6.24)-(6.25) и минимизирующих функцию
6.2.2. Простейшая задача оптимального управления. Один из приемов, применяемых для решения экстремальных задач, состоит в выделении некоторой проблемы, допускающей относительно несложное решение, к которой в дальнейшем могут быть сведены остальные задачи.
Рассмотрим так называемую простейшую задачу управления . Она имеет вид
Специфика условий задачи (6.27)-(6.29) состоит в том, что функции качества управления (6.27) и ограничения (6.28) являются линейными относительно z t , в то же время функция g (t , х t ), входящая в (6.28), может быть произвольной. Последнее свойство делает задачу нелинейной даже при t =1, т. е. в статическом варианте.
Общая идея решения задачи (6.27)-(6.29) сводится к ее «расщеплению» на подзадачи для каждого отдельно взятого момента времени, в предположении, что они успешно разрешимы. Построим для задачи (6.27)-(6.29) функцию Лагранжа
где λ t - вектора множителей Лагранжа (t ∊0:Т ). Ограничения (6.29), носящие общий характер, в функцию (6.30) в данном случае не включены. Запишем ее в несколько иной форме
Необходимые условия экстремума функции Ф(х, z, λ) по совокупности векторов z t задаются системой уравнений
которая называется системой для сопряженных переменных . Как можно заметить, процесс нахождения параметров λ t в системе (6.32) осуществляется рекуррентным образом в обратном порядке.
Необходимые условия экстремума функции Лагранжа по переменным λ t будут эквивалентны ограничениям (6.28), и, наконец, условия ее экстремума по совокупности векторов х t ∊Х t , t ∊1:(Т -1) должны быть найдены как результат решения задачи
Таким образом, задача поиска оптимального управления сводится к поиску управлений, подозрительных на оптимальность, т. е. таких, для которых выполняется необходимое условие оптимальности. Это, свою очередь, сводится к нахождению таких t , t , t , удовлетворяющих системе условий (6.28), (6.32), (6.33), которая называется дискретным принципом максимума Понтрягина.
Справедлива теорема.
Доказательство.
Пусть t , t , t , удовлетворяют системе (6.28), (6.32), (6.33). Тогда из (6.31) и (6.32) следует, что
и поскольку t удовлетворяет (6.33), то
С другой стороны, в силу (6.28) из (6.30) следует, что при любом векторе t
Следовательно,
Применяя теорему (6.2), а также положения теории нелинейного программирования, касающиеся связи между решением экстремальной задачи и существованием седловой точки (см. п. 2.2.2), приходим к выводу о том, что векторы t , t являются решением простейшей задачи оптимального управления (6.27)-(6.29).
В результате мы получили логически простую схему решения данной задачи: из соотношений (6.32) определяются сопряженные переменные t , затем в ходе решения задачи (6.33) находятся управления t и далее из (6.28) - оптимальная траектория состояний t ,.
Предложенный метод относится к фундаментальным результатам теории оптимального управления и, как уже это упоминалось выше, имеет важное значение для решения многих более сложных задач, которые, так или иначе, сводятся к простейшей. В то же время очевидны и пределы его эффективного использования, которые целиком зависят от возможности решения задачи (6.33).
КЛЮЧЕВЫЕ ПОНЯТИЯ
Ø Ø Игра, игрок, стратегия.
Ø Ø Игры с нулевой суммой.
Ø Ø Матричные игры.
Ø Ø Антагонистические игры.
Ø Ø Принципы максимина и минимакcа.
Ø Ø Седловая точка игры.
Ø Ø Цена игры.
Ø Ø Смешанная стратегия.
Ø Ø Основная теорема матричных игр.
Ø Ø Динамическая транспортная задача.
Ø Ø Простейшая динамическая модель макроэкономики.
Ø Ø Простейшая задача оптимального управления.
Ø Ø Дискретный принцип максимума Понтрягина.
КОНТРОЛЬНЫЕ ВОПРОСЫ
6.1. Кратко сформулируйте предмет теории игр как научной дисциплины.
6.2. Какой смысл вкладывается в понятие «игра»?
6.3. Для описания каких экономических ситуаций может быть применен аппарат теории игр?
6.4. Какая игра называется антагонистической?
6.5. Чем однозначно определяются матричные игры?
6.6. В чем заключаются принципы максимина и минимакcа?
6.7. При каких условиях можно говорить о том, что игра имеет седловую точку?
6.8. Приведите примеры игр, которые имеют седловую точку и в которых она отсутствует.
6.9. Какие подходы существуют к определению оптимальных стратегий?
6.10. Что называют «ценой игры»?
6.11. Дайте определение понятию «смешанная стратегия».
СПИСОК ЛИТЕРАТУРЫ
1. Абрамов Л. М., Капустин В. Ф. Математическое программирование. Л.,1981.
2. Ашманов С. А. Линейное программирование: Учеб. пособие. М., 1981.
3. Ашманов С. А., Тихонов А. В. Теория оптимизации в задачах и упражнениях. М., 1991.
4. Беллман Р. Динамическое программирование. М., 1960.
5. Беллман Р., Дрейфус С. Прикладные задачи динамического программирования. М., 1965.
6. Гавурин М. К., Малоземов В. Н. Экстремальные задачи с линейными ограничениями. Л., 1984.
7. Гасс С. Линейное программирование (методы и приложения). М., 1961.
8. Гейл Д . Теория линейных экономических моделей М., 1963.
9. Гилл Ф., Мюррей У., Райт М. Практическая оптимизация / Пер. с англ. М., 1985.
10. Давыдов Э. Г. Исследование операций: Учеб. пособие для студентов вузов. М., 1990.
11. Данциг Дж. Линейное программирование, его обобщения и применения. М.,1966.
12. Еремин И. И., Астафьев Н. Н. Введение в теорию линейного и выпуклого программирования. М., 1976.
13. Ермольев Ю.М., Ляшко И.И., Михалевич В.С., Тюптя В.И. Математические методы исследования операций: Учеб. пособие для вузов. Киев, 1979.
14. Зайченко Ю. П. Исследование операций, 2-е изд. Киев, 1979.
15. Зангвилл У. И. Нелинейное программирование. Единый подход. М., 1973.
16. Зойтендейк Г. Методы возможных направлений. М., 1963.
17. Карлин С. Математические методы в теории игр, программировании и экономике. М., 1964.
18. Карманов В. Г. Математическое программирование: Учеб. пособие. М., 1986.
19. Корбут А.А., Финкелыитейн Ю. Ю. Дискретное программирование. М., 1968.
20. Кофман А., Анри-Лабордер А. Методы и модели исследования операций. М., 1977.
21. Кюнце Г.П., Крелле В. Нелинейное программирование. М.,1965.
22. Ляшенко И.Н., Карагодова Е.А., Черникова Н.В., Шор Н.3. Линейное и нелинейное программирование. Киев, 1975.
23. Мак-Кинси Дж. Введение в теорию игр. М., 1960.
24. Мухачева Э. А., Рубинштейн Г. Ш. Математическое программирование. Новосибирск, 1977.
25. Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение. М, 1970.
26. Оре О. Теория графов. М., 1968.
27. Таха X. Введение в исследование операций/ Пер. с англ. М.,1985.
28. Фиакко А., Мак-Кормик Г. Нелинейное программирование. Методы последовательной безусловной минимизации. М.,1972.
29. Хедли Дж. Нелинейное и динамическое программирование. М., 1967.
30. Юдин Д.Б., Гольштейн Е.Г. Линейное программирование (теория, методы и приложения). М., 1969.
31. Юдин Д.Б., Гольштейн Е.Г. Линейное программирование. Теория и конечные методы. М., 1963.
32. Lapin L. Quantitative methods for business decisions with cases. Fourth edition. HBJ, 1988.
33. Liitle I.D.C., Murty K.G„ Sweeney D.W., Karel C. An algorithm for traveling for the traveling salesman problem. - Operation Research, 1963, vol.11, No. 6, p. 972-989/ Русск. пер.: Литл Дж., Мурти К., Суини Д., Керел К. Алгоритм для решения задачи о коммивояжере. - В кн.: Экономика и математические методы, 1965, т. 1, № 1, с. 94-107.
ПРЕДИСЛОВИЕ............................................................................................................................................................................................................ 2
ВВЕДЕНИЕ.................................................................................................................................................................................................................... 3
ГЛАВА 1. ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ.......................................................................................................................................... 8
1.1. ПОСТАНОВКА ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ............................................................................................. 9
1.2. ОСНОВНЫЕ СВОЙСТВА ЗЛП И ЕЕ ПЕРВАЯ ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ........................................................... 11
1.3. БАЗИСНЫЕ РЕШЕНИЯ И ВТОРАЯ ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ ЗЛП..................................................................... 15
1.4. СИМПЛЕКС-МЕТОД........................................................................................................................................................................................ 17
1.5. МОДИФИЦИРОВАННЫЙ СИМПЛЕКС-МЕТОД..................................................................................................................................... 26
1.6. ТЕОРИЯ ДВОЙСТВЕННОСТИ В ЛИНЕЙНОМ ПРОГРАММИРОВАНИИ....................................................................................... 30
1.7. ДВОЙСТВЕННЫЙ СИМПЛЕКС-МЕТОД................................................................................................................................................... 37
КЛЮЧЕВЫЕ ПОНЯТИЯ.......................................................................................................................................................................................... 42
КОНТРОЛЬНЫЕ ВОПРОСЫ................................................................................................................................................................................... 43
ГЛАВА 2. НЕЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ................................................................................................................................. 44
2.1. МЕТОДЫ РЕШЕНИЯ ЗАДАЧ НЕЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ...................................................................................... 44
2.2. ДВОЙСТВЕННОСТЬ В НЕЛИНЕЙНОМ ПРОГРАММИРОВАНИИ................................................................................................... 55
КЛЮЧЕВЫЕ ПОНЯТИЯ.......................................................................................................................................................................................... 59
КОНТРОЛЬНЫЕ ВОПРОСЫ................................................................................................................................................................................... 59
ГЛАВА 3. ТРАНСПОРТНЫЕ И СЕТЕВЫЕ ЗАДАЧИ................................................................................................................................ 60
3.1. ТРАНСПОРТНАЯ ЗАДАЧА И МЕТОДЫ ЕЕ РЕШЕНИЯ........................................................................................................................ 60
3.2. СЕТЕВЫЕ ЗАДАЧИ........................................................................................................................................................................................... 66
КЛЮЧЕВЫЕ ПОНЯТИЯ.......................................................................................................................................................................................... 73
КОНТРОЛЬНЫЕ ВОПРОСЫ................................................................................................................................................................................... 73
ГЛАВА 4. ДИСКРЕТНОЕ ПРОГРАММИРОВАНИЕ................................................................................................................................... 74
4.1. ТИПЫ ЗАДАЧ ДИСКРЕТНОГО ПРОГРАММИРОВАНИЯ..................................................................................................................... 74
4.2. МЕТОД ГОМОРИ............................................................................................................................................................................................... 78
4.3. МЕТОД ВЕТВЕЙ И ГРАНИЦ.......................................................................................................................................................................... 81
КЛЮЧЕВЫЕ ПОНЯТИЯ.......................................................................................................................................................................................... 86
КОНТРОЛЬНЫЕ ВОПРОСЫ................................................................................................................................................................................... 86
ГЛАВА 5. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ........................................................................................................................... 86
5.1. ОБЩАЯ СХЕМА МЕТОДОВ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ................................................................................. 86
5.2. ПРИМЕРЫ ЗАДАЧ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ.................................................................................................... 93
КЛЮЧЕВЫЕ ПОНЯТИЯ........................................................................................................................................................................................ 101
КОНТРОЛЬНЫЕ ВОПРОСЫ................................................................................................................................................................................ 101
ГЛАВА 6. КРАТКИЙ ОБЗОР ДРУГИХ РАЗДЕЛОВ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ................................................................. 101
6.1. ТЕОРИЯ ИГР...................................................................................................................................................................................................... 101
6.2. ТЕОРИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ........................................................................................................................................... 108
КЛЮЧЕВЫЕ ПОНЯТИЯ........................................................................................................................................................................................ 112
КОНТРОЛЬНЫЕ ВОПРОСЫ................................................................................................................................................................................ 112
СПИСОК ЛИТЕРАТУРЫ........................................................................................................................................................................................ 112
Оптимальное управление технологическими процессами (Лекция)
ПЛАН ЛЕКЦИИ
1. Основные понятия нахождения экстремума функции
2. Классификация методов оптимального управления
1. Основные понятия нахождения экстремума функции
Всякая математическая постановка оптимальной задачи часто равносильна или эквивалентна задаче отыскания экстремума функции одной или многих независимых переменных. Поэтому для решения таких оптимальных задач могут быть использованы различные методы поиска экстремума.
В общем случае задача оптимизации формулируется следующим образом:
Найти extr функции R (x ), где ХХ
R (x ) – называется целевой функцией или функцией или критерием оптимизации или оптимизируемой функцией
Х – независимая переменная.
Как известно необходимые условиям существования экстремума у непрерывной функции R (x ) могут быть получены из анализа первой производной . При этом функция R (x ) может иметь экстремальные значения при таких значениях независимой переменной Х, где первая производная равна 0. т.е. =0. Графически равенство нулю производной означает, что касательная к кривой R (x ) в этой точке параллельна оси абсцисс.
Равенство производной =0 есть необходимое условие экстремума.
Однако равенство нулю производной еще не означает, что в этой точке существует экстремум. Для того, чтобы окончательно убедится, что в этой точке действительно существует экстремум необходимо провести дополнительные исследования, которые заключаются в следующих способах:
1. Способ сравнения значений функций
Сравнивают значение функции R (x ) в «подозреваемой» на экстремум точке Х К две соседние значения функции R (x ) в точках Х К-ε и Х К+ε , где ε- малая положительная величина. (Рис. 2)
Если оба рассчитанных значения R (Х К+ε) и R (Х К-ε), окажутся меньше или больше R (Х К), то в точке Х К существует максимум или минимум функции R (х).
Если же R (Х К) имеет промежуточное значение между R (Х К-ε) и R (Х К+ε), то функция R (х) не имеет ни максимума ни минимума.
2. Способ сравнения знаков производных
Опять рассмотрим функцию R (Х К) в окрестностях точки Х К, т.е. Х К+ε и Х К-ε . При этом способе рассматривается знак производной в окрестности точки Х К. Если знаки производной в точках Х К-ε и Х К+ε различные, то в точке Х К существует экстремум. При этом вид экстремума (min или max ) может быть найден по изменению знака производной при переходе от точки Х К-ε к точке Х К+ε.
Если знак меняется с «+» на «-», то в точке Х К – максимум (рис. 3б), если наоборот с «-» на «+», то минимум. (Рис. 3а)
3. Способ исследования знаков высших производных.
Этот способ применяют в тех случаях, когда в точке «подозреваемой» на экстремум существуют производные высших порядков, т.е. функция R (Х К) не только сама непрерывна, но имеет также непрерывные производные и .
Способ сводится к следующему:
В точке Х К «подозреваемой» на экстремум, для которой справедливо
вычисляется значение второй производной .
Если при этом , то в точке Х К – максимум,
если , то в точке Х К – минимум.
При решении практических задач оптимизации требуется отыскать не какое-нибудь min или max значение функции R (Х К), а наибольшее или наименьшее значение этой функции, которое называется глобальным экстремумом. (Рис. 4)
В общем случае задача оптимизации состоит в отыскивании экстремума функции R (Х), при наличии тех или иных ограничений на уравнения математической модели.
В том случае, если R (Х) является линейной, а область допустимых решений задается линейными равенствами и неравенствами, то задача отыскания экстремумов функции относится к классу задач линейного программирования.
Часто множество Х определяют как систему функции
Тогда запись математической постановки задачи линейного программирования выглядит так:
В том случае, если или целевая функция R (Х) или какая-либо из ограничений не является линейной функцией, то задача отыскания экстремума функции R (Х) относится к классу задач нелинейного программирования.
В том случае, если на переменные Х не наложено никаких ограничений, то такая задача называется задачей на безусловный экстремум.
Пример типовой задачи оптимизации
Задача о коробке максимального объема.
Из этой заготовки следует вырезать четыре ровных квадрата по ее углам, а полученную фигуру (рис.5 б) согнуть так, чтобы получилась коробка без верхней крышки (рис.6.5 в). при этом необходимо так выбрать размер вырезаемых квадратов, чтобы получилась коробка максимального объема.
На примере данной задачи можно проиллюстрировать все элементы постановки задач оптимизации.
Рис. 5. Схема изготовления коробки из прямоугольной заготовки фиксированного размера
Оценочной функцией в данной задаче служит объем изготовленной коробки. Проблема заключается в выборе размера вырезаемых квадратов. Действительно, если размер вырезаемых квадратов слишком мал, то будет получена широкая коробка малой высоты, а значит и объем окажется невелик. С другой стороны, если размер вырезаемых квадратов будет слишком большой, то будет получена узкая коробка большой высоты, а значит, и ее объем также окажется невелик.
В то же время на выбор размера вырезаемых квадратов оказывает влияние ограничение размера исходной заготовки. Действительно, если вырезать квадраты со стороной, равной половине стороны исходной заготовки, то задача теряет смысл. Сторона вырезаемых квадратов также не может превышать половину сторон исходной заготовки, поскольку это невозможно из практических соображений. Из этого следует, что в постановке данной задачи должны присутствовать некоторые ограничения.
Математическая постановка задачи о коробке максимального объема . Для математической постановки данной задачи необходимо ввести в рассмотрение некоторые параметры, характеризующие геометрические размеры коробки. С этой целью дополним содержательную постановку задачи соответствующими параметрами. С этой целью будем рассматривать квадратную заготовку из некоторого гибкого материала, которая имеет длину стороны L (рис. 6). Из этой заготовки следует вырезать четыре ровных квадрата со стороной по ее углам, а полученную фигуру согнуть, так чтобы получилась коробка без верхней крышки. Задача состоит в таком выборе размера вырезаемых квадратов, чтобы в результате получилась коробка максимального объема.
Рис. 6. Схема изготовления из прямоугольной заготовки с указанием ее размеров
Для математической постановки данной задачи необходимо определить переменные соответствующей задачи оптимизации, задать целевую функцию и специфицировать ограничения. В качестве переменной следует взять длину стороны вырезаемого квадрата r , которая в общем случае, исходя из содержательной постановки задачи, принимает непрерывные действительные значения. Целевой функцией является объем полученной коробки. Поскольку длина стороны основания коробки равна: L - 2r , а высота коробки равна r , то ее объем находится по формуле: V (r) = (L -2r ) 2 r . исходя из физических соображений, значения переменной r не могут быть отрицательными и превышать величину половины размера исходной заготовки L , т.е. 0,5L .
При значениях r = 0 и r = 0,5 L соответствующие решения задачи о коробке являются выраженными. Действительно, в первом случае заготовка остается без изменения, а во втором случае она разрезается на 4 одинаковых части. Поскольку эти решения имеют физическую интерпретацию, задачу о коробке для удобства ее постановки и анализа можно считать оптимизации с ограничениями типа нестрогих неравенств.
С целью унификации, обозначим переменную через х = r , что не оказывает влияния на характер решаемой задачи оптимизации. Тогда математическая постановка задачи о коробке максимального объема может быть записана в следующем виде:
где (1)
Целевая функция данной задачи является нелинейной, поэтому задача о коробке максимального размера относится к классу задач нелинейного программирования или нелинейной оптимизации.
2. Классификация методов оптимального управления
Оптимизация процесса заключается в нахождении оптимума рассматриваемой функции или оптимальных условий проведения данного процесса.
Для оценки оптимума, прежде всего, необходимо выбрать критерий оптимизации. Обычно, критерий оптимизации выбирает из конкретных условий. Это могут быть технологический критерий (например, содержание Сu в отвальном шлаке) или экономический критерий (минимальная стоимость продукта при заданной производительности труда) и др. На основании выбранного критерия оптимизации составляется целевая функция, представляющая собой зависимость критерия оптимизации от параметров влияющих на его значение. Задача оптимизации сводится к нахождению экстремума целевой функции. В зависимости от характера рассматриваемых математических моделей принимаются различные математические методы оптимизации.
Общая постановка задачи оптимизации заключается в следующем:
1. Выбирается критерий
2. Составляется уравнение модели
3. Накладывается система ограничения
4. Решение
модель - линейная или нелинейная
Ограничения
В зависимости от структуры модели применяются различные методы оптимизации. К ним относятся:
1. Аналитические методы оптимизации (аналитический поиск экстремума, метод множителей Лагранжа, Вариационные методы)
2. Математическое программирование (линейное программирование, динамическое программирование)
3. Градиентные методы.
4. Статистические методы (Регрессионный анализ)
Линейное программирование . В задачах линейного программирования критерий оптимальности представляется в виде:
где - заданные постоянные коэффициенты; Переменные задачи. |
Уравнения модели представляют собой линейные уравнения (полиномы) вида на которые накладывается ограничения в виде равенства или неравенства, т.е. (2)
В задачах линейного программирования обычно предполагается, что все независимые переменные Х j неотрицательны, т.е.
Оптимальным решением задачи линейного программирования является такая совокупность неотрицательных значений независимых переменных
Которая удовлетворяет условия (2) и обеспечивает в зависимости от постановки задачи max или min значение критерия.
Геометрическая интерпретация имеет вид: - критерий при наличии ограничении на переменных Х 1 и Х 2 типа равенств и неравенств
R имеет постоянное значение вдоль линии l . Оптимальное решение будет в точке S , т.к. в этой точке критерий будет max .Одним из методов решения задачи оптимизации линейного программирования является симплекс-метод.
Нелинейное программирование . Математическая постановка задачи нелинейного программирования заключается в следующем: Найти экстремум целевой функции , которая имеет вид нелинейности.
На независимые переменные налагаются различные ограничения типа равенств или неравенств
в настоящее время для решения задач нелинейного программирования применяются довольно большое число методов.
К ним относится: 1) Градиентные методы (метод градиента, метод наискорейшего спуска, метод образов, метод Розенброка и т.д.)
2) Безградиентные методы (метод Гауса-Зейделя, метод сканирования).
Градиентные методы оптимизации
Эти методы относятся к численным методам поискового типа. Сущность этих методов заключается в определении значений независимых переменных, дающих наибольшее (наименьшее) изменение целевых функции. Обычно это достигается при движении вдоль градиента, ортогонального к контурной поверхности в данной точке.
Рассмотрим метод градиента. В этом методе используется градиент целевой функции. В методе градиента шаги совершаются в направлении наибыстрейшего уменьшения целевой функции.
Рис. 8. Поиск минимума методом градиента
Поиск оптимума производится в два этапа:
1-этап: - находят значения частных производных по всем независимым переменным, которые определяют направление градиента в рассматриваемой точке.
2-этап: - осуществляется шаг в направлении обратном направлению градиента, т.е. в направлении наибыстрейшего убывания целевой функции.
Алгоритм градиентного метода может быть записан следующим образом:
(3)
Характер движения к оптимуму методом наискорейшего спуска заключается в следующем (рис. 6.9), после того как в начальной точке найден градиент оптимизируемой функции и тем самым определено направление ее наибыстрейшего убывания в указанной точке, в данном направлении делается шаг спуска. Если значение функции в результате этого шага уменьшилась, то производится очередной шаг в том же направлении, и так до тех пор, пока в этом направлении не будет найден минимум, после чего вычисляется снова градиент и определяется новое направление наибыстрейшего убывания целевой функции.
Безградиентные методы поиска экстремума. Эти методы, в отличии от градиентных, используют в процессе поиска информации, получаемую не при анализе производных, а от сравнительной оценки величины критерия оптимальности в результате выполнения очередного шага.
К безградиентным методам поиска экстремума относится:
1. метод золотого сечения
2. метод с использованием чисел Фибония
3. метод Гауса-Зейделя (метод получения изменения переменной)
4. метод сканирования и т.д.
Оптимальное управление
Андрей Александрович Аграчёв
Человеку свойственно стремление к совершенству. В математике оно проявляется в поиске наилучших (оптимальных) решений, включая все задачи на максимум и минимум. К теории оптимального управления относятся те из них, где решение имеет некоторую протяженность во времени или в пространстве. Подходящий образ — прокладывание наилучшего пути при движении по сильно пересечённой местности.
Вообще, математики, как и все люди, очень любят зрительные образы, но в действительности речь идёт о любой системе, которую можно непрерывно менять в определённых пределах, как мы меняем направление движения при прокладывании пути. Другие подходящие примеры: управление автомобилем, летательным аппаратом, технологическим процессом, своим телом, в конце концов.
Требуется наилучшим образом перевести систему из заданного состояния в желаемое: как можно быстрее, или наиболее экономным образом, или с наибольшей выгодой, или в соответствии с каким‐то более сложным критерием; мы сами решаем, что важнее. Если мгновенная реакция системы на наши действия хорошо известна, то теория оптимального управления призвана помочь нам найти наилучшую долговременную стратегию. Вот простой пример: нужно как можно быстрее остановить колебания (скажем, остановить «качели»), прикладывая свою невеликую силу то с одной стороны, то с другой. Переходить с одной стороны на другую придётся многократно. По какому правилу это делать? Понятно, что «качели» могут быть и финансовыми, и экономическими, и физико‐техническими…
Стоит заметить, что такой очевидно прикладной предмет, как теория оптимального управления, был создан в Математическом институте имени Стеклова чистыми математиками, Львом Семёновичем Понтрягиным и его учениками, профессиональными топологами. Первые впечатляющие применения этой теории, принесшие ей славу, относятся к советской космической программе и американской программе «Аполлон». В этих программах всё делалось на пределе возможностей, и без умной оптимизации было не справиться. Среди популярных тогда задач можно отметить наиболее экономный перевод космического аппарата с одной эллиптической орбиты на другую и мягкое прилунение. Главное достижение того периода — принцип максимума Понтрягина — мощное универсальное средство, позволяющее отобрать достаточно узкий класс управляющих стратегий, среди которых только и может быть оптимальная.
Принцип максимума Понтрягина особенно хорош в применении к простым «линейным» моделям, но теряет свою эффективность и должен быть дополнен другими средствами при исследовании систем с более сложной нелинейной структурой. Вернёмся к примеру с качелями. Если амплитуда колебаний небольшая, то система почти линейна и период колебаний почти не зависит от амплитуды. Принцип максимума даёт простой и однозначный закон оптимального поведения для линейного приближения: надо переходить с одной стороны на другую ровно через полпериода и всякий раз применять максимально возможную силу. В то же время при большой амплитуде, когда система существенно нелинейна, рекомендации принципа максимума сильно усложняются и перестают быть однозначными.
Новые правила оптимального поведения, дополняющие принцип максимума, даёт активно развиваемая в настоящее время геометрическая теория управления. Дело в том, что современная геометрия позволяет очень сильно расширять возможности управления, играя порядком и длительностью применения нескольких простых манёвров, отбирая оптимальные «гармоничные» сочетания манёвров, результат каждого из которых хорошо известен и вполне банален. Похоже на то, как из нескольких нот составляется симфония, только в математике всё точнее, строже и симметричней, хотя и не столь эмоционально.
Геометрическая теория управления применяется в космической навигации, робототехнике и многих других областях, но наиболее популярные современные приложения относятся, пожалуй, к квантовым системам (от медицинских аппаратов ядерного магнитного резонанса до химических манипуляций с отдельными молекулами). Обаяние геометрической теории управления состоит, среди прочего, в редкой возможности материализовать, увидеть и «пощупать» красивые и глубокие абстрактные математические концепции, ну и, конечно, создавать новые!
Литература
Тихомиров В. М. Рассказы о максимумах и минимумах. — М.: Наука, 1986. — (Библиотечка «Квант»; Вып. 56). — [Переиздания: М.: МЦНМО, 2006, 2017].
Протасов В. Ю. Максимумы и минимумы в геометрии. — М.: МЦНМО, 2012. — (Библиотека «Математическое просвещение»; Вып. 31).
Для проектирования оптимальной САУ необходима полная информация об ОУ, возмущающих и задающих воздействиях, начальном и конечном состояниях ОУ. Далее требуется выбрать критерий оптимальности. В качестве такого критерия можно использовать один из показателей качества системы. Однако требования к отдельным показателям качества, как правило, противоречивы (например, повышение точности системы достигается уменьшением запаса устойчивости). Кроме того, оптимальная система должна иметь минимально возможную ошибку не только при отработке какого-то конкретного управляющего воздействия, но в течение всего времени работы системы. Следует также учитывать, что решение задачи оптимального управления зависит не только от структуры системы, но и от параметров составляющих ее элементов.
Достижение оптимального функционирования САУ во многом определяется тем, как осуществляется управление во времени, какова программа, или алгоритм управления. В связи с этим для оценки оптимальности систем используют интегральные критерии, вычисляемые как сумма значений интересующего проектировщиков параметра качества системы за все время процесса управления.
В зависимости от принятого критерия оптимальности рассматривают следующие виды оптимальных систем.
1. Системы , оптимальные по быстродействию , которые обеспечивают минимальное время перевода ОУ из одного состояния в другое. В этом случае критерий оптимальности выглядит следующим образом:
где / н и / к - моменты начала и окончания процесса управления.
В таких системах длительность процесса управления минимальна. Простейший пример - система управления двигателем, обеспечивающая минимальное время разгона его до заданной частоты вращения с учетом всех имеющихся ограничений.
2. Системы , оптимальные по расходу ресурсов , которые гарантируют минимум критерия
где к - коэффициент пропорциональности; U(t) - управляющее воздействие.
Такая система управления двигателем обеспечивает, например, минимальный расход топлива за все время управления.
3. Системы , оптимальные по потерям управления (или по точности), которые обеспечивают минимальные ошибки управления на основании критерия где e(f) - динамическая ошибка.
В принципе задача проектирования оптимальной САУ может быть решена простейшим методом перебора всех возможных вариантов. Конечно, такой метод требует больших затрат времени, но современные ЭВМ позволяют в некоторых случаях им воспользоваться. Для решения задач оптимизации разработаны специальные методы вариационного исчисления (метод максимума, метод динамического программирования и др.), позволяющие учесть все ограничения реальных систем.
В качестве примера рассмотрим, каким должно быть оптимальное по быстродействию управление электродвигателем постоянного тока, если подаваемое на него напряжение ограничено предельной величиной {/ лр, а сам двигатель можно представить в виде апериодического звена 2-го порядка (рис. 13.9, а).
Метод максимума позволяет рассчитать закон изменения и(г), обеспечивающий минимальное время разгона двигателя до частоты вращения (рис. 13.9, б). Процесс управления данным двигателем должен состоять из двух интервалов, в каждом из которых напряжение u(t) принимает свое предельное допустимое значение (в интервале 0 - /,: u(t) = +?/ пр, в интервале /| - / 2: u(t) = -?/ пр)* Для обеспечения такого управления в состав системы должен быть включен релейный элемент.
Как и обычные системы, оптимальные системы бывают разомкнутыми, замкнутыми и комбинированными. Если оптимальное управление, переводящее ОУ из начального состояния в конечное и не зависящее или слабо зависящее от возмущающих воздействий, может быть задано как функция времени U = (/(/), то строится разомкнутая система программного управления (рис. 13.10, а).
В программное устройство ПУ закладывается оптимальная программа П, рассчитанная на достижение экстремума принятого критерия оптимальности. По такой схеме осуществляется управ-
Рис. 13.9.
а - с обшим управляющим устройством; б - с двухуровневым управляющим
устройством
Рис. 13.10. Схемы оптимальных систем: а - разомкнутой; б - комбинированной
ление станками с числовым программным управлением и простейшими роботами, производится вывод ракет на орбиту и т.д.
Наиболее совершенными, хотя и наиболее сложными, являются комбинированные оптимальные системы (рис. 13.10, б). В таких системах разомкнутый контур осуществляет оптимальное управление по заданной программе, а замкнутый контур, оптимизированный по минимуму ошибки, отрабатывает отклонение выходных параметров. Используя канат измерения возмущений /*, система становится инвариантной относительно всего множества задающих и возмущающих воздействий.
Для того чтобы реализовать столь совершенную систему управления, необходимо точно и быстро измерять все возмущаюшие воздействия. Однако такая возможность имеется далеко не всегда. Гораздо чаще о возмущающих воздействиях известны только усредненные статистические данные. Во многих случаях, особенно в системах телеуправления, даже задающее воздействие поступает в систему вместе с помехами. А так как помеха представляет собой в общем случае случайный процесс, то удается синтезировать только статистически оптимальную систему. Такая система не будет оптимальной для каждой конкретной реализации процесса управления, но она будет в среднем наилучшей для всего множества его реализаций.
Для статистически оптимальных систем в качестве критериев оптимальности используют усредненные вероятностные оценки. Например, для следящей системы, оптимизированной по минимуму ошибки, в качестве статистического критерия оптимальности используют математическое ожидание квадрата отклонения выходного воздействия от заданного значения, т.е. дисперсию:
Используются и другие вероятностные критерии. Например, в системе обнаружения целей, где важно только наличие или отсутствие цели, в качестве критерия оптимальности применяют вероятность ошибочного решения Р ош:
где Р п ц - вероятность пропуска цели; Р ЛО - вероятность ложного обнаружения.
Во многих случаях рассчитанные оптимальные САУ оказываются практически не реализуемыми ввиду их сложности. Как правило, требуется получение точных значений производных высоких порядков от входных воздействий, что технически очень трудно осуществимо. Зачастую даже теоретический точный синтез оптимальной системы оказывается невозможен. Однако методы оптимального проектирования позволяют строить квазиоптимальные системы, хотя и упрощенные в той или иной степени, но все- гаки позволяющие достичь значений принятых критериев оптимальности, близких к экстремальным.
Оптимальное управление
Оптимальное управление - это задача проектирования системы, обеспечивающей для заданного объекта управления или процесса закон управления или управляющую последовательность воздействий, обеспечивающих максимум или минимум заданной совокупности критериев качества системы .
Для решения задачи оптимального управления строится математическая модель управляемого объекта или процесса, описывающая его поведение с течением времени под влиянием управляющих воздействий и собственного текущего состояния. Математическая модель для задачи оптимального управления включает в себя: формулировку цели управления, выраженную через критерий качества управления; определение дифференциальных или разностных уравнений, описывающих возможные способы движения объекта управления; определение ограничений на используемые ресурсы в виде уравнений или неравенств .
Наиболее широко при проектировании систем управления применяются следующие методы: вариационное исчисление , принцип максимума Понтрягина и динамическое программирование Беллмана .
Иногда (например, при управлении сложными объектами, такими как доменная печь в металлургии или при анализе экономической информации) в исходных данных и знаниях об управляемом объекте при постановке задачи оптимального управления содержится неопределённая или нечёткая информация, которая не может быть обработана традиционными количественными методами. В таких случаях можно использовать алгоритмы оптимального управления на основе математической теории нечётких множеств (Нечёткое управление). Используемые понятия и знания преобразуются в нечёткую форму, определяются нечёткие правила вывода принимаемых решений, затем производится обратное преобразование нечётких принятых решений в физические управляющие переменные.
Задача оптимального управления
Сформулируем задачу оптимального управления:
здесь - вектор состояния - управление, - начальный и конечный моменты времени.
Задача оптимального управления заключается в нахождении функций состояния и управления для времени , которые минимизируют функционал.
Вариационное исчисление
Рассмотрим данную задачу оптимального управления как задачу Лагранжа вариационного исчисления . Для нахождения необходимых условий экстремума применим теорему Эйлера-Лагранжа . Функция Лагранжа имеет вид: , где - граничные условия. Лагранжиан имеет вид: , где , , - n-мерные вектора множителей Лагранжа .
Необходимые условия экстремума, согласно этой теореме, имеют вид:
Необходимые условия (3-5) составляют основу для определения оптимальных траекторий. Написав эти уравнения, получаем двухточечную граничную задачу, где часть граничных условий задана в начальный момент времени, а остальная часть - в конечный момент. Методы решения подобных задач подробно разбираются в книге
Принцип максимума Понтрягина
Необходимость в принципе максимума Понтрягина возникает в случае когда нигде в допустимом диапазоне управляющей переменной невозможно удовлетворить необходимому условию (3), а именно .
В этом случае условие (3) заменяется на условие (6):
(6)В этом случае согласно принципу максимума Понтрягина величина оптимального управления равна величине управления на одном из концов допустимого диапазона. Уравнения Понтрягина записываются при помощи функции Гамильтона Н, определяемой соотношением . Из уравнений следует, что функция Гамильтона H связана с функцией Лагранжа L следующим образом: . Подставляя L из последнего уравнения в уравнения (3-5) получаем необходимые условия, выраженные через функцию Гамильтона:
Необходимые условия, записанные в такой форме, называются уравнениями Понтрягина. Более подробно принцип максимума Понтрягина разобран в книге .
Где применяется
Принцип максимума особенно важен в системах управления с максимальным быстродействием и минимальным расходом энергии, где применяются управления релейного типа, принимающие крайние, а не промежуточные значения на допустимом интервале управления.
История
За разработку теории оптимального управления Л.С. Понтрягину и его сотрудникам В.Г. Болтянскому , Р.В. Гамкрелидзе и Е.Ф. Мищенко в 1962 г была присуждена Ленинская премия .
Метод динамического программирования
Метод динамического программирования основан на принципе оптимальности Беллмана, который формулируется следующим образом: оптимальная стратегия управления обладает тем свойством, что каково бы ни было начальное состояние и управление в начале процесса последующие управления должны составлять оптимальную стратегию управления относительно состояния, полученного после начальной стадии процесса . Более подробно метод динамического программирования изложен в книге
Примечания
Литература
- Растригин Л.А. Современные принципы управления сложными объектами. - М.: Сов. радио, 1980. - 232 с., ББК 32.815, тир. 12000 экз.
- Алексеев В.М., Тихомиров В.М. , Фомин С.В. Оптимальное управление. - М.: Наука, 1979, УДК 519.6, - 223 c., тир. 24000 экз.
См. также
Wikimedia Foundation . 2010 .
Смотреть что такое "Оптимальное управление" в других словарях:
Оптимальное управление - ОУ Управление, обеспечивающее наивыгоднейшее значение определенного критерия оптимальности (КО), характеризующего эффективность управления при заданных ограничениях. В качестве КО могут быть выбраны различные технические или экономические… … Словарь-справочник терминов нормативно-технической документации
оптимальное управление - Управление, цель которого заключается в обеспечении экстремального значения показателя качества управления. [Сборник рекомендуемых терминов. Выпуск 107. Теория управления. Академия наук СССР. Комитет научно технической терминологии. 1984 г.]… … Справочник технического переводчика
Оптимальное управление - 1. Основное понятие математической теории оптимальных процессов (принадлежащей разделу математики под тем же названием: «О.у.»); означает выбор таких управляющих параметров, которые обеспечивали бы наилучшее с точки… … Экономико-математический словарь
Позволяет при заданных условиях (часто противоречивых) достичь поставленной цели наилучшим образом, напр. за минимальное время, с наибольшим экономическим эффектом, с максимальной точностью … Большой Энциклопедический словарь
Летательным аппаратом раздел динамики полёта, посвящённый развитию и использованию методов оптимизации для определения законов управления движением летательного аппарата и его траекторий, обеспечивающих максимум или минимум выбранного критерия… … Энциклопедия техники
Раздел математики, изучающий неклассические вариационные задачи. Объекты, с которыми имеет дело техника, обычно снабжены «рулями» с их помощью человек управляет движением. Математически поведение такого объекта описывается… … Большая советская энциклопедия