Оптимальное управление. Классификация оптимальных систем автоматического управления. Приведение количественных параметров продуктов операции к сопоставимым величинам
АННОТАЦИЯ
Настоящее пособие знакомит с основными условиями оптимальности и методами решения задач вариационного исчисления и оптимального управления. Будет полезно для подготовки и проведения практических занятий по разделу "Оптимальное управление", а также при выполнении домашних заданий по этой теме студентами.
Учебное пособие является электронной версией книги:
Оптимальное управление в примерах и задачах. Сотсков А.И., Колесник Г.В. - М.: Российская экономическая школа, 2002 - 58 с.
Предисловие
1. Простейшая задача вариационного исчисления.
Уравнение Эйлера
Примеры
Упражнения
2. Задача оптимального управления. Принцип максимума
Примеры
Упражнения
3. Фазовые ограничения в задаче оптимального управления
Примеры
Упражнения
4. Динамическое программирование и уравнение Беллмана
Примеры
Упражнения
Литература
Предисловие
Теория оптимального управления является одним из разделов курса "Математика для экономистов", читаемого в Российской экономической школе.
Опыт преподавания показывает, что данный раздел - один из наиболее сложных для освоения. Это прежде всего связано с концептуальными отличиями изучаемых в нем задач оптимального управления от задач конечномерной оптимизации, и, как следствие, с существенным усложнением используемых в них условий оптимальности.
В связи с этим представляется полезным дать наглядную иллюстрацию применения данных условий оптимальности к решению задач различных типов. Настоящее пособие и является попыткой дать такую иллюстрацию. В нем содержатся примеры и задачи по четырем темам:
. вариационному исчислению;
. принципу максимума в задачах без ограничений;
. принципу максимума при наличии фазовых ограничений;
. динамическому программированию.
Каждый раздел состоит из теоретической части, описывающей базовые понятия и результаты, используемые при решении соответствующих задач, примеров с решениями, а также задач для самостоятельной работы студентов.
Следует подчеркнуть, что данное пособие ни в коем случае не является теоретическим курсом, а ориентировано прежде всего на практическое применение методов оптимального управления. В качестве теоретического пособия по данному разделу можно порекомендовать, например, книгу.
По мнению авторов, данное пособие будет полезным преподавателям при подготовке и проведении практических занятий по разделу "Оптимальное управление", а также студентам при выполнении домашних заданий по этой теме.
Электронная версия книги : [Скачать, PDF, 633.8 КБ ].
Для просмотра книги в формате PDF требуется программа Adobe Acrobat Reader, новую версию которой можно бесплатно скачать с сайта компании Adobe.
Оптимальные САУ это системы в которых управление осуществляется таким образом что требуемый критерий оптимальности имеет экстремальное значение. Граничные условия определяющие начальное и требуемое конечное состояния системы технологическая цель системы. tн Её ставят в тех случаях когда особый интерес представляет среднее отклонение в течение определённого интервала времени и задача системы управления обеспечить минимум этого интеграла...
Поделитесь работой в социальных сетях
Если эта работа Вам не подошла внизу страницы есть список похожих работ. Так же Вы можете воспользоваться кнопкой поиск
Оптимальное управление
Воронов А.А., Титов В.К., Новогранов Б.Н. Основы теории автоматического регулирования и управления. М.: Высшая школа, 1977. 519с. С. 477 491.
Оптимальные САУ это системы, в которых управление осуществляется таким образом, что требуемый критерий оптимальности имеет экстремальное значение.
Примеры оптимального управления объектами:
- Управление движением ракеты с целью достижения ею заданной высоты или дальности при минимальном расходе горючего;
- Управление перемещением приводимого двигателем механизма, при котором минимизировались бы затраты энергии;
- Управление атомным реактором, при котором максимальна производительность.
Задача оптимального управления формулируется следующим образом:
“Найти такой закон изменения во времени управления u (t ), при котором система при заданных ограничениях перейдёт из одного заданного состояния в другое оптимальным образом в том смысле,что функционал I , выражающий качество процесса, получит при найденном управлении экстремальное значение “.
Чтобы решить задачу оптимального управления, необходимо знать:
1.Математическое описание объекта и среды, связывающее значения всех координат исследуемого процесса,управляющих и возмущающих воздействий;
2.Ограничения физического характера на координаты и закон управления, выраженные математически;
3. Граничные условия, определяющие начальное и требуемое конечное состояния системы
(технологическая цель системы);
4.Целевую функцию (функционал качества
математическая цель).
Математически критерий оптимальности чаще всего представляют в виде:
t к
I =∫ f o [ y (t ), u (t ), f (t ), t ] dt + φ [ y (t к ), t к ], (1)
t н
где первое слагаемое характеризует качество управления на всём интервале (t н , t н ) и называется
интегральной составляющей, второе слагаемое
характеризует точность в конечный (терминальный) момент времени t к .
Выражение (1) называется функционалом, так как I зависит от выбора функции u (t ) и получающегося при этом y (t ).
Задача Лагранжа. В ней минимизируется функционал
t к
I=∫f o dt.
t н
Её ставят в тех случаях, когда особый интерес представляет среднее отклонение в течение
определённого интервала времени, и задача системы управления обеспечить минимум этого интеграла (ухудшение качества продукции, убыток и т.п.).
Примеры функционалов:
I =∫ (t ) dt критерий минимальной ошибки в установившемся режиме, где x (t )
- отклонение управляемого параметра от заданного значения;
I =∫ dt = t 2 - t 1 = > min критерий максимального быстродействия САУ;
I =∫ dt = > min критерий оптимальной экономичности.
Задача Майера. В этом случае минимизируемым является функционал, определяемый только терминальной частью, т.е.
I = φ =>min.
Например, для системы управления ЛА, описываемым уравнением
F o (x , u , t ),
можно поставить следующую задачу: определить управление u (t ), t н ≤ t ≤ t к так, чтобы за
заданное время полёта достичь максимальной дальности при условии, что в конечный момент времени t к ЛА совершит посадку, т.е. x (t к ) =0.
Задача Больца сводится к задаче минимизации критерия (1).
Базовыми методами решения задач оптимального управления являются:
1.Классическое вариационное исчисление теорема и уравнение Эйлера;
2.Принцип максимума Л.С. Понтрягина;
3.Динамическое программирование Р. Беллмана.
УРАВНЕНИЕ И ТЕОРЕМА ЭЙЛЕРА
Пусть задан функционал:
t к
I =∫ f o dt ,
t н
где некоторые дважды дифференцируемые функции, среди которых необходимо найти такие функции (t ) или экстремали , которые удовлетворяют заданным граничным условиям x i (t н ), x i (t к ) и минимизируют функционал.
Экстремали отыскиваются среди решений уравнения Эйлера
I = .
Для установления факта минимизации функционала необходимо удостовериться, что вдоль экстремалей выполняются условия Лагранжа:
аналогичные требованиям положительности второй производной в точке минимума функции.
Теорема Эйлера: “Если экстремум функционала I существует и достигается среди гладких кривых, то он может достигаться только на экстремалях”.
ПРИНЦИП МАКСИМУМА Л.С.ПОНТРЯГИНА
Школа Л.С.Понтрягина сформулировала теорему о необходимом условии оптимальности, сущность которой в следующем.
Допустим, что дифференциальное уравнение объекта вместе с неизменяемой частью управляющего устройства заданы в общей форме:
На управление u j могут накладываться ограничения, например, в виде неравенств:
, .
Цель управления состоит в переводе объекта из начального состояния (t н ) в конечное состояние (t к ). Момент окончания процесса t к может быть фиксированным или свободным.
Критерием оптимальности пусть будет минимум функционала
I = dt .
Введём вспомогательные переменные и образуем функцию
Fo ()+ f () f ()+
Принцип максимума гласит, что для оптимальности системы, т.е. для получения минимума функционала, необходимо существование таких ненулевых непрерывных функций, удовлетворяющих уравнению
Что при любом t , находящемся в заданном диапазоне t н≤ t ≤ t к , величина Н, как функция допустимого управления, достигает максимума.
Максимум функции Н определяется из условий:
если не достигает границ области, и как точная верхняя грань функции Н по в противном случае.
Динамическое программирование Р.Беллмана
Принцип оптимальности Р.Беллмана:
“ Оптимальное поведение обладает тем свойством, что, каковы бы ни были первоначальное состояние и решение в начальный момент, последующие решения должны составлять оптимальное поведение относительно состояния, получающегося в результате первого решения.”
Под “поведением” системы следует понимать движение этих систем, а термин “решение” относится к выбору закона изменения во времени управляющих сил.
В динамическом программировании процесс поиска экстремалей разбивается на n шагов, в то время как в классическом вариационном исчислении ведётся поиск экстремали целиком.
Процесс поиска экстремали базируется на следующих предпосылках принципа оптимальности Р.Беллмана:
- Каждый отрезок оптимальной траектории является сам по себе оптимальной траекторией;
- Оптимальный процесс на каждом участке не зависит от его предыстории;
- Оптимальное управление (оптимальная траектория) ищется с помощью попятного движения [от y (T ) к y (T -∆) , где ∆ = Т/ N , N число участков разбиения траектории, и т.д.].
Эвристически уравнения Беллмана для требуемых постановок задач выведены применительно к непрерывным и дискретным системам.
Адаптивное управление
Андриевский Б.Р., Фрадков А.Л. Избранные главы теории автоматического управления с примерами на языке MATLAB . СПб.: Наука, 1999. 467с. Глава 12.
Воронов А.А., Титов В.К., Новогранов Б.Н. Основы теории автоматического регулирования и управления. М.: Высшая школа, 1977. 519с. С. 491 499.
Анхимюк В.Л., Опейко О.Ф., Михеев Н.Н. Теория автоматического управления. Мн.: Дизайн ПРО, 2000. 352с. С. 328 340.
Необходимость в адаптивных системах управления возникает в связи со значительным усложнением решаемых задач управления, причем специфическая особенность такого усложнения заключается в отсутствии практической возможности для подробного изучения и описания процессов, протекающих в управляемом объекте.
Например, современные высокоскоростные летательные аппараты, точные априорные данные о характеристиках которых во всех условиях функционирования не могут быть получены из-за значительных разбросов параметров атмосферы, больших диапазонов изменения скоростей полета, дальностей и высот, а также из-за наличия широкого спектра параметрических и внешних возмущений.
Некоторые объекты управления (самолеты и ракеты, технологические процессы и энергетические установки) отличаются тем, что их статические и динамические характеристики изменяются в широких пределах непредвиденным заранее образом. Оптимальное управление такими объектами возможно с помощью систем, в которых недостающая информация автоматически пополняется самой системой в процессе работы.
Адаптивными (лат.” adaptio ” приспособление) называются такие системы, которые при изменении параметров объектов или характеристик внешних воздействий в процессе эксплуатации самостоятельно, без участия человека изменяют параметры регулятора, его структуру, настройку или регулирующие воздействия для поддержания оптимального режима работы объекта.
Создание адаптивных систем управления осуществляется в принципиально иных условиях, т.е. адаптивные методы должны способствовать достижению высокого качества управления при отсутствии достаточной полноты априорной информации о характеристиках управляемого процесса или в условиях неопределенности.
Классификация адаптивных систем :
Самоприспосабливающиеся
(адаптивные)
Системы управления
Самонастраивающиеся Самообучающиеся Системы с адаптацией
Системы системы в особых фазовых
Состояниях
Поисковые Беспоиско- Обучающие- Обучающие- Релейные Адаптивные
(экстремаль- вые (анали- ся с поощре- ся без автоколеба- системы с
Ные) тические) нием поощрения тельные переменной
Системы системы системы структурой
Структурная схема классификации АС (по характеру процесса адаптации)
Самонастраивающиеся системы (СНС) представляют собой системы, в которых адаптация при изменении условий работы осуществляется путем изменения параметров и управляющих воздействий.
Самоорганизующимися называются системы, в которых адаптация осуществляется за счет изменения не только параметров и управляющих воздействий, но и структуры.
Самообучающаяся это система автоматического управления, в которой оптимальный режим работы управляемого объекта определяется с помощью управляющего устройства, алгоритм которого автоматически целенаправленно совершенствуется в процессе обучения путем автоматического поиска. Поиск производится с помощью второго управляющего устройства, являющегося органической частью самообучающейся системы.
В поисковых системах изменение параметров управляющего устройства или управляющего воздействия осуществляется в результате поиска условий экстремума показателей качества. Поиск условий экстремума в системах этого типа осуществляется с помощью пробных воздействий и оценки полученных результатов.
В беспоисковых системах определение параметров управляющего устройства или управляющих воздействий производится на основе аналитического определения условий, обеспечивающих заданное качество управления без применения специальных поисковых сигналов.
Системы с адаптацией в особых фазовых состояниях используют особые режимы или свойства нелинейных систем (режимы автоколебаний, скользящие режимы) для организации контролируемых изменений динамических свойств системы управления. Специально организованные особые режимы в таких системах либо служат дополнительным источником рабочей информации об изменяющихся условиях функционирования системы, либо наделяют системы управления новыми свойствами, за счет которых динамические характеристики управляемого процесса поддерживаются в желаемых пределах независимо от характера возникающих при функционировании изменений.
При применении адаптивных систем решаются следующие основные задачи:
1 . В процессе функционирования системы управления при изменении параметров, структуры и внешних воздействий обеспечивают такое управление, при котором сохраняются заданные динамические и статические свойства системы;
2 . В процессе проектирования и наладки при начальном отсутствии полной информации о параметрах, структуре объекта управления и внешних воздействиях производят автоматическую настройку системы в соответствии с заданными динамическими и статическими свойствами.
Пример 1 . Адаптивная система стабилизации углового положения ЛА.
f 1 (t ) f 2 (t ) f 3 (t )
Д1 Д2 Д3
ВУ1 ВУ2 ВУ3 f (t ) f 1 (t ) f 2 (t ) f 3 (t )
u (t ) W 1 (p ) W 0 (p ) y (t )
+ -
Рис. 1.
Приспосабливающаяся система стабилизации ЛА
При изменении условий полета меняется передаточная функция W 0 (p ) ЛА, а, следовательно, и динамическая характеристика всей системы стабилизации:
. (1)
Возмущения со стороны внешней среды f 1 (t ), f 2 (t ), f 3 (t ) , приводящие к контролируемым изменениям параметров системы, приложены к различным точкам объекта.
Возмущающее воздействие f (t ) , приложенное непосредственно к входу объекта управления, в отличие от f 1 (t ), f 2 (t ), f 3 (t ) не меняет его параметров. Поэтому в процессе работы системы измеряют только f 1 (t ), f 2 (t ), f 3 (t ).
В соответствии с принципом обратной связи и выражением (1) неконтролируемые изменения характеристики W 0 (p ) из-за возмущений и помех вызывают сравнительно небольшие изменения параметров Ф(p ) .
Если поставить задачу более полной компенсации контролируемых изменений, чтобы передаточная функция Ф(р) системы стабилизации ЛА оставалась практически неизменной, то следует надлежащим образом изменить характеристику регулятора W 1 (p ). Это и осуществляется в приспосабливающейся САУ, выполненной по схеме рис.1. Параметры внешней среды, характеризуемые сигналами f 1 (t ), f 2 (t ), f 3 (t ), например давление скоростного напора P H (t ) , температура окружающего воздуха T 0 (t ) и скорость полёта υ(t ) , непрерывно измеряются датчиками Д 1 , Д 2 , Д 3 , и текущие значения параметров поступают в вычислительные устройства В 1, В 2 ,В 3 , вырабатывающие сигналы, с помощью которых подстраивается характеристика W 1 (p ), чтобы компенсировать изменения характеристики W 0 (p ).
Однако, в АСАУ данного типа (с разомкнутым циклом настройки) отсутствует самоанализ эффективности осуществляемых ею контролируемых изменений.
Пример 2. Экстремальная система управления скоростью полета ЛА.
Z Возмущающее
Воздействие
X 3 = X 0 - X 2
Устройство авто- X 0 Усилительно- X 4 Исполнительное X 5 Регулируемый X 1
Матического по- преобразователь- устройство объект
Иска экстремума + - ное устройство
Измерительное
Устройство
Рис.2.Функциональная схема экстремальной системы управления скоростью полета ЛА
Экстремальная система определяет наивыгоднейшую программу, т.е. то значение X 1 (требуемая скорость движения ЛА), которое нужно в данный момент выдерживать, чтобы производился минимум расхода горючего на единицу длины пути.
Z - характеристика объекта; X 0 - управляющее воздействие на систему.
(величина расхода горючего)
y(0)
y(T)
Самоорганизующиеся системы
В этих нормах отдельно нормируется каждый компонент микроклимата в рабочей зоне производственного помещения: температура относительная влажность скорость движения воздуха в зависимости от способности организма человека к акклиматизации в разное время года характера одежды интенсивности производимой работы и характера тепловыделений в рабочем помещении. Перепады температуры воздуха по высоте и по горизонтали а также изменения температуры воздуха в течение смены при обеспечении оптимальных величин микроклимата на рабочих местах не должны... Управление: понятие признаки система и принципы Органы государственного управления: понятие виды и функции. По содержанию административное право является государственно-управленческим правом реализующим правовой интерес большинства граждан для чего субъекты управления наделяются юридически властными полномочиями представительскими функциями государства. Следовательно объектом действия юридических норм являются специфические управленческие общественные отношения возникающие между субъектом управления управляющим и объектами... Государственное регулирование социально-экономического развития регионов. Местные бюджеты как финансовая основа социально-экономического развития региона. Разные территории Украины имеют свои особенности и отличия как относительно экономического развития так и в социальном историческом языковом и ментальном аспектах. Из таких проблем нужно прежде всего назвать несовершенство отраслевой структуры большинства региональных хозяйственных комплексов их низкую экономическую эффективность; значительные отличия между регионами в уровнях...Задачи оптимального управления относятся к теории экстремальных задач, то есть задач определения максимальных и минимальных значений. Уже то обстоятельство, что в этой фразе встретилось несколько латинских слов (maximum - наибольшее, minimum - наименьшее, extremum - крайнее, optimus - оптимальное), указывает, что теория экстремальных задач была предметом исследования с древних времен. О некоторых таких задачах писали еще Аристотель (384-322 годы до н.э.), Евклид (III в. до н.э.) и Архимед (287-212 годы до н.э.). Основание города Карфагена (825 год до н.э.) легенда ассоциирует с древнейшей задачей определения замкнутой плоской кривой, охватывающей фигуру максимально возможной площади. Подобные задачи именуются изопериметрическими.
Характерной особенностью экстремальных задач является то, что их постановка была порождена актуальными запросами развития общества. Более того, начиная с XVII века доминирующим становится представление о том, что законы окружающего нас мира являются следствием некоторых вариационных принципов. Первым из них был принцип П. Ферма (1660 год), в соответствии с которым траектория света, распространяющегося от одной точки к другой, должна быть такова, чтобы время прохождения света вдоль этой траектории было минимально возможным. Впоследствии были предложены раз- личные широко используемые в естествознании вариационные принципы, например: принцип стационарного действия У.Р. Гамильтона (1834 год), принцип виртуальных перемещений, принцип наименьшего принуждения и др. Параллельно развивались и методы решения экстремальных задач. Около 1630 года Ферма сформулировал метод исследования на экстремум для полиномов, состоящий в том, что в точке экстремума производная равняется нулю. Для общего случая этот метод получен И. Ньютоном (1671) и Г.В. Лейбницем (1684), работы которых знаменуют зарождение математического анализа. Начало развития классического вариационного исчисления датируется появлением в 1696 году статьи И. Бернулли (ученика Лейбница), в которой сформулирована постановка задачи о кривой, соединяющей две точки А и В, двигаясь по которой из точки А в В под действием силы тяжести материальная точка достигнет В за минимально возможное время.
В рамках классического вариационного исчисления в XVIII-XIX веках установлены необходимые условие экстремума первого порядка (Л. Эйлер, Ж.Л. Лагранж), позднее развиты необходимые и достаточные условия второго порядка (К.Т.В. Вейерштрасс, А.М. Лежандр, К.Г.Я. Якоби), построены теория Гамильтона-Якоби и теория поля (Д. Гиль- берт, А. Кнезер). Дальнейшее развитие теории экстремальных задач привело в XX веке к созданию линейного программирования, выпуклого анализа, математического программирования, теории минимакса и некоторых иных разделов, одним из которых является теория оптимального управления.
Эта теория подобно другим направлениям теории экстремальных задач, возникла в связи с актуальными задачами автоматического регулирования в конце 40-х годов (управление лифтом в шахте с целью наискорейшей остановки его, управление движением ракет, стабилизация мощности гидроэлектростанций и др.). Заметим, что постановки отдельных задач, которые могут быть интерпретированы как задачи оптимального управления, встречались и ранее, например в “Математических началах натуральной философии” И. Ньютона (1687). Сюда же относятся и задача Р. Годдарда (1919) о подъеме ракеты на заданную высоту с минимальными затратами топлива и двойственная ей задача о подъеме ракеты на максимальную высоту при заданном количестве топлива. За прошедшее время были установлены фундаментальные принципы теории оптимального управления: принцип максимума и метод динамического программирования.
Указанные принципы представляют собой развитие классического вариационного исчисления для исследования задач, содержащих сложные ограничения на управление.
Сейчас теория оптимального управления переживает период бурного развития как в связи с наличием трудных и интересных математических проблем, так и в связи с обилием приложений, в том числе и в таких областях, как экономика, биология, медицина, ядерная энергетика и др.
Все задачи оптимального управления можно рассматривать как задачи математического программирования и в таком виде решать их численными методами.
При оптимальном управлении иерархическими многоуровневыми системами, например, крупными химическими производствами, металлургическими и энергетическими комплексами, применяются многоцелевые и многоуровневые иерархические системы оптимального управления. В математическую модель вводятся критерии качества управления для каждого уровня управления и для всей системы в целом, а также координация действий между уровнями управления.
Если управляемый объект или процесс является детерминированным, то для его описания используются дифференциальные уравнения. Наиболее часто используются обыкновенные дифференциальные уравнения вида. В более сложных математических моделях (для систем с распределёнными параметрами) для описания объекта используются дифференциальные уравнения в частных производных. Если управляемый объект является стохастическим, то для его описания используются стохастические дифференциальные уравнения.
Если решение поставленной задачи оптимального управления не является непрерывно зависящим от исходных данных (некорректная задача), то такая задача решается специальными численными методами.
Система оптимального управления, способная накапливать опыт и улучшать на этой основе свою работу, называется обучающейся системой оптимального управления.
Реальное поведение объекта или системы всегда отличается от программного вследствие неточности в начальных условиях, неполной информации о внешних возмущениях, действующих на объект, неточности реализации программного управления и т.д. Поэтому для минимизации отклонения поведения объекта от оптимального обычно используется система автоматического регулирования.
Иногда (например, при управлении сложными объектами, такими как доменная печь в металлургии или при анализе экономической информации) в исходных данных и знаниях об управляемом объекте при постановке задачи оптимального управления содержится неопределённая или нечёткая информация, которая не может быть обработана традиционными количественными методами. В таких случаях можно использовать алгоритмы оптимального управления на основе математической теории нечётких множеств (Нечёткое управление). Используемые понятия и знания преобразуются в нечёткую форму, определяются нечёткие правила вывода принимаемых решений, затем производится обратное преобразование нечётких принятых решений в физические управляющие переменные.
Оптимальное управление технологическими процессами (Лекция)
ПЛАН ЛЕКЦИИ
1. Основные понятия нахождения экстремума функции
2. Классификация методов оптимального управления
1. Основные понятия нахождения экстремума функции
Всякая математическая постановка оптимальной задачи часто равносильна или эквивалентна задаче отыскания экстремума функции одной или многих независимых переменных. Поэтому для решения таких оптимальных задач могут быть использованы различные методы поиска экстремума.
В общем случае задача оптимизации формулируется следующим образом:
Найти extr функции R (x ), где ХХ
R (x ) – называется целевой функцией или функцией или критерием оптимизации или оптимизируемой функцией
Х – независимая переменная.
Как известно необходимые условиям существования экстремума у непрерывной функции R (x ) могут быть получены из анализа первой производной . При этом функция R (x ) может иметь экстремальные значения при таких значениях независимой переменной Х, где первая производная равна 0. т.е. =0. Графически равенство нулю производной означает, что касательная к кривой R (x ) в этой точке параллельна оси абсцисс.
Равенство производной =0 есть необходимое условие экстремума.
Однако равенство нулю производной еще не означает, что в этой точке существует экстремум. Для того, чтобы окончательно убедится, что в этой точке действительно существует экстремум необходимо провести дополнительные исследования, которые заключаются в следующих способах:
1. Способ сравнения значений функций
Сравнивают значение функции R (x ) в «подозреваемой» на экстремум точке Х К две соседние значения функции R (x ) в точках Х К-ε и Х К+ε , где ε- малая положительная величина. (Рис. 2)
Если оба рассчитанных значения R (Х К+ε) и R (Х К-ε), окажутся меньше или больше R (Х К), то в точке Х К существует максимум или минимум функции R (х).
Если же R (Х К) имеет промежуточное значение между R (Х К-ε) и R (Х К+ε), то функция R (х) не имеет ни максимума ни минимума.
2. Способ сравнения знаков производных
Опять рассмотрим функцию R (Х К) в окрестностях точки Х К, т.е. Х К+ε и Х К-ε . При этом способе рассматривается знак производной в окрестности точки Х К. Если знаки производной в точках Х К-ε и Х К+ε различные, то в точке Х К существует экстремум. При этом вид экстремума (min или max ) может быть найден по изменению знака производной при переходе от точки Х К-ε к точке Х К+ε.
Если знак меняется с «+» на «-», то в точке Х К – максимум (рис. 3б), если наоборот с «-» на «+», то минимум. (Рис. 3а)
3. Способ исследования знаков высших производных.
Этот способ применяют в тех случаях, когда в точке «подозреваемой» на экстремум существуют производные высших порядков, т.е. функция R (Х К) не только сама непрерывна, но имеет также непрерывные производные и .
Способ сводится к следующему:
В точке Х К «подозреваемой» на экстремум, для которой справедливо
вычисляется значение второй производной .
Если при этом , то в точке Х К – максимум,
если , то в точке Х К – минимум.
При решении практических задач оптимизации требуется отыскать не какое-нибудь min или max значение функции R (Х К), а наибольшее или наименьшее значение этой функции, которое называется глобальным экстремумом. (Рис. 4)
В общем случае задача оптимизации состоит в отыскивании экстремума функции R (Х), при наличии тех или иных ограничений на уравнения математической модели.
В том случае, если R (Х) является линейной, а область допустимых решений задается линейными равенствами и неравенствами, то задача отыскания экстремумов функции относится к классу задач линейного программирования.
Часто множество Х определяют как систему функции
Тогда запись математической постановки задачи линейного программирования выглядит так:
В том случае, если или целевая функция R (Х) или какая-либо из ограничений не является линейной функцией, то задача отыскания экстремума функции R (Х) относится к классу задач нелинейного программирования.
В том случае, если на переменные Х не наложено никаких ограничений, то такая задача называется задачей на безусловный экстремум.
Пример типовой задачи оптимизации
Задача о коробке максимального объема.
Из этой заготовки следует вырезать четыре ровных квадрата по ее углам, а полученную фигуру (рис.5 б) согнуть так, чтобы получилась коробка без верхней крышки (рис.6.5 в). при этом необходимо так выбрать размер вырезаемых квадратов, чтобы получилась коробка максимального объема.
На примере данной задачи можно проиллюстрировать все элементы постановки задач оптимизации.
Рис. 5. Схема изготовления коробки из прямоугольной заготовки фиксированного размера
Оценочной функцией в данной задаче служит объем изготовленной коробки. Проблема заключается в выборе размера вырезаемых квадратов. Действительно, если размер вырезаемых квадратов слишком мал, то будет получена широкая коробка малой высоты, а значит и объем окажется невелик. С другой стороны, если размер вырезаемых квадратов будет слишком большой, то будет получена узкая коробка большой высоты, а значит, и ее объем также окажется невелик.
В то же время на выбор размера вырезаемых квадратов оказывает влияние ограничение размера исходной заготовки. Действительно, если вырезать квадраты со стороной, равной половине стороны исходной заготовки, то задача теряет смысл. Сторона вырезаемых квадратов также не может превышать половину сторон исходной заготовки, поскольку это невозможно из практических соображений. Из этого следует, что в постановке данной задачи должны присутствовать некоторые ограничения.
Математическая постановка задачи о коробке максимального объема . Для математической постановки данной задачи необходимо ввести в рассмотрение некоторые параметры, характеризующие геометрические размеры коробки. С этой целью дополним содержательную постановку задачи соответствующими параметрами. С этой целью будем рассматривать квадратную заготовку из некоторого гибкого материала, которая имеет длину стороны L (рис. 6). Из этой заготовки следует вырезать четыре ровных квадрата со стороной по ее углам, а полученную фигуру согнуть, так чтобы получилась коробка без верхней крышки. Задача состоит в таком выборе размера вырезаемых квадратов, чтобы в результате получилась коробка максимального объема.
Рис. 6. Схема изготовления из прямоугольной заготовки с указанием ее размеров
Для математической постановки данной задачи необходимо определить переменные соответствующей задачи оптимизации, задать целевую функцию и специфицировать ограничения. В качестве переменной следует взять длину стороны вырезаемого квадрата r , которая в общем случае, исходя из содержательной постановки задачи, принимает непрерывные действительные значения. Целевой функцией является объем полученной коробки. Поскольку длина стороны основания коробки равна: L - 2r , а высота коробки равна r , то ее объем находится по формуле: V (r) = (L -2r ) 2 r . исходя из физических соображений, значения переменной r не могут быть отрицательными и превышать величину половины размера исходной заготовки L , т.е. 0,5L .
При значениях r = 0 и r = 0,5 L соответствующие решения задачи о коробке являются выраженными. Действительно, в первом случае заготовка остается без изменения, а во втором случае она разрезается на 4 одинаковых части. Поскольку эти решения имеют физическую интерпретацию, задачу о коробке для удобства ее постановки и анализа можно считать оптимизации с ограничениями типа нестрогих неравенств.
С целью унификации, обозначим переменную через х = r , что не оказывает влияния на характер решаемой задачи оптимизации. Тогда математическая постановка задачи о коробке максимального объема может быть записана в следующем виде:
где (1)
Целевая функция данной задачи является нелинейной, поэтому задача о коробке максимального размера относится к классу задач нелинейного программирования или нелинейной оптимизации.
2. Классификация методов оптимального управления
Оптимизация процесса заключается в нахождении оптимума рассматриваемой функции или оптимальных условий проведения данного процесса.
Для оценки оптимума, прежде всего, необходимо выбрать критерий оптимизации. Обычно, критерий оптимизации выбирает из конкретных условий. Это могут быть технологический критерий (например, содержание Сu в отвальном шлаке) или экономический критерий (минимальная стоимость продукта при заданной производительности труда) и др. На основании выбранного критерия оптимизации составляется целевая функция, представляющая собой зависимость критерия оптимизации от параметров влияющих на его значение. Задача оптимизации сводится к нахождению экстремума целевой функции. В зависимости от характера рассматриваемых математических моделей принимаются различные математические методы оптимизации.
Общая постановка задачи оптимизации заключается в следующем:
1. Выбирается критерий
2. Составляется уравнение модели
3. Накладывается система ограничения
4. Решение
модель - линейная или нелинейная
Ограничения
В зависимости от структуры модели применяются различные методы оптимизации. К ним относятся:
1. Аналитические методы оптимизации (аналитический поиск экстремума, метод множителей Лагранжа, Вариационные методы)
2. Математическое программирование (линейное программирование, динамическое программирование)
3. Градиентные методы.
4. Статистические методы (Регрессионный анализ)
Линейное программирование . В задачах линейного программирования критерий оптимальности представляется в виде:
где - заданные постоянные коэффициенты; Переменные задачи. |
Уравнения модели представляют собой линейные уравнения (полиномы) вида на которые накладывается ограничения в виде равенства или неравенства, т.е. (2)
В задачах линейного программирования обычно предполагается, что все независимые переменные Х j неотрицательны, т.е.
Оптимальным решением задачи линейного программирования является такая совокупность неотрицательных значений независимых переменных
Которая удовлетворяет условия (2) и обеспечивает в зависимости от постановки задачи max или min значение критерия.
Геометрическая интерпретация имеет вид: - критерий при наличии ограничении на переменных Х 1 и Х 2 типа равенств и неравенств
R имеет постоянное значение вдоль линии l . Оптимальное решение будет в точке S , т.к. в этой точке критерий будет max .Одним из методов решения задачи оптимизации линейного программирования является симплекс-метод.
Нелинейное программирование . Математическая постановка задачи нелинейного программирования заключается в следующем: Найти экстремум целевой функции , которая имеет вид нелинейности.
На независимые переменные налагаются различные ограничения типа равенств или неравенств
в настоящее время для решения задач нелинейного программирования применяются довольно большое число методов.
К ним относится: 1) Градиентные методы (метод градиента, метод наискорейшего спуска, метод образов, метод Розенброка и т.д.)
2) Безградиентные методы (метод Гауса-Зейделя, метод сканирования).
Градиентные методы оптимизации
Эти методы относятся к численным методам поискового типа. Сущность этих методов заключается в определении значений независимых переменных, дающих наибольшее (наименьшее) изменение целевых функции. Обычно это достигается при движении вдоль градиента, ортогонального к контурной поверхности в данной точке.
Рассмотрим метод градиента. В этом методе используется градиент целевой функции. В методе градиента шаги совершаются в направлении наибыстрейшего уменьшения целевой функции.
Рис. 8. Поиск минимума методом градиента
Поиск оптимума производится в два этапа:
1-этап: - находят значения частных производных по всем независимым переменным, которые определяют направление градиента в рассматриваемой точке.
2-этап: - осуществляется шаг в направлении обратном направлению градиента, т.е. в направлении наибыстрейшего убывания целевой функции.
Алгоритм градиентного метода может быть записан следующим образом:
(3)
Характер движения к оптимуму методом наискорейшего спуска заключается в следующем (рис. 6.9), после того как в начальной точке найден градиент оптимизируемой функции и тем самым определено направление ее наибыстрейшего убывания в указанной точке, в данном направлении делается шаг спуска. Если значение функции в результате этого шага уменьшилась, то производится очередной шаг в том же направлении, и так до тех пор, пока в этом направлении не будет найден минимум, после чего вычисляется снова градиент и определяется новое направление наибыстрейшего убывания целевой функции.
Безградиентные методы поиска экстремума. Эти методы, в отличии от градиентных, используют в процессе поиска информации, получаемую не при анализе производных, а от сравнительной оценки величины критерия оптимальности в результате выполнения очередного шага.
К безградиентным методам поиска экстремума относится:
1. метод золотого сечения
2. метод с использованием чисел Фибония
3. метод Гауса-Зейделя (метод получения изменения переменной)
4. метод сканирования и т.д.
Оптимальное управление
Андрей Александрович Аграчёв
Человеку свойственно стремление к совершенству. В математике оно проявляется в поиске наилучших (оптимальных) решений, включая все задачи на максимум и минимум. К теории оптимального управления относятся те из них, где решение имеет некоторую протяженность во времени или в пространстве. Подходящий образ — прокладывание наилучшего пути при движении по сильно пересечённой местности.
Вообще, математики, как и все люди, очень любят зрительные образы, но в действительности речь идёт о любой системе, которую можно непрерывно менять в определённых пределах, как мы меняем направление движения при прокладывании пути. Другие подходящие примеры: управление автомобилем, летательным аппаратом, технологическим процессом, своим телом, в конце концов.
Требуется наилучшим образом перевести систему из заданного состояния в желаемое: как можно быстрее, или наиболее экономным образом, или с наибольшей выгодой, или в соответствии с каким‐то более сложным критерием; мы сами решаем, что важнее. Если мгновенная реакция системы на наши действия хорошо известна, то теория оптимального управления призвана помочь нам найти наилучшую долговременную стратегию. Вот простой пример: нужно как можно быстрее остановить колебания (скажем, остановить «качели»), прикладывая свою невеликую силу то с одной стороны, то с другой. Переходить с одной стороны на другую придётся многократно. По какому правилу это делать? Понятно, что «качели» могут быть и финансовыми, и экономическими, и физико‐техническими…
Стоит заметить, что такой очевидно прикладной предмет, как теория оптимального управления, был создан в Математическом институте имени Стеклова чистыми математиками, Львом Семёновичем Понтрягиным и его учениками, профессиональными топологами. Первые впечатляющие применения этой теории, принесшие ей славу, относятся к советской космической программе и американской программе «Аполлон». В этих программах всё делалось на пределе возможностей, и без умной оптимизации было не справиться. Среди популярных тогда задач можно отметить наиболее экономный перевод космического аппарата с одной эллиптической орбиты на другую и мягкое прилунение. Главное достижение того периода — принцип максимума Понтрягина — мощное универсальное средство, позволяющее отобрать достаточно узкий класс управляющих стратегий, среди которых только и может быть оптимальная.
Принцип максимума Понтрягина особенно хорош в применении к простым «линейным» моделям, но теряет свою эффективность и должен быть дополнен другими средствами при исследовании систем с более сложной нелинейной структурой. Вернёмся к примеру с качелями. Если амплитуда колебаний небольшая, то система почти линейна и период колебаний почти не зависит от амплитуды. Принцип максимума даёт простой и однозначный закон оптимального поведения для линейного приближения: надо переходить с одной стороны на другую ровно через полпериода и всякий раз применять максимально возможную силу. В то же время при большой амплитуде, когда система существенно нелинейна, рекомендации принципа максимума сильно усложняются и перестают быть однозначными.
Новые правила оптимального поведения, дополняющие принцип максимума, даёт активно развиваемая в настоящее время геометрическая теория управления. Дело в том, что современная геометрия позволяет очень сильно расширять возможности управления, играя порядком и длительностью применения нескольких простых манёвров, отбирая оптимальные «гармоничные» сочетания манёвров, результат каждого из которых хорошо известен и вполне банален. Похоже на то, как из нескольких нот составляется симфония, только в математике всё точнее, строже и симметричней, хотя и не столь эмоционально.
Геометрическая теория управления применяется в космической навигации, робототехнике и многих других областях, но наиболее популярные современные приложения относятся, пожалуй, к квантовым системам (от медицинских аппаратов ядерного магнитного резонанса до химических манипуляций с отдельными молекулами). Обаяние геометрической теории управления состоит, среди прочего, в редкой возможности материализовать, увидеть и «пощупать» красивые и глубокие абстрактные математические концепции, ну и, конечно, создавать новые!
Литература
Тихомиров В. М. Рассказы о максимумах и минимумах. — М.: Наука, 1986. — (Библиотечка «Квант»; Вып. 56). — [Переиздания: М.: МЦНМО, 2006, 2017].
Протасов В. Ю. Максимумы и минимумы в геометрии. — М.: МЦНМО, 2012. — (Библиотека «Математическое просвещение»; Вып. 31).