Обновления
Хрущовки
Архитектура Румынии
Венецианское Биеннале
Столица Грац
Дом над водопадом
Защита зданий от атмосферных осадков
Краковские тенденции
Легендарный город Севастополь
Новый Париж Миттерана
Парадоксы Советской архитектуры
Реконструкция города Фрунзе
Реконструкция столицы Узбекистана
Софиевка - природа и искусство
Строительство по американски
Строительтво в Чикаго
Тектоника здания
Австрийская архитектура
Постмодернизм в Польше
Промышленное строительство
Строительство в Японии
Далее
|
Главная -> Логарифмическое определение устойчивости =ау + си (12.149). с начальньш условием у (0) = у. Требуется определить оптимальное управление и = -W-per (р) У1 переводящее систему в состояние у = О с бесконечным временем регулирования и минимизирующее функционал / = j (2 tV + Vu) dt. (12.150) Рассматривая функцию (12.131) Н = у + tV + [Ilf + 1{у-аи - си) и используя уравнения (12.130) или (12.132), а такн№ уравнение объекта (12.149), можно получить характеристическое уравнение замкнутой оптимальной системы в виде (сЧ -f [х) р2 - (с + lia) = 0. (12.151) Корень, лежащий в левой полуплоскости, . Уравнение экстремали, проходящей через граничные точки, y=yo~yo{i-e-t).i{t). (12.152) Предварительно определив У = -ае- -1 (t), из (12.149) можно найти, что управление должно изменяться по закону и = (у - ау) = уос- [-{а + а) е -1 (t) - а {1 - I (t)}]. (12.153) Приняв е- за неизвестную, входящую в два уравнения (12.152) и (12.153), можно записать условие их совместности: y-yo[l~l{t)] yoi{t) и+уфс- [1 -1 ( )] (а + а) Уос-* 1 it) Отсюда получается уравнение регулятора = - +Т II -1 (12.154) Первое слагаемое в правой части (12.154) соответствует собственно искомому оптимальному закону регулирования и= -WAp)y- -У- (12.155) = 0. Поэтому физическая реализация возможна для степени D (р) не выше первой, но даже и в этом случае регулятор должен быть практически безьшер-ционным. Получение физически не реализуемого регулятора произошло вследствие отсутствия ограничений или учета управления в принятом функционале качества (12.146). Для пол5ения возможности применения инерционных регуляторов в функционал качества можно вводить кроме управления и его производные. Однако в этом случае смысл функционала качества становится неясным. Рассмотрим теперь замкнутую систему, у которой объект управления описывается дифференциальным уравнением § 12.9] ДИНАМИЧЕСКОЕ ПРОГРАММИРбВАНИЕ 383 Второе слагаемое в правой части (12.154) соответствует постоянному значе-шш управления и = Uq = аус, которое необходимо искусственно создать на выходе регулятора, чтобы в замкнутой системе до момента времени t = О (т. е. при < 0) управляемая величина была бы равна заданному значению Уо. Как следует из (12.154), при t = О это постоянное управление снимается и система начнет приходить в согласованное положение. Если при t <сО рассматриваемая система была выключена и мела рассогласование у = уо, то слагаемое щ не нужно и формула (12.154) сводится к (12.155). Рассмотренный пример относится к так называемому аналитическому конструированию регуляторов, которое будет изложено более подробно в § 12.10. § 12.9. Динамическое программирование Метод динамического программирования был разработан Р. Беллманом 15]. Он применим не только для реюаения задач оптимизации систем управления, но и для самых различных технических и экономических задач. При обосновании этого метода предполагается, что функционал качества является дифференцируемой функцией фазовых координат системы. Заметим, что это условие выполняется не всегда. Пусть система описывается совокупностью п уравнений, записанных для фазовых координат: - = /,(Xi, ...,гг ) (i = l, ..., ), (12.156) где fi - некоторые, в общем случае нелинейные функции фазовых координат и управлений. Число последних для общности принято равным числу фазовых координат. Уравнения (12.156) можно представить также в матричной форме: i = f{,u), (12.157) где X ш и - матрицы-столбцы фазовых координат и управлений размером тг X 1. Б качестве критерия оптимальности примем минимум функционала г = j /о (Ж1, Хп, щ, ...,Un) dt. (12.158) Функции /о и fi, вообще говоря, могут содержать в явном виде текущее время t. Однако это не меняет принципиальной постановки задачи. Целью управления является перевод системы из состояния = Oj при t = О в состояние = bi при t = Т {i - I, . . ., п). Такая задача управления называется терминальной, и она соответствует определению в фазовом пространстве оптимальной траектории с закрепленными концами. Будем считать, что фазовые координаты и управления должны принадлежать некоторым замкнутым (ограниченным) пространствам, т. е. x{t)£X, х(0)=йСо, x{T) = b£Gr, I ити, 0<.<Г. } (12.159) Можно несколько расширить цель управления и считать, что конец траектории должен только находиться в заданной области х {Т) Сь при t = Т. Это будет задача со свободным концом траектории. Вместо исходной можно решать более общую задачу отыскания оптимального управления для произвольной временной точки О < fо < И произвольной точки в фазовом пространстве х (t € в смысле минимума функционала Io=\u{,u)&t. (12.160) Минимум функционала (12.160) зависит от начального момента времени to и начальной точки х = х (f). Обозначим этот минимум через -ф (жо). Функция ф (Ж(,) для некоторой совокупности фазовых координат х (t может, вообще говоря, не существовать, так как может не существовать допустимого управления, удовлетворяющего (12.156). Если найдены функция -ф (ж) и требуемое управление и {t, Хд), то, положив to = О ш Xf) = а, где а - матрица-столбец начальных условий, мы получим решение исходной задачи. Принцип оптимальности. Примем начальные условия: при t=to х {tg) = = о € G, оптимальное управление и (t, ад) реализует минимум функционала (12.160), а X (t, ао) - оптимальная траектория в фазовом пространстве. Выберем произвольный момент времени t, принадлежащий интервалу 0 - Т, и обозначим через точку = ж (i, о) на оптимальной траектории X {t, йо). Принцип оптимальности гласит следующее. Если принять значения t и % за начальные, то на интервале t - Т оптимальное управление и (t, а) совпадет с оптимальным управлением и (t, ао) и, следовательно, участок оптимальной траектории х (t, йо) для задачи с начальной точкой (to, ао) на интервале t - Т совпадет с оптимальной траекторией для задачи с начальной точкой (fj, а). Доказательство достаточно очевидно. Оно исходит из того, что значение функционала качества на участке t - Т должно быть одинаковьш при управлениях и {t, а и и (t, ад). Если бы это было не так и значение функционала на этом интервале времени было бы, например, меньше для управления и (t, а), то управление и {t, ао) можно было бы улучшить, заменив его на интервале t - Т управлением и (t, а), что противоречит принятому предположению об оптимальности управления и {t, ао)- Итак, в соответствии с изложенным введем функциональное уравнение [Т, x(to)] = mm [ fo{x, u)dt, (12.161) на основании которого может быть найдено оптимальное управление и (х). Если на промежутке to - Т выбрать промежуточную точку t, то на основании принципа оптимальности ф IT, X(to)] = min I ( /о(x, и) dt+lT, X (ti)]} . (12.162) Функция ф и оптимальное управление обычно не могут быть найдены аналитическим путем. Для этой цели применяются приближенные методы с использованием вычислительных машин. Рассмотрим идею приблинсенного расчета. Пусть t - фиксированное значение времени, & At - малый отрезок времени, причем О <.t + At <С Т. Тогда t+ht т г15 (f, ж) = min I j fo{x,u)dx-\- j /о(ж, м)йт, (12.163) t t+M где функции X (т) и и (т) связаны условиями (12.157).
|