![]() |
![]() |
Главная -> Логарифмическое определение устойчивости =ау + си (12.149). с начальньш условием у (0) = у. Требуется определить оптимальное управление и = -W-per (р) У1 переводящее систему в состояние у = О с бесконечным временем регулирования и минимизирующее функционал / = j (2 tV + Vu) dt. (12.150) Рассматривая функцию (12.131) Н = у + tV + [Ilf + 1{у-аи - си) и используя уравнения (12.130) или (12.132), а такн№ уравнение объекта (12.149), можно получить характеристическое уравнение замкнутой оптимальной системы в виде (сЧ -f [х) р2 - (с + lia) = 0. (12.151) Корень, лежащий в левой полуплоскости, . Уравнение экстремали, проходящей через граничные точки, y=yo~yo{i-e-t).i{t). (12.152) Предварительно определив У = -ае- -1 (t), из (12.149) можно найти, что управление должно изменяться по закону и = (у - ау) = уос- [-{а + а) е -1 (t) - а {1 - I (t)}]. (12.153) Приняв е- за неизвестную, входящую в два уравнения (12.152) и (12.153), можно записать условие их совместности: y-yo[l~l{t)] yoi{t) и+уфс- [1 -1 ( )] (а + а) Уос-* 1 it) Отсюда получается уравнение регулятора = - +Т II -1 (12.154) Первое слагаемое в правой части (12.154) соответствует собственно искомому оптимальному закону регулирования и= -WAp)y- -У- (12.155) = 0. Поэтому физическая реализация возможна для степени D (р) не выше первой, но даже и в этом случае регулятор должен быть практически безьшер-ционным. Получение физически не реализуемого регулятора произошло вследствие отсутствия ограничений или учета управления в принятом функционале качества (12.146). Для пол5ения возможности применения инерционных регуляторов в функционал качества можно вводить кроме управления и его производные. Однако в этом случае смысл функционала качества становится неясным. Рассмотрим теперь замкнутую систему, у которой объект управления описывается дифференциальным уравнением § 12.9] ДИНАМИЧЕСКОЕ ПРОГРАММИРбВАНИЕ 383 Второе слагаемое в правой части (12.154) соответствует постоянному значе-шш управления и = Uq = аус, которое необходимо искусственно создать на выходе регулятора, чтобы в замкнутой системе до момента времени t = О (т. е. при < 0) управляемая величина была бы равна заданному значению Уо. Как следует из (12.154), при t = О это постоянное управление снимается и система начнет приходить в согласованное положение. Если при t <сО рассматриваемая система была выключена и мела рассогласование у = уо, то слагаемое щ не нужно и формула (12.154) сводится к (12.155). Рассмотренный пример относится к так называемому аналитическому конструированию регуляторов, которое будет изложено более подробно в § 12.10. § 12.9. Динамическое программирование Метод динамического программирования был разработан Р. Беллманом 15]. Он применим не только для реюаения задач оптимизации систем управления, но и для самых различных технических и экономических задач. При обосновании этого метода предполагается, что функционал качества является дифференцируемой функцией фазовых координат системы. Заметим, что это условие выполняется не всегда. Пусть система описывается совокупностью п уравнений, записанных для фазовых координат: - = /,(Xi, ...,гг ) (i = l, ..., ), (12.156) где fi - некоторые, в общем случае нелинейные функции фазовых координат и управлений. Число последних для общности принято равным числу фазовых координат. Уравнения (12.156) можно представить также в матричной форме: i = f{,u), (12.157) где X ш и - матрицы-столбцы фазовых координат и управлений размером тг X 1. Б качестве критерия оптимальности примем минимум функционала г = j /о (Ж1, Хп, щ, ...,Un) dt. (12.158) Функции /о и fi, вообще говоря, могут содержать в явном виде текущее время t. Однако это не меняет принципиальной постановки задачи. Целью управления является перевод системы из состояния = Oj при t = О в состояние = bi при t = Т {i - I, . . ., п). Такая задача управления называется терминальной, и она соответствует определению в фазовом пространстве оптимальной траектории с закрепленными концами. Будем считать, что фазовые координаты и управления должны принадлежать некоторым замкнутым (ограниченным) пространствам, т. е. x{t)£X, х(0)=йСо, x{T) = b£Gr, I ити, 0<.<Г. } (12.159) Можно несколько расширить цель управления и считать, что конец траектории должен только находиться в заданной области х {Т) Сь при t = Т. Это будет задача со свободным концом траектории. Вместо исходной можно решать более общую задачу отыскания оптимального управления для произвольной временной точки О < fо < И произвольной точки в фазовом пространстве х (t € в смысле минимума функционала Io=\u{,u)&t. (12.160) Минимум функционала (12.160) зависит от начального момента времени to и начальной точки х = х (f). Обозначим этот минимум через -ф (жо). Функция ф (Ж(,) для некоторой совокупности фазовых координат х (t может, вообще говоря, не существовать, так как может не существовать допустимого управления, удовлетворяющего (12.156). Если найдены функция -ф (ж) и требуемое управление и {t, Хд), то, положив to = О ш Xf) = а, где а - матрица-столбец начальных условий, мы получим решение исходной задачи. Принцип оптимальности. Примем начальные условия: при t=to х {tg) = = о € G, оптимальное управление и (t, ад) реализует минимум функционала (12.160), а X (t, ао) - оптимальная траектория в фазовом пространстве. Выберем произвольный момент времени t, принадлежащий интервалу 0 - Т, и обозначим через точку = ж (i, о) на оптимальной траектории X {t, йо). Принцип оптимальности гласит следующее. Если принять значения t и % за начальные, то на интервале t - Т оптимальное управление и (t, а) совпадет с оптимальным управлением и (t, ао) и, следовательно, участок оптимальной траектории х (t, йо) для задачи с начальной точкой (to, ао) на интервале t - Т совпадет с оптимальной траекторией для задачи с начальной точкой (fj, а). Доказательство достаточно очевидно. Оно исходит из того, что значение функционала качества на участке t - Т должно быть одинаковьш при управлениях и {t, а и и (t, ад). Если бы это было не так и значение функционала на этом интервале времени было бы, например, меньше для управления и (t, а), то управление и {t, ао) можно было бы улучшить, заменив его на интервале t - Т управлением и (t, а), что противоречит принятому предположению об оптимальности управления и {t, ао)- Итак, в соответствии с изложенным введем функциональное уравнение [Т, x(to)] = mm [ fo{x, u)dt, (12.161) на основании которого может быть найдено оптимальное управление и (х). Если на промежутке to - Т выбрать промежуточную точку t, то на основании принципа оптимальности ф IT, X(to)] = min I ( /о(x, и) dt+lT, X (ti)]} . (12.162) Функция ф и оптимальное управление обычно не могут быть найдены аналитическим путем. Для этой цели применяются приближенные методы с использованием вычислительных машин. Рассмотрим идею приблинсенного расчета. Пусть t - фиксированное значение времени, & At - малый отрезок времени, причем О <.t + At <С Т. Тогда t+ht т г15 (f, ж) = min I j fo{x,u)dx-\- j /о(ж, м)йт, (12.163) t t+M где функции X (т) и и (т) связаны условиями (12.157).
|