![]() |
![]() |
Главная -> Повышение запаса устойчивости Используем решение классической вариациопной задачи для синтеза оптимального уравнения. Положим, что дифференциальное уравнение объекта имеет вид (24.3). Введем в фуикнию /,) дополпительные переменные ми м, т. е. сформируем функционал (24.12) в виде I=jfoixi,...x ;x\,...x ;u,u)dt. (24.15) При этом грапичтн>1е условия задаются только для х но требование дважды дифференцируемости распространяется на все переменные. Уравнения (24.13) тоже составляются для всех переменных, т. е. г = 1,2,..., ?г -ь 1. Динамические свойства объекта учтем в виде ограничения типа нсголономных связей (24.8), где функция 67 определяется из дифферетгциального уравнения (24,3). Тогда в уравнениях (24.13) вместо функции /о .юлжна использоваться функция H = k)+Y?kiOGk> (24.16) где (/.) - произвольные множители Дагранжа, в общем случае зависящие от времени t. Рассмотрим простейший пример. Пусть объект описывается уравнением a,)-t-I-а,х = м; (24.17) (ац/Л-д,)- = . (24.18) гдед: = г/ - управляемая величина, P~~J- Цель управления заключается в переводе объекта из состояния х(0) = О при /о = О в состояние x{t ) = Xq, гдехц - задающее воздействие. Функционал (24.15) представим в виде I = \\{x-XQf+v?u-\dt, (24.19) где р. - некоторый весовой коэффициепт. Динамические свойства объекта (24.17) учтем в виде ограничения (24.3): (7=ао-г- + а,.г-м = 0. (24.20) Другие ограничения пахци отсутствуют. Формируем функцию (24.16): Я = (л- - То )Ч цм -(- X {ах + щх-и). (24.21) Для получения уравнений Эйлера (24.13) находим: - = 2(х-Х(,) + Ла - = Ла ; ох дх -- = 2рм-л, - = 0. ди ди Таким образом, уравнения (24.13) и.меют вид 2(х-Хо) + А ,--(Х о) = 0, 2рм-Л = 0. Из уравнений (24.22) определяем оптимальное управление (24.2;) и=-2р 2 (24.23) , 2(х-Хо) (24.24) Подставив (24.23) и (24.24) в уравнение (24.18) нолучае.м дифференциальное ура li-нение объекта при опти,ма..тьно.м управлении: (p4V-pV-1)=--o- (24-23; Для его решения находим корпи характеристического уравнения: i,2=±VlVaF = ±a. Тогда (см. табл. 7.1) Pu=±Vl + l 1 =±ot. (24.2(5) x(0 = .o+Cie-+Cy. (24-27) где при заданных граничных условиях х (0) = О, х (i,J = х Выражение (24.27) определяет опти.мальную траекторию движения объекта. О ти.мальное управление находим из (24.18) с учетом (24.27): м(0 = а,хо +С,(а, -owo)- +C2( i +ow )e , (24.2.; х(ОеЛ, x(to) = aoeGo, х(с) = ЬеС,- (24.30) Далее, пусть при заданном начальном состоянии х(/,о) = ао существует оптимальное управление м(г,ад),обеспечивающее.мини.мумфункционала(24.И),а x(t,ao) - опти.мальная траектория в пространстве состояний. Выберем произвольный момент времени tj, принадлежащий иптерва,чу Гд- обозначим через а, точку , = x(fi,ao) на опти.мальной траектории x(t,aQ ). Принцип онти.мальпости состоит в следующем. Если принять значения t, и а, за начальные, то на интервале t f, оптимальное управление u{t,dy) совпадет с опти.мальным управлением й{1,а) и, следовательно, участок опти.мальной Траектории х{1,а) для задачи с начальной точкой {(,а) на интервале f совпадет с оптимальной траекторией для задачи с начальной точкой (tj .а,). Доказательство достаточ по очевидно. Оно исходит из того, что .значение функционала качества на участке Г должно быть одинаковым при управлениях г7(г,а,) и и{1,а). Если бы это было не так и значение функционала на этом интервале времени было бы, например, меньше для управления м((,а,), то управление й{1,а) можно было бы улучшить, ,за.мепив его управлением M(t,a,), что противоречит нрипято.му предположению об оптимальности управления й{1,а). где 0<Г<£ . Если tf. = оо, то С, = -Xq, Сг = 0. Тогда и(с) = х [а, + (ооо -й)]. (24.29) Во.зможпость реа.,111зации 0Г1тима1ЫИ>1Х алгорит.мов управления (24.28) в за.мкнутой системе здесь не рассматривается. Из этого примера следует, что даже для простейшего объекта решение задачи синтеза оптимального управления методами классического вариационного исчисления оказывается не очень простым. Однако основные трудности возникают при наличии ограничений в виде неравенств (24.5) и (24.6), а также (что является главным) в связи с тем, что допустимые управления могут быть пе только пепрерывпы.ми, но и раз])ыв-пыми. Поэтому для решепия пеклассических задач обычно применяют другие.методы. К ним относятся, например, разработанные в середине XX века динамическое п[)о-граммирование и принцип максимума, краткое изложение которых дастся в следую-пшх параграфах. § 24.3. Динамическое программирование Метод динамического программирования был разработан Р. Беллманом [4. Он применим пе только для реп1е1и1я задач оптимизации систем управления, но п для самых ра.зличных технических и эко1Юмичсских задач. Пусть система описывается уравнениями (24.1), в качестве критерия оптимальности принят функционал (24.11), а переменные состоятся и управления принадлежат некоторым замкнутым (ограниченным) пространствам, т. е.
|