Главная ->  Логарифмическое определение устойчивости 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 [ 126 ] 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254

=ау + си (12.149).

с начальньш условием у (0) = у. Требуется определить оптимальное управление и = -W-per (р) У1 переводящее систему в состояние у = О с бесконечным временем регулирования и минимизирующее функционал

/ = j (2 tV + Vu) dt. (12.150)

Рассматривая функцию (12.131)

Н = у + tV + [Ilf + 1{у-аи - си)

и используя уравнения (12.130) или (12.132), а такн№ уравнение объекта (12.149), можно получить характеристическое уравнение замкнутой оптимальной системы в виде

(сЧ -f [х) р2 - (с + lia) = 0. (12.151)

Корень, лежащий в левой полуплоскости, .

Уравнение экстремали, проходящей через граничные точки,

y=yo~yo{i-e-t).i{t). (12.152)

Предварительно определив

У = -ае- -1 (t),

из (12.149) можно найти, что управление должно изменяться по закону

и = (у - ау) = уос- [-{а + а) е -1 (t) - а {1 - I (t)}]. (12.153)

Приняв е- за неизвестную, входящую в два уравнения (12.152) и (12.153), можно записать условие их совместности:

y-yo[l~l{t)] yoi{t)

и+уфс- [1 -1 ( )] (а + а) Уос-* 1 it) Отсюда получается уравнение регулятора

= - +Т II -1 (12.154)

Первое слагаемое в правой части (12.154) соответствует собственно искомому оптимальному закону регулирования

и= -WAp)y- -У- (12.155)

= 0.

Поэтому физическая реализация возможна для степени D (р) не выше первой, но даже и в этом случае регулятор должен быть практически безьшер-ционным.

Получение физически не реализуемого регулятора произошло вследствие отсутствия ограничений или учета управления в принятом функционале качества (12.146). Для пол5ения возможности применения инерционных регуляторов в функционал качества можно вводить кроме управления и его производные. Однако в этом случае смысл функционала качества становится неясным.

Рассмотрим теперь замкнутую систему, у которой объект управления описывается дифференциальным уравнением



§ 12.9] ДИНАМИЧЕСКОЕ ПРОГРАММИРбВАНИЕ 383

Второе слагаемое в правой части (12.154) соответствует постоянному значе-шш управления и = Uq = аус, которое необходимо искусственно создать на выходе регулятора, чтобы в замкнутой системе до момента времени t = О (т. е. при < 0) управляемая величина была бы равна заданному значению Уо. Как следует из (12.154), при t = О это постоянное управление снимается и система начнет приходить в согласованное положение.

Если при t <сО рассматриваемая система была выключена и мела рассогласование у = уо, то слагаемое щ не нужно и формула (12.154) сводится к (12.155).

Рассмотренный пример относится к так называемому аналитическому конструированию регуляторов, которое будет изложено более подробно в § 12.10.

§ 12.9. Динамическое программирование

Метод динамического программирования был разработан Р. Беллманом 15]. Он применим не только для реюаения задач оптимизации систем управления, но и для самых различных технических и экономических задач. При обосновании этого метода предполагается, что функционал качества является дифференцируемой функцией фазовых координат системы. Заметим, что это условие выполняется не всегда.

Пусть система описывается совокупностью п уравнений, записанных для фазовых координат:

- = /,(Xi, ...,гг ) (i = l, ..., ), (12.156)

где fi - некоторые, в общем случае нелинейные функции фазовых координат и управлений. Число последних для общности принято равным числу фазовых координат.

Уравнения (12.156) можно представить также в матричной форме:

i = f{,u), (12.157)

где X ш и - матрицы-столбцы фазовых координат и управлений размером тг X 1.

Б качестве критерия оптимальности примем минимум функционала г

= j /о (Ж1, Хп, щ, ...,Un) dt. (12.158)

Функции /о и fi, вообще говоря, могут содержать в явном виде текущее время t. Однако это не меняет принципиальной постановки задачи.

Целью управления является перевод системы из состояния = Oj при t = О в состояние = bi при t = Т {i - I, . . ., п). Такая задача управления называется терминальной, и она соответствует определению в фазовом пространстве оптимальной траектории с закрепленными концами.

Будем считать, что фазовые координаты и управления должны принадлежать некоторым замкнутым (ограниченным) пространствам, т. е.

x{t)£X, х(0)=йСо, x{T) = b£Gr, I

ити, 0<.<Г. } (12.159)

Можно несколько расширить цель управления и считать, что конец траектории должен только находиться в заданной области х {Т) Сь при t = Т. Это будет задача со свободным концом траектории.

Вместо исходной можно решать более общую задачу отыскания оптимального управления для произвольной временной точки О < fо <



И произвольной точки в фазовом пространстве х (t € в смысле минимума функционала

Io=\u{,u)&t. (12.160)

Минимум функционала (12.160) зависит от начального момента времени to и начальной точки х = х (f). Обозначим этот минимум через -ф (жо). Функция ф (Ж(,) для некоторой совокупности фазовых координат х (t может, вообще говоря, не существовать, так как может не существовать допустимого управления, удовлетворяющего (12.156).

Если найдены функция -ф (ж) и требуемое управление и {t, Хд), то, положив to = О ш Xf) = а, где а - матрица-столбец начальных условий, мы получим решение исходной задачи.

Принцип оптимальности. Примем начальные условия: при t=to х {tg) = = о € G, оптимальное управление и (t, ад) реализует минимум функционала (12.160), а X (t, ао) - оптимальная траектория в фазовом пространстве. Выберем произвольный момент времени t, принадлежащий интервалу 0 - Т, и обозначим через точку = ж (i, о) на оптимальной траектории X {t, йо). Принцип оптимальности гласит следующее.

Если принять значения t и % за начальные, то на интервале t - Т оптимальное управление и (t, а) совпадет с оптимальным управлением и (t, ао) и, следовательно, участок оптимальной траектории х (t, йо) для задачи с начальной точкой (to, ао) на интервале t - Т совпадет с оптимальной траекторией для задачи с начальной точкой (fj, а). Доказательство достаточно очевидно. Оно исходит из того, что значение функционала качества на участке t - Т должно быть одинаковьш при управлениях и {t, а и и (t, ад). Если бы это было не так и значение функционала на этом интервале времени было бы, например, меньше для управления и (t, а), то управление и {t, ао) можно было бы улучшить, заменив его на интервале t - Т управлением и (t, а), что противоречит принятому предположению об оптимальности управления и {t, ао)-

Итак, в соответствии с изложенным введем функциональное уравнение

[Т, x(to)] = mm [ fo{x, u)dt, (12.161)

на основании которого может быть найдено оптимальное управление и (х).

Если на промежутке to - Т выбрать промежуточную точку t, то на основании принципа оптимальности

ф IT, X(to)] = min I ( /о(x, и) dt+lT, X (ti)]} . (12.162)

Функция ф и оптимальное управление обычно не могут быть найдены аналитическим путем. Для этой цели применяются приближенные методы с использованием вычислительных машин. Рассмотрим идею приблинсенного расчета.

Пусть t - фиксированное значение времени, & At - малый отрезок времени, причем О <.t + At <С Т. Тогда

t+ht т

г15 (f, ж) = min I j fo{x,u)dx-\- j /о(ж, м)йт, (12.163)

t t+M

где функции X (т) и и (т) связаны условиями (12.157).



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 [ 126 ] 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254