Главная ->  Логарифмическое определение устойчивости 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 [ 127 ] 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254

§ 12.9] ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 385

Вид управления и (т) на интервале t + At, Т не оказывает влияния на первое слагаемое в правой части (12.163). Поэтому на рассматриваемом интервале времени следует так выбрать управление, чтобы минимизировать второе слагаемое в правой части (12.163) при выполнении условий

и {%) еи, X (т) ех, х{т) еОт, г + < -с < т. (i2.i64)

На основании принципа оптимальности перепишем (12.163) следующим образом:

t+At

il5(f, x) = min I fo{x, u)dx + >p[t + At, x{t + At)] . (12.165)

Ha интервале t, t + At управление и (т) должно быть выбрано так, чтобы минимизировать правую часть (12.165). От этого выбора зависят оба слагаемых правой части.

Заменим на малом интервале Д матричную функцию / (ж, и) и функцию

/о (х, и) их фиксированными значениями в точке t, а производную х отношением конечных разностей Ах = х (t -{- Ai) - х (t) и Ai. Тогда вместо (12.165) можно записать приближенно

il5(i, x)min{/o(x, и) At +\> (t At, х + Ах)}. (12.166)

Кроме того, имеем

х + Ах = X {t + At) = X (t) + At-f Ix {t), и (t)] = X + At-f {x, u). (12.167)

► Ha основании (12.166) и (12.167) можно найти приближенное значение ф {t, х). Для конечного момента времени Т и любых ж 6 Gt следует, что ф (Г, х) == 0. Поэтому вычисление -ф {t, х) удобно начинать с конца, т. е. с момента времени t = Т ж области G. На первом шаге расчета рассматривается момент времени t = Т - At. При t At = Т величина ж + Дж вследствие краевого условия принадлежит множеству G. Подставляя в (12.166) и (12.167) значение t = Т ~ Atm учитывая, что-ф (Г, х) = О, имеем

ф (Т -At,x)=. minfo[x,u{T - At)\ At,

x + Ax=x-{-At.f[x, u{T - At)\.

Далее фиксируется произвольное значение х Х. Минимум правой части первого равенства (12.168) вычисляется по тем значениям и (Т - Д) из множества U, для которых точка х -Н Дж, определяемая вторым равенством (12.168), соответствует значению b 6 G. Если для какой-либо точки X Х таких значений гг (Г - Д*) не существует, то функция ф (Г - Д, х) не определена в точке х.

Таким образом, по значению функции ф {Т, ж) можно приближенно определить значения функции ф (Г - At, х) на некотором подмножестве Х из X. Так как на интервале Т - Д, Т управление и (т) принято постоянньш и равным и {Т - Д), го одновременно с нахождением функции ф (Г - At, ж) приближенно найдено управление и {Т - At, х), которое реализует эту функцию.

На втором шаге рассматривается момент времени t = Т - 2Д. Из (12.166) и (12.167) можно получить

i{T - 2At,x) = mm{fo[x,u{T - 2At)\At-]-\{T - At, ж-f Дж)), ]

> (12.169)

x + Ax = x-\-At-f[x, u{T - 2At)].

(12.168)



ф(*-ЬА,ж--Дж)-ф(*,ж)Ч-[-Э- + 2 -§.-]AtAt)At. (12.170) Здесь б (Д) - величина более высокого порядка малости, чем At. Входя-

Далее фиксируется произвольная точка х X. Минимум правой части (12.169) вычисляется по тем значениям и (Т - 2At) 6 U, для которых точка X + Ах, определяемая вторым равенством (12.169), принадлежит подмножеству Xl. Находится значение функции ф (Г - 2At, х) на некотором подмножестве из Xl- На интервале Т - 2At, Т - At управление и (т) принимается постоянным и равным значению и (Т - 2At), реализуюгцим ф (Г - 2At, х). На интервале Т - At, Т управление, как функция ж (Г - Д), было определено после первого шага. Так как х (Т - At) связано с ж (Г - 2At) вторым равенством (12.169), то после двух шагов оказывается определенным управление и {Т- 2Д;,ж) на интервале времени Т - 2Ai, Т. Это будет кусочно-постоянная функция с интервалами постоянства, равными Л;.

Последуюш,ие шаги рассчитываются аналогично. Если весь интервал управления Т разбит на т шагов, то после т-го шага определяется функция ф (О, ж) на подмножестве Xj из Z и управление и (О, ж), как кусочно-постоянная функция с интервалами постоянства At. Если начальная точка ж (0) = = а принадлежит подмножеству для которого определена функция

ф (О, ж), то, положив X = а, получаем ф (О, а) - минимум функционала (12.161) исходной задачи управления и иф, а) = и* (т) - оптимальное управление. Подставляя затем оптимальное управление в (12.156) или (12.157) и решая систему исходных дифференциальных уравнений, можно определить оптимальную траекторию движения ж* (т).

Если ж (0) == а не принадлежит подмножеству Z, то задача не имеет решения. Надо учитывать при этом, что вся задача решалась приближенно, в том числе найдено было приближенно и подмножество Х-

При использовании динамического программирования число шагов должно. быть достаточно большим, чтобы получить приемлемую точность решения. В результате большой трудоемкости использование этого метода оказывается невозможным без применения вычислительных машин.

Серьезным недостатком метода является то, что с ростом размерности задачи (порядка п дифференциального уравнения) весьма серьезно возрастают требования к быстродействию и объему памяти вычислительных маппш. Действительно, на к-м шаге вьшисляется функция ф (Г - к At, ж), зависящая от переменных ж, . . ., ж и определенная на множестве Xk. Ее надо хранить в памяти машжны до тех пор, пока не будет вычислена функция ф [Г - - (& -j- 1) Д, х]. Это значит, что в памяти машины должна храниться таблица, в которой записаны значения ф (Г - к At, х) для различных точек из Хй- Этих точек оказывается много, так как таблица доли-ша достаточно точно и равномерно определять функцию ф (Г - к At, ж). Кроме того, в памяти машины приходится запоминать кусочно-постоянную в общем случае -мерную функцию управления и (Т - к At, ж), зависящую от Xl, . . ., Хп ш вычисленную при значениях аргумента т с интервалом At.

В сложных системах объем вычислительных операций при реализации приближенного решения задачи динамического программирования оказывается непосильным даже для самых крупных и быстродействующих современных вычислительных машин.

Уравнение Беллмана. Введем предположение, что функция ф имеет непрерывные частные производные по всем своим аргументам: t, Xi, . . ., ж . Тогда в равенстве (12.166) функцию ф (i + Д*, ж -Н Дж) можно представить следующим образом:



§ 12.10] АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ РЕГУЛЯТОРОВ 387

щие в правую часть (12.170) производные Xt удовлетворяют (12.156). Поэтому

{t + M,x+Ax) = {t,x) + l+ --fi] At+8 (At) At. (12.171)

Подставим (12.171) в (12.166). Функция -ф (f, х) не зависит от управления и {t) в момент t. Поэтому ее можно вынести за знак минимума. Деля полученное равенство на At и переходя к пределу при At О, имеем

min{-b2 -/a(0. u{t)] + fo[x{t), u{t)]]=0 (12.172)

при условиях .

x = fix, и), X (0) = я, ж (Г) = 6 6 От, x{t) еХ, о < i < Т. (12.173)

Уравнение (12.172) и представляет собой уравнение Беллмана с краевым условием -ф (Г, х) = 0. Сумма первых двух членов (12.172) есть полная производная функции -ф (t, х) по времени. Поэтому уравнение Беллмана можно записать в другом виде:

-Ь/о[ж(0,и(г)]}=0. (12.174)

Требование непрерывной дифференцируемости функции я]; [t, х) является весьма жестким и во многих задачах не выполняется. Б. Г. Болтянский показал [18], что можно ослабить требования к функции я]; {t, х). В ней допускаются разрывы частных производных на некотором множестве точек.

Заметим, что если функции и /{ не зависят явно от времени, то решение уравнения (12.174) - функция я5 и оптимальное управление и, которое реализует минимум в (12.174), тоже не зависит явно от времени, т. е. = = я5 (ж) и и = и{х), однако в общем случае я]; (if, ж) и в = w (f, х).

Аналитическое нахождение функции яр в явной форме удается только в некоторых частных случаях. Один из таких случаев рассмотрен в следующем параграфе.

§ 12.10. Аналитическое конструирование регуляторов

Так называемая задача аналитического конструирования регуляторов была сформулирована и решена А. М. Лотовым [77]. Эта задача развивалась также в работах А. А. Красовского [60] и Н. Н. Красовского [62, 63).

Скалярное управление. Пусть имеется стационарный объект, уравнения которого для фазовых координат, записанные в матричной форме, имеют вид

х = Ах-\- Си. - (12.175)

Здесь ж = II Xi llnxi - матрица-столбец фазовых координат, А = \\ !! хп- квадратная матрица коэффициентов, С = \\Ci xi - матрица-столбец коэффициентов, и - скаляр. Требуется определить оптимальное управление и = и (ж . . ., ж ), минимизирующее функционал качества

/= J (2 bixl-\-au)dt= j Vdt {bi-Q, i.= \,. ..., n,.a:>0). (12.176)

0 i=l .0



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 [ 127 ] 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254