WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 3 | 4 || 6 | 7 |   ...   | 10 |

Принцип максимума в общем случае дает только необходимое условие оптимальности. Поэтому если некоторое допустимое управление удовлетворяет этому принципу, то оно не обязательно является оптимальным. Часто, желая подчеркнуть это обстоятельство, векторную функцию u*(t) (а иногда ее вместе с соответствующей оптимальной траекторией y*(t)), удовлетворяющую всем условиям принципа максимума, называют экстремалью Понтрягина.

При решении прикладных задач принцип максимума нередко позволяет однозначно определить оптимальное управление. Так, если, во-первых, заранее известно, что оптимальное управление существует, во-вторых, экстремаль Понтрягина найдена и, в-третьих, доказано, что она единственна, то эта экстремаль является искомым оптимальным управлением.

4.1.2. Теорема 4.1 при n = r = Сначала разберем самый простой случай, когда система уравнений (4.1) превращается в одно уравнение и имеется одна управляющая переменная:

dy = f(t, y,u), t0 t T.

dt Здесь y = y(t), u = u(t) и f(t, y,u) – скалярные функции. Критерием оптимальности служит интегральный функционал T I(u) = f0(t, y(t),u(t))d t, а функция Гамильтона имеет вид H (t, y,0,1,u) = f0(t, y,u) +1 f1(t, y,u).

Введение в оптимальное управление Моменты времени t0 и T зафиксированы и концы траектории закреплены: y(t0) = y0, y(T ) = y1.

Принцип максимума применительно к данному случаю принимает следующий вид.

Теорема 4.1.1. Пусть числовая функция u*(t) является оптимальным управлением, а числовая функция y*(t) – соответствующей оптимальной траекторией в задаче оптимального управления с закрепленными концами при n = r = 1.

Тогда необходимо существуют неотрицательное число y* и непрерывная на * [t0,T] функция y1(t) такие, что выполняются следующие условия:

* 1) векторная функция (y*,y1(t)) является ненулевой на отрезке [t0,T] ;

* 2) функция y1(t) является решением дифференциального уравнения d y1 f0(t, y*,u*) f(t, y*,u*) =-y* -y1, t0 t T ;

dt y y 3) для каждой точки t [t0,T], в которой функция u*(t) непрерывна, * функция H(t, y*(t),y0*,y1(t),u) скалярной переменной u достигает максимума на числовом множестве, при U,U R u = u*(t), т.е.

* *, t0 t T.

H(t, y*(t), y*,y1(t), u*(t)) = max H(t, y*(t), y*,y1(t),u) 0 uU Пример 4.1. Рассмотрим простейшую задачу оптимального управления, в которой управляемая система задана дифференциальным уравнением dy = u, 0t T.

dt Здесь y = y(t), u = u(t) – скалярные функции. Будем считать, что ограничения на область управления отсутствуют, т.е. U = R. Пусть заданы граничные условия y(0) = 0, y(T ) = 0 ; при этом зафиксированы начальный и конечный момент времени. На множестве допустимых управлений требуется минимизировать интегральный функционал T I(u) = (u2(t) + y2(t))dt.

Эта задача может быть легко решена без привлечения какой бы то ни было теории. В самом деле, под знаком интеграла записана сумма квадратов двух функций, которая не может принимать отрицательные значения.

Следовательно, и сам интеграл принимает лишь неотрицательные значения.

Тем самым, наименьшим возможным его значением является нуль. Нетрудно видеть, что пара постоянных функций u*(t) 0, y*(t) 0 удовлетворяет граничным условиям, исходному дифференциальному уравнению и доставляет минимальное значение целевому функционалу. Значит, она образует искомый оптимальный процесс.

Глава 4. Принцип максимума Продемонстрируем применение принципа максимума на этой простой задаче. С учетом того, что в данном случае критерий оптимальности подлежит минимизации (поэтому вместо I(u) следует рассматривать противоположный по знаку функционал -I(u) ), выпишем функцию Гамильтона H =-y0(u2 + y2) +yu и сопряженное уравнение dy dH =- = 2y0y.

dx dy Рассмотрим возможность y0 = 0. В этом случае функция Гамильтона H =y u может достигать максимального значения по u на всей числовой оси R лишь при y0 = 0. Но двойное равенство y0 = y = 0 противоречит условию 1) теоремы 4.1.1. Следовательно, y0 0. Нетрудно видеть, что в таком случае, разделив функцию Гамильтона и обе части сопряженного уравнения на коэффициент y0 0, добьемся равенства этого коэффициента единице. Это говорит о том, что можно положить y* = 1. Тогда функция Гамильтона примет вид H =-u2 - y2 +yu.

Согласно последнему условию теоремы 4.1.1 эта функция на оптимальном управлении должна достигать максимума. Поскольку никаких ограничений на величину изменения управления нет (в силу U = R ), этот максимум в соответствии с известной из курса математического анализа теоремой Ферма можно найти приравниванием нулю производной функции H по u, т.е H y =-2u +y= 0. Отсюда находим u =. В итоге получаем u y y =, y = 2y, 0t T, y(0) = y(T ) = 0.

В соответствии с найденным сначала приходим к дифференциальному уравнению y = y и находим его общее решение y(t) = C1et +C2e-t.

y После этого из уравнения y = определяем y = (C1et -C2et ). Далее, на 2 основе начального условия y(0) = 0 однозначно отыскиваются константы y* C1 = C2 = 0. Следовательно, y*(t) =y*(t) 0. Поэтому в силу u* = приходим к указанному ранее оптимальному управлению u*(t) 0.

Введение в оптимальное управление 4.1.3. Теорема 4.1 при n = r = Здесь исходная система (4.1) состоит из двух дифференциальных уравнений и записывается следующим образом dy = f1(t, y1, y2,u1(t),u2(t)), dt t0 t T. (4.6) dy f2(t, y1, y2,u1(t),u2(t)), = dt Критерий качества имеет вид T I(u) = f0(t, y1(t), y2(t),u1(t),u2(t))dt, (4.7) tа гамильтониан – H(t,y1, y2,y0,y1,u1,u2) = =y0 f0(t,y1, y2,u1,u2) +y1 f1(t,y1,y2,u1,u2). (4.8) * * Теорема 4.1.2. Пусть вектор-функция u* = (u1 (t),u2(t)) является опти* * мальным управлением, а вектор-функция y* = (y1 (t),y2(t)) – соответствующей оптимальной траекторией в сформулированной выше задаче оптимального управления при n = r = 2.

Тогда необходимо существуют неотрицательное число y* и векторная фун* кция y*(t) = (y1(t),y* (t)) с непрерывными на отрезке [t0,T] компонентами такие, что выполняются следующие три условия * 1) вектор-функция *(t) = (y*,y1(t),y* (t)) является ненулевой на 0 отрезке t0 t T ;

* * *, ) 2) вектор-функция (t) = (1 (t) (t) является решением сопряженной системы d1 * f0(t, y*,u*) f1(t, y*,u*) f2(t, y*,u*) = -0 -1 - dt y1 y1 y f0(t, y*,u*) f1(t, y*,u*) f2(t, y*,u*) * d= -0 -1 - dt y2 y2 y t0 t T ; (4.9) Глава 4. Принцип максимума ** 3) при каждом t [t0,T], в котором обе функции u1 = u1 (t), u2 = u2(t) * * * непрерывны, функция H(t, y1 (t), y2(t),y*,y1(t),y* (t),u1,u2) двух переменных 0 ** u1,u2 достигает максимума на множестве U,U R2, при u1 = u1 (t), u2 = u2(t) т.е.

* * * * * H(t, y1 (t), y2(t),y*,y1(t),y* (t),u1 (t),u2(t)) = 0 * * *, = max H(t, y1 (t), y2(t),y*,y1(t),y* (t),u1,u2 ) 0 (u1,u2 )U t0 t T. (4.10) 4.2. Принцип максимума для задачи с бесконечным горизонтом управления Ранее предполагалось, что управление осуществляется на определенном конечном промежутке времени [t0,T]. В некоторых задачах важно получить представление об оптимальном процессе при длительном, практически неограниченном продолжении процесса. Тогда задачу управления следует формулировать для бесконечного промежутка времени [t0,+•).

Оказывается, что в этом случае утверждение принципа максимума сохраняет свою силу. Необходимо лишь ввести определенные коррективы, связанные с формальной заменой числа T на символ +•.

Рассмотрим систему дифференциальных уравнений dy = f1(t, y1,..., yn,u1,...,ur ), dt dy= f2(t, y1,..., yn,u1...,ur ), dt t0 t <+•. (4.1 ) dyn = fn(t, y1,..., yn,u1,...,ur ), dt Считается заданным начальный момент времени t = t0, начальное состояние y(0) Rn, критерий оптимальности +• I(u) = f0(t, y1(t),..., yn(t),u1(t),...,ur (t))dt (4. 2 ) tи область управления U,U Rr. Допустимыми здесь являются управляющие векторные функции u(t), компоненты которых определены, ограничены и Введение в оптимальное управление кусочно-непрерывны на промежутке [t0,+•), причем выполнено включение u(t) U для всех t t0.

Кроме того, задано конечное состояние y(1) Rn, к которому должно стремиться текущее состояние y(t) при t + •, т.е.

lim y(t) = y(1).

t+ Если некоторому допустимому управлению отвечает траектория с заданными начальным и конечным состояниями, то здесь, как и ранее, используют фразу управление переводит систему из начального состояния y(0) в конечное y(1) на промежутке управления [t0,+•).

Задача оптимального управления с бесконечным горизонтом управления для системы (4.1 ) заключается в отыскании такого допустимого управления, которое переводит эту систему из заданного начального состояния y(0) в конечное состояние y(1) на временн ом промежутке [t0,+•) и при этом доставляет наибольшее возможное значение критерию оптимальности (4.2').

Решение этой задачи называют оптимальным управлением, а соответствующую ему траекторию – оптимальной траекторией.

Прежде чем формулировать соответствующий принцип максимума, напомним общий вид функции Гамильтона n (4.3) H(t,y,y,u) = fi(t,y,u) y.

i i=Теорема 4.1 (принцип максимума для задачи с бесконечным горизонтом управления). Пусть вектор-функция u*(t) является оптимальным управлением, а вектор-функция y*(t) – соответствующей оптимальной траекторией в задаче оптимального управления с бесконечным горизонтом управления.

Тогда необходимо существуют неотрицательное число y* и векторная * функция y*(t) = (y1(t),y* (t),...,y* (t)), определенная и непрерывная на проме2 n жутке [t0,+•), такие, что выполняются следующие три условия * 1) вектор-функция *(t) = (y*,y1(t),...,y* (t)), t0 t < +•, является 0 n ненулевой7;

* y*(t) = (y1(t),y* (t),...,y* (t)) 2) вектор-функция является решением 2 n сопряженной системы уравнений Т.е. являются кусочно-непрывными на каждом конечном промежутке, содержащемся в [t0,+ ). Напомним, что определение кусочно-непрерывной функции на конечном промежутке приведено в разделе 3.2.

* * * Это означает, что либо число отлично от нуля, либо среди функций 1 (t),..., (t) 0 n найдется по крайней мере одна, не равная тождественно нулю на промежутке [t0,+ ).

Глава 4. Принцип максимума n d y1 H(t, y,,u) fj (t, y*,u*) =- =-, y dt y1 u=u* (t ) j =0 j y y= y* (t ) n d y2 H(t,y,,u) fj (t, y*,u*) =- =y y2, j dt y2 u=u* (t ) j =t0 t < +•, y= y* (t ) n fj (t, y*,u*) d yn H(t, y,,u) =- =y yn, j dt yn u=u* (t ) j = y= y* (t ) в которой следует положить y0 = y* ;

3) при каждом t t0, в котором все компоненты управляющей векторфункции u*(t) непрерывны, функция Гамильтона H(t, y*(t),*(t),u) векторной переменной u = (u1,u2,...,ur ) достигает максимума на множестве U при u = u*(t), т.е.

* *, H(t, y*(t), y*,y1(t), u*(t)) = max H(t, y*(t), y*,y1(t),u) 0 uU t0 t < +•.

4.3. Схема применения принципа максимума Обсудим стандартную схему применения принципа максимума на примере задачи оптимального управления с закрепленными концами при n = r = 2.

Этому случаю соответствует утверждение теоремы 4.1.2.

Прежде всего, рассмотрим имеющиеся возможности изменения числа y*. В соответствии с принципом максимума это число должно быть неотрицательно. Здесь следует выделить два случая: y* > 0 и y* = 0. В первом 0 из них, деля равенства (4.9) – (4.10) на y* и вводя новые сопряженные переменные, отличающихся от старых y1(t) и y2(t) множителем придем y* к равенствам, аналогичным (4.9) – (4.10), в которых, однако, y* = 1.

Тем самым, всегда можно ограничиться рассмотрением лишь двух возможностей: y* = 1 или y* = 0. Во втором случае функция Гамильтона (4.8) 0 не включает слагаемое с функцией f0 из критерия оптимальности (4.7). Это означает, что при y* = 0 утверждение принципа максимума не содержит никакой информации о критерии оптимальности. Следовательно, заменяя исходный критерий оптимальности любым другим, мы получим те же самые условия оптимальности в форме принципа максимума. Задачи подобного Введение в оптимальное управление типа называют особыми; они требуют специального исследования, которое выходит за рамки данного учебного пособия.

Применение принципа максимума (нахождение экстремали Понтрягина) обычно начинают с формирования функции Гамильтона H = H(t, y1, y2,y0,y1,y2,u1,u2) и использования условия максимума:

H max.

(u1,u2 )U Из этого условия при каждом фиксированном наборе параметров t, y1, y2,y0,y1,y2 находят управление u = (u1,u2) (в общем случае зависящее от всех указанных параметров), доставляющее максимальное значение функции Гамильтона H. Обозначим это управление через u = (u1(t, y,y),2(t, y,)). (4.11) В общем случае найти управление в виде (4.11) не просто, однако для некоторых классов задач управления такую функцию управления удается записать в явном виде. Например, пусть fk(t, y,u) = fk(t, y) + fk1(t, y)u1 + fk2(t, y)u2, k = 0,1, 2, U = {u = (u1,u2)|a1 u1 b1, a2 u2 b2}, где a1,a2,b1,b2 – заданные числа. В том случае функция Гамильтона может быть записана в виде H =y0 f0(t,y) +y1 f1(t,y) +y2 f2(t,y) + + y0 f01(t,y) +y1 f11(t,y) +y2 f21(t, y) u1 + () + y0 f02(t, y) +y1 f12(t, y) +y2 f22(t,y) u2.

() Она достигает своего максимального значения (благодаря линейности по переменным u1,u2 и специальному виду области управления) только в граничных точках множества U, а именно при bk, если y0 f0k(t,y) +y1 f1k(t,y) +y2 f2k(t,y) > 0, uk = k = 1,2.

, если y0 f0k(t,y) +y1 f1k(t,y) +y2 f2k(t,y) < 0, ak Предположим, что в общем случае функция (4.11) каким-то образом найдена. Подставим ее в исходную и сопряженную системы:

Глава 4. Принцип максимума dy = f1(t, y1, y2,u1(t, y,),2(t, y,y)), dt dy f2(t, y1, y2,u1(t, y,),2(t, y,y)), = dt d y1 f0(t,y,u(y,y)) f1(t,,u(y,y)) f2(t,,u(y,)) =-y0 -y1 -y2, dt y1 y1 y d y2 f0(t,y,u(y,y)) f1(t,,u(y,y)) f2(t,,u(y,)) =-y0 -y1 -y2.

dt y2 y2 y Полученная система из четырех обыкновенных дифференциальных уравнений содержит четыре неизвестные функции y1,y2,y1,y2 (не считая числа y0). Предположим, что удалось найти ее общее решение, которое содержит четыре произвольные постоянные. Конкретные значения этих четырех произвольных постоянных определяются с помощью имеющихся четырех граничных условий:

(0) (0) ( ( y1(t0) = y1, y2(t0) = y2, y1(T ) = y11), y2(T ) = y21).

Если все вышесказанное удастся реализовать, то в итоге будут найде** ны некоторые функции y1 (t), y2 *(t),y1(t),y* (t). Для определения числа y0 = y* достаточно установить, какой из двух случаев y* = 1 или y* = 0 имеет 0 0 место в действительности. При этом следует учитывать, что согласно условию * 1) принципа максимума векторная функция *(t) = (y*,y1(t),y* (t)) не 0 должна оказаться тождественно равной нулю на промежутке t0 t T.

* * * Пусть, наконец, число y* и все функции y1 (t), y2(t),y1(t),y* (t) найде0 ны. Подставив их в правую часть равенства (4.11), получим u* = (u1(t, y*(t),y*(t)),2(t, y*(t),*(t))).

Если эта двумерная векторная функция имеет кусочно-непрерывные компоненты, причем ее значения не выходят за пределы допустимой области, т.е. (u1(t, y*(t),y*(t)),2(t, y*(t),y*(t))) при всех t [t0,T], то она является экстремалью Понтрягина и может претендовать на роль оптимального управления.

В случае, когда дополнительно из каких-либо соображений известно, что решение задачи оптимального управления существует и установлена единВведение в оптимальное управление ственность экстремали Понтрягина, найденная экстремаль будет искомым оптимальным управлением.

Пример 4.2. В соответствии с изложенной схемой решим задачу оптимального управления, заключающуюся в максимизации функционала T I(u) = (u2(t) + y(t))d t.

При этом состояние управляемой системы определяется скалярной величиной y(t), подчиненной дифференциальному уравнению y = u, 0t T, со следующими граничными условиями y(0) = 0, y(T ) = 0.

Пусть выбор скалярной функции управления u стеснен условием u(t) 1 при 0t T. Время управления T считается фиксированным.

Запишем функцию Гамильтона для данной задачи H =y0(u2 + y) +yu и сопряженное уравнение y = -y0.

Если в сопряженном уравнении предположить выполнение равенства y0 = 0, то из него получим представление y= C, где C - const. Сразу заметим, что равенство невозможно благодаря условию 1) теоремы 4.2.

C = Рассмотрим оставшиеся возможности. Если C > 0, то максимальное значение функции H = Cu достигается при u = 1 (для всех t [0,T] ). Но тогда, если из исходного уравнения y = u при управлении u(t) 1 с начальным условием y(0) = 0 получим траекторию, для которой не будет выполy = t няться граничное условие y(T ) = 0. Аналогично устанавливается невозможность выполнения неравенства C < 0. Следовательно, y0 0, а значит, в дальнейшем можно ограничиться рассмотрением случая y* = 1.

Решая сопряженное уравнение, в котором y* = 1, найдем y(t) = C1 - t, C1 - const.

Pages:     | 1 |   ...   | 3 | 4 || 6 | 7 |   ...   | 10 |






















© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.