WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 4 | 5 || 7 | 8 |   ...   | 10 |

Следовательно, сопряженная переменная y является линейной функцией времени, а значит, существует единственная точка, в которой она меняет свой знак (это обстоятельство будет использовано ниже).

Перепишем функцию Гамильтона (с учетом равенства y* = 1):

H = u2 + y + yu.

Как видим, она является квадратичной функцией переменной u, графиком которой служит парабола с ветвями, направленными вверх. Отсюда Глава 4. Принцип максимума следует, что своего максимального значения на отрезке [-1,1] функция H может достигать лишь в граничных точках u =±1. Если вершина указанной параболы лежит в левой (правой) полуплоскости, то максимум достигается на правом (соответственно – левом) конце, т.е. при u = 1 ( u =-1) (см. рис. 4.1).

Рис. 4.1. Геометрия максимизации функции Гамильтона y Вершине указанной параболы соответствует точка u =-. Как было установлено выше, линейная функция y=y(t) может изменять свой знак t y -C(причем в точности один раз). Если - = > 0, что равносильно нера2 венству t >C1, то максимум функции H достигается при u = 1. Тогда как в случае t < C1 это произойдет при u =-1.

Из исходного дифференциального уравнения y = u следует, что управлению u(t) 1 отвечает траектория y(t) = t +C2 в виде прямой линии с угловым коэффициентом 1, а управлению u(t) -1 – соответственно y(t) =-t +C2, графиком которой является прямая с угловым коэффициентом -1.

Таким образом, с учетом граничных условий y(0) = 0 и y(T ) = 0 приходим к следующим двум возможным вариантам (рис. 4.2):

1) сначала применяется управление u(t) 1, а затем u(t) -1; этому варианту соответствует верхняя траектория на рис. 4.2;

2) первым используется управление u(t) -1, после чего принимается u(t) 1 ; этому варианту соответствует нижняя траектория на рис. 4.2.

Для выполнения граничного условия y(T ) = 0 необходимо, чтобы в обоих случаях точка t, в которой происходит изменение значения управления (точка переключения) была расположена симметрично относительно концов Введение в оптимальное управление T отрезка [0,T], т.е.. В момент переключения выполняется равенство t = T T y(t ) = 1 - t = 0. Следовательно,, а значит, y*(t) = - t.

C1 = Рис. 4.2. Два варианта управления Теперь обратимся к условию максимума функции Гамильтона H(y,y0,y,u). Нам известны функции u(t), y(t) для каждого из указанных T выше двух вариантов, а также y* = 1, y = y*(t) = - t. Непосредственный подсчет значения функции H (выполненный отдельно для левой и правой половин отрезка [0,T] ) показывает, что для первого варианта это значение равно 1+T, а для второго 1-T. Следовательно, второй вариант не удов2 летворяет принципу максимума и единственной экстремалью Понтрягина в данной задаче является T 1, при t < 2, u*(t) = T -1, при t > 2.

Глава 4. Принцип максимума 4.4. Принцип максимума для задачи с нефиксированным временем управления Вновь обратимся к задаче оптимального управления системой dy = f1(t, y1,..., yn,u1,...,ur ), dt dy= f2(t, y1,..., yn,u1...,ur ), dt t0 t T, (4.1) dyn = fn(t, y1,..., yn,u1,...,ur ), dt с подлежащим максимизации критерием качества управления T I(u) = f0(t, y1(t),..., yn(t),u1(t),...,ur (t))dt, (4.2) tзаданными начальным моментом времени t = t0, областью управления U,U Rr, начальным состоянием y(t0) = y(0) Rn и конечным состоянием y(T ) = y(1) Rn. Однако в отличие от задачи оптимального управления, рассмотренной ранее, здесь конечный момент времени T будем считать не фиксированным и подлежащим определению.

Выпишем функцию Гамильтона n H (t, y,,u) = fi (t, y,u), (4.3) i i=которая ничем не отличается от введенной ранее.

Рассматриваемая задача оптимального управления с нефиксированным конечным моментом времени заключается в максимизации интегрального функционала (4.2) на множестве всех допустимых управлений, переводящих систему (4.1) из заданного начального состояния y(0) в заданное конечное состояние y(1) к некоторому заранее не известному моменту времени T.

Решением этой задачи являются оптимальное управление (векторная функ* * * ция) u*(t) = (u1 (t),u2(t),...,ur (t)), соответствующая оптимальная траектория * * * * (векторная функция) y*(t) = (y1 (t), y2(t),..., yn(t)) и оптимальное время T.

Следует заметить, что в данном случае правильнее было бы вместо I(u) писать I(T,u), подчеркивания тем самым зависимость критерия качества от конечного момента времени. Но мы этого делать не будем, поскольку заранее оговорили, что здесь рассматривается задача с нефиксированным конечным моментом времени.

Введение в оптимальное управление * Предположим, что пара векторных функций u*(t), y*(t) и время T являются оптимальными в сформулированной задаче. Совершенно очевидно, что эта пара функций будет представлять собой оптимальный процесс и в задаче оптимального управления, отличающейся от приведенной выше лишь * фиксацией конечного момента времени T = T. Поэтому согласно теореме 4.1 процесс u*(t), y*(t), оптимальный в исходной задаче с нефиксированным конечным моментом времени управления, будет удовлетворять всем трем * условиям этой теоремы при T = T. Тем самым, принцип максимума для рассматриваемой задачи должен содержать уже известные условия 1) – 3) теоремы 4.1, но при этом они должны быть дополнены каким-то дополнительным требованием для определения оптимального значения конечного момента * времени T. Действительно, имеет место следующий результат (см. [4]).

Теорема 4.2 (принцип максимума для задачи с нефиксированным временем управления). Пусть u*(t), y*(t) – оптимальный процесс в задаче оптимального управления с нефиксированным временем управления системой (4.1), критерием оптимальности (4.2), заданными начальным y*(t0) = y(0) Rn и * конечным y*(T ) = y(1) Rn состояниями.

Тогда необходимо существуют неотрицательное число y* и непрерывная * * * * векторная функция такие, что выполняются (t) = (1 (t) (t),..., (t), ) 2 n * условия 1) – 3) (в которых следует положить T = T ) теоремы 4.1 и, кроме того, имеет место равенство max H(T, y*(T ),*(T ),u) = 0. (4.12) uU T =T* Рассматриваемый ниже пример иллюстрирует применение теоремы 4.2 и имеет наглядную механическую интерпретацию.

Пример 4.3. Пусть материальная точка с координатой x(t) движется по числовой оси Ox по закону x(t) = u(t) t 0.

Данное равенство означает, что управление движением материальной точкой на прямой линии осуществляется путем изменения ускорения ее движения. Требуется найти кусочно-непрерывное управление, удовлетворяющее неравенству u(t) 1, 0t T, такое, чтобы точка, выйдя с нулевой скоростью из заданного начального положения x(0) = 1, «вошла» в начало координат с нулевой скоростью за наименьшее возможное время T. Это типичная задача быстродействия.

Глава 4. Принцип максимума Уравнение движения материальной точкой представляет собой дифференциальное уравнение второго порядка. Известно, что это уравнение может быть сведено к системе из двух дифференциальных уравнений первого порядка. Для того чтобы такое сведение выполнить, введем новые фазовые переменные по правилу:

y1 = x, y2 = x.

Тогда сформулированную одномерную задачу оптимального управления можно переписать следующим образом. Дана система из двух дифференциальных уравнений y1 = y2, t 0.

= u, yЗаданы начальное y(0) = (1,0) и конечное y(T ) = (0,0) состояния системы и область управления U = [-1, 1]. Варьируя управления в классе допустимых, необходимо максимизировать интегральный функционал T I =- d t =-T.

Для решения задачи составляем функцию Гамильтона H =-y0 +y1y2 +y2 u и выписываем сопряженную систему H = - = 0, y y t 0.

y2 = - H = -y1, y Решая эту систему, находим y1(t) = C, y2(t) = -Ct + D, где C и D некоторые постоянные. Если предположить, что y2(t) 0, то C = D = 0 и y1(t) 0. Но тогда из условия (4.12), которое в данном случае имеет вид max(-y0 +C -Ct u + Du) = 0, (4.13) u[0,1] будет следовать равенство y0 = 0, что вместе с полученным выше y1(t) = y2(t) 0 противоречит условию 1) принципа максимума.

Следовательно, функция y2(t) не равна нулю тождественно.

Введение в оптимальное управление Функция, записанная под знаком максимума в (4.13), линейна по u, а значит может принимать максимальные значения лишь на концах отрезка [-1,1]:

u(t) = sign(-Ct + D).

Таким образом, оптимальное управление (если оно существует) является кусочно-непрерывной функцией, принимающей значения +1, либо –1. При этом благодаря линейности функции y2(t) = -Ct + D управление имеет не более одной точки t переключения (смены знаков).

Нетрудно проверить непосредственно, что траектории, выходящие из начальной точки и соответствующие режимам управления a) u(t) =+1, t 0, b) u(t) =-1, t 0, c) u(t) =+1, 0 t t, u(t) =-1, t t, никогда не пройдут через конечную точку (0, 0). Остается рассмотреть единс твенный оставшийся возможный режим u(t) =-1 при 0 t t и u(t) =+ при t t. Ему отвечает траектория (y1(t), y2(t)), где 1- t, 0 tt, -t, 0 t t, y1(t) = y2(t) = 2 - 2t, t t.

t - 2tt + t +1, t t, t * Из условий y1(T ) = y2(T ) = 0 можно найти t = 1, T = T = 2. Значит, полученное выше представление для траектории можно переписать в форме 1- t, 0 t 1, -t, 0t 1, y1(t) = y2(t) = t - 2, 1t 2.

(t - 2), 1 t 2, * *, y1 * В качестве величин y* * и y можно взять y = 0, y1(t) = -1, y* (y) = t -0 2 0 при 0 t 2. Найденный процесс является единственным, удовлетворяющим принципу максимума.

Если вернуться к терминам исходной одномерной постановки задачи оптимального управления материальной точкой на числовой оси, то получим следующую картину. В соответствии с принципом максимума, для того чтобы за наименьшее время из точки, расположенной на расстоянии одной единицы справа от начала координат, попасть в начало координат, следует сразу (т.е. в начальный момент времени), начав движение влево, включить максимальное ускорение (это соответствует выбору управления u(t) -1).

По прошествии одной единицы времени необходимо осуществить переключение управления в режим u(t) +1, что отвечает режиму максимального Глава 4. Принцип максимума торможения. Тогда через единицу времени после переключения данная точка «попадет» в начало координат и ее скорость в конечный момент времени будет в точности равна нулю.

4.5. Задача оптимального управления с подвижными концами На практике нередко возникают задачи управления, в которых один или оба конца траекторий (начальный и/или конечный), отвечающих допустимым управлениям, не являются «жестко закрепленными» и могут выбираться в пределах некоторых заданных множеств. Такого рода задачи именуют задачами управления с подвижными концами.

Сначала рассмотрим задачу оптимального управления с подвижным правым концом. В ней целевой функционал подлежит максимизации на множестве всех допустимых управлений, переводящих управляемую систему из заданной точки y(t0) фазового пространства в какую-либо точку некоторого заданного множества S, S Rn. В этом случае говорят, что систему из заданного начального состояния следует перевести на множество S (рис. 4.3).

Рис. 4.3. Перевод системы из точки на множество В случае, когда S = Rn, говорят о задаче со свободным правым концом.

Точно так же, если указано определенное множество возможных начальных состояний системы, то можно говорить о задаче оптимального управления с подвижным левым концом. В общем случае оба конца траектории могут быть подвижными, т.е. располагаться на двух заданных множествах.

Далее будем предполагать, что ограничения на возможные изменения начального y(t0) Rn и конечного y(T ) Rn состояний заданы при помощи следующей системы неравенств и уравнений Введение в оптимальное управление gi(y(t0), y(T ))0, i = 1,2,...,m;

g (y(t0), y(T )) = 0, j = m +1,...,M. (4.14) j Здесь может быть или M = m. Первому варианту соответствует слуm = чай отсутствия ограничений-неравенств, а второму – ограничений-равенств.

Далее условимся считать выполненными все требования к функциям 2n переменных gi и g, которые могут потребоваться от них при формулировке j принципа максимума8.

Задача оптимального управления с подвижными концами формулируется следующим образом. Дана управляемая система (4.1) и задан интегральный функционал (4.2). Среди всех допустимых управлений, переводящих систему (4.1) из некоторой начальной точки y(t0), удовлетворяющей ограничениям (4.14), на множество тех конечных состояний y(T ), для которых выполнены соотношения (4.14), требуется найти такое управление, которое доставляет наибольшее возможное значение интегральному функционалу (4.2). Определению подлежат и концы оптимальной траектории, т.е. точки y*(t0) и y*(T ). При этом время управления может быть фиксированным или нефиксированным.

Предположим, что процесс u*, y* является оптимальным в сформулированной задаче, причем траектория начинается в точке y*(t0) = y(0) и заканчивается в точке y*(T ) = y(1), причем обе эти точки удовлетворяют соотношениям (4.14). Из общих соображений ясно, что элемент, доставляющий функционалу наибольшее возможное значение на некотором допустимом множестве максимизирует тот же самый функционал на любом подмножестве допустимого множества, содержащем данный элемент.

Поэтому управление u*, оптимальное в задаче перевода системы (4.1) с одного множества на другое, должно быть оптимальным и в задаче перевода данной системы из фиксированного начального состояния y(0) в фиксированное конечное состояние y(1). Отсюда сразу следует, что для указанного выше оптимального управления u* и соответствующей ему траектории y* обязательно должен выполняться принцип максимума в форме теоремы 4.или 4.2 (имеются в виду условия 1) – 3)) в зависимости от того, фиксировано или не фиксировано время управления. Таким образом, центральная часть утверждения принципа максимума для задачи с подвижными концами остается такой же, как в задаче с фиксированными концами.

Изменение формулировки необходимого условия оптимальности в форме принципа максимума для задачи с подвижными концами заключается Эти требования можно найти, например, в [4].

Глава 4. Принцип максимума (см. [4]) в замене 2n граничных условий y(t0) = y(0), y(T ) = y(1) для концов оптимальной траектории на специального вида требования, которые записываются в виде следующей системы 2n равенств M g (y(t0), y(T )) j y*(t0) =, i = 1,2,...,n, a yi (t0) ij j =(y* (t0 ),y* (T )) M g (y(t0), y(T )) j y*(T ) = -, i = 1,2,...,n, a yi(T ) ij j =(y* (t0 ),y* (T )) называемых условиями трансверсальности, и m равенств a g (y*(t0), y*(T )) = 0, j = 1,2,...,m, j j именуемых условиями дополняющей нежесткости, при некоторых (подлежащих определению) неотрицательных числах a1,a2,...,am и некоторых (также подлежащих определению) числах am+1,...,aM произвольного знака, в совокупности обладающих свойством (y*,a1,a2,...,aM ) 0. В случае, когда один из концов траектории (например, начальный) закреплен, условие трансверсальности на закрепленном конце (т.е. то, в левой части которого стоит y*(t0) ) становится лишним.

i Заметим, что общее число всех выписанных выше равенств (условий трансверсальности и дополняющей нежесткости) 2n + m совпадает с суммой числа m подлежащих определению констант a1,a2,...,am и числа 2n компонент начальной и конечной точек y*(0), y*(1) оптимальной траектории. Если к перечисленным добавить еще M - m ограничений-равенств из (4.14), то в итоге получим 2n + M равенств для определения такого же числа неизвест* * * * ных компонент y1 (0),..., yn(0), y1 (T ),..., yn(T ) начальной и конечной точек оптимальной траектории и констант a1,a2,...,aM.

Выясним, какой вид приобретают сформулированные выше условия трансверсальности и дополняющей нежесткости в некоторых простейших случаях.

Случай задачи управления со свободным правым концом может быть получен при граничном условии y(t0) = y(0). Это условие можно переписать в виде ограничений-равенств g (y(t0), y(T )) = yj (t0) - y(0) = 0, j = 1,2,...,n j j Из-за отсутствия ограничений-неравенств условия дополняющей нежесткости здесь отсутствуют. Далее, так как левый конец траектории закреплен, то условие трансверсальности следует записывать только для конечного момента времени t = T. Заметим, что ни одна из функций g от yi(T ) не j зависит. Значит, все участвующие в условии трансверсальности производные Введение в оптимальное управление от функции gi по yi (T ) обращаются в нуль. В итоге приходим к тому, что для задачи оптимального управления со свободным правым концом условие трансверсальности имеет вид y*(T ) = 0.

Pages:     | 1 |   ...   | 4 | 5 || 7 | 8 |   ...   | 10 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.