WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 10 |

Задача управления с нефиксированной продолжительностью управления так же предполагает задание начального C и конечного D состояний и состоит в нахождении среди всех допустимых такого управления, которое переводит Кусочно-дифференцируемой называется функция, которая имеет производную во всякой внутренней точке промежутка, на котором она определена, за исключением, возможно, некоторого не более чем конечного числа внутренних точек, в которых она является непрерывной.

Введение в оптимальное управление систему из начального состояния в конечное, но при этом конечный момент времени T заранее не задан и также подлежит определению.

Рис. 3.1. Траектория системы Как видим, обе задачи близки по содержанию. И в той и другой из них данную систему требуется перевести из одного фиксированного состояния в другое. Отличие сформулированных задач состоит лишь в том, что во второй из них (задаче с нефиксированной продолжительностью) период управления (т.е. время перевода системы из начального состояние в конечное) не задан, а значит, может оказаться какой угодно длины.

Для указанных задач важную роль играет вопрос о существовании допустимого управления, переводящего данную систему из заданного начального состояния в заданное конечное. Это вопрос управляемости системы. Если указанного управления не существует (т.е. система неуправляема), то обе сформулированные задачи решения не имеют, и потому сам процесс решения этих задач становится бессмысленным.

В общем случае вопрос управляемости оказывается чрезвычайно сложным. Однако, если ограничиться в определенном смысле «простыми» системами, то для такого класса систем можно дать исчерпывающий ответ на поставленный вопрос.

Введем необходимые определения. Систему дифференциальных уравнений dy = Ay + Bu, dt где A и B числовые матрицы размера n n и n r соответственно, называют линейной системой управления. Эту систему именуют полностью управляеГлава 3. Постановка задачи оптимального управления мой, если для любой пары точек (состояний) C,D Rn существует допустимое управление, переводящее за некоторое время данную систему из одного из этих состояний в другое.

Оказывается (см. [3]) линейная система полностью управляема тогда и только тогда, когда ранг (n nr) -матрицы, составленной из матриц B, AB, A2B,..., An-1B, равен n.

В соответствии со сформулированным критерием полной управляемости, если ранг указанной матрицы для некоторой линейной системы окажется меньше n, то найдется такая пара точек, для которых невозможно найти допустимое управление, переводящее эту линейную систему из одного из двух данных состояний в другое.

В общем случае, говоря об объекте, описываемом системой дифференциальных уравнений (3.1) (и (3.2)), как об управляемой системе, обычно считают, что допустимое управление, переводящее ее из начального состояния в конечное, существует.

3.4. Задача оптимального управления Для подавляющего большинства прикладных задач управления, связанных с реальными объектами, существует и, как правило, не один набор управляющих функций u = u(t) = (u1(t),u2(t),...,ur (t)), который решает задачу управления (с фиксированным или нефиксированным временем управления). По этой причине возникает возможность выбора из всех решений задачи управления такого решения (т.е. такого набора управляющих функций), которое было бы в каком-то смысле наиболее выгодным. В этом случае приходим к задаче оптимального управления.

Для того, что сформулировать задачу оптимального управления, необходимо задать условие, которое позволяет отличать друг от друга более и менее выгодные решения данной задачи. Этой цели служит критерий оптимальности (критерий качества управления или целевой функционал) T I(u) = f0(t, y1(t),..., yn(t),u1(t),...,ur (t))d t, (3.4) tв котором f0(t, y1,..., yn,u1,...,ur ) – фиксированная функция n + r +1 переменных, обладающая такими свойствами, чтобы обеспечить существование интеграла. Признаком большей или меньшей выгоды выбора управления u будет служить значение интегрального функционала (3.4), вычисленного на этом управлении, т.е. число I(u). Для определенности будем считать, что чем больше значение критерия оптимальности I(u), тем более выгодным является данное управление u. Тогда самым выгодным будет управление, Введение в оптимальное управление которое доставляет наибольшее возможное значение интегральному функционалу (3.4).

Заметим, что в частном случае подынтегральная функция fиз (3.4) может явно от времени не зависеть, т.е. возможно равенство f0 = f0(y1, y2,..., yn,u1,u2,...,ur ).

Верхний предел интегрирования T в интеграле из (3.4) в зависимости от типа задачи управления может быть фиксированным или нет. Во втором случае целевой функционал зависит не только от управления u, но и от конечного момента времени T. Поэтому для задачи с нефиксированным временем управления было бы естественно писать не I(u), а I(u,T ), но мы этого делать не будем, специально оговаривая, там, где это необходимо, что имеется в виду задача с нефиксированным временем управления.

Итак, задача оптимального управления для системы дифференциальных уравнений (3.1) заключается в максимизации интегрального функционала (3.4) на множестве всех допустимых управлений, переводящих систему (3.1) из заданного начального состояния в заданное конечное. С математической точки зрения эта задача является специального вида задачей оптимизации интегрального функционала на определенном множестве функционального пространства кусочно-непрерывных управляющих функций. Решением этой * * * задачи является управление (вектор-функция) u*(t) = (u1 (t),u2(t),...,ur (t)), которое именуют оптимальным управлением. Этому управлению однознач* * * но соответствует определенная траектория y*(t) = (y1 (t), y2(t),..., yn(t)), называемая оптимальной траекторией. При этом пару векторных функций y*(t), u*(t) называют оптимальным процессом. Нередко задачу оптимального управления формулируют как задачу отыскания не только оптимального управления, но и всего оптимального процесса (т.е. оптимального управления и соответствующей оптимальной траектории).

Пусть подынтегральная функция f0 в (3.4) тождественно равна -1.

Тогда T I = (-1)d t = -(T - t0) tи максимизация функционала I при фиксированном t0 и нефиксированном T равносильна минимизации периода управления T - t0 (а значит, минимизации T ). Тем самым, приходим к так называемой задаче оптимального быстродействия, в которой требуется найти управление, переводящее систему из одного состояния в другое за наименьшее возможное время.

Ранее уже говорилось о том, что функции управления должны выбираться в пределах специального множества допустимых управлений. Его составляют те векторные функции u = u(t), компоненты u1(t),u2(t),...,ur (t) Глава 3. Постановка задачи оптимального управления которых являются кусочно-непрерывными функциями на отрезке [t0,T] со значениями в заданной допустимой области U, т.е. u(t) U Rr для всех t [t0,T].

Один из наиболее простых способов задания допустимой области состоит в ограничении значений управляющих функций определенными постоянными пределами:

ai ui (t) bi, i = 1,2,...,r, при всех t [t0,T], где a1,a2,...,ar и b1,b2,...,br – заданные числа. Такой способ задания соответствует случаю, когда управляющее воздействие ui может изменяться лишь в пределах некоторого промежутка [ai,bi]. Указанные выше простые ограничения на выбор управляющих функций часто встречаются в практике. Например, среди органов управления самолетом имеются рули высоты и поворота. Как известно, изменение угла поворота этих рулей ограничено определенными пределами, которые определяются техническими параметрами данного самолета. Величина подачи горючего в двигатель самолета (или автомобиля) также ограничена некоторым верхним пределом.

Выводы Сложные объекты, как правило, представляют собой совокупность взаимосвязанных элементов. Функционированием многих из таких объектов можно управлять. Постановка задачи оптимального управления включает систему дифференциальных уравнений, описывающих поведение (функционирование) данного объекта и критерий оптимальности (функционал), который следует максимизировать или минимизировать, выбирая управляющие переменные. Решением задачи оптимального управления является оптимальный процесс, т.е. оптимальное управление и соответствующая ему оптимальная траектория.

Основные термины Система, состояние системы, переменные состояния, переменные управления, траектория системы, процесс, задача управления, задача оптимального управления, задача оптимального быстродействия.

Контрольные вопросы 1. Перечислите переменные, участвующие в постановке задачи управления динамической системой.

2. Запишите общий вид системы дифференциальных уравнений, описывающих поведение управляемой динамической системы.

Введение в оптимальное управление 3. Охарактеризуйте пространство состояний динамической системы.

Дайте определение траектории системы.

4. Опишите класс допустимых управлений.

5. Выпишите общий вид линейной системы управления.

6. Что такое управляемая система и что можно сказать о наличии свойства полной управляемости у линейных систем 7. Запишите критерий качества управления общего вида.

8. Сформулируйте задачу оптимального управления (с фиксированным и нефиксированным временем управления).

9. Дайте определение процесса и оптимального процесса. В чем состоит их отличие 10. В чем заключается задача оптимального быстродействия Упражнения 1. Приведите пример какой-либо известной вам системы из области экономики. Опишите элементы этой системы, взаимосвязь между ними и возможные состояния системы. Является ли, на ваш взгляд, указанная система управляемой, и в какой степени 2. Рассмотрите частный случай системы (3.1) при. Используя m = материал главы 1, ответьте на вопрос: гарантирует ли теорема Коши о существовании и единственности решения задачи Коши существование решения этой системы при сделанных выше предположениях на всем временнум промежутке [t0,T] 3. Установите, является ли полностью управляемой следующая линейная система из двух дифференциальных уравнений dy = 2y1 - y2 + u dt. (3.5) dy y1 - u1 + u= dt 4. Найдите уравнения траектории линейной системы (3.5) при u1(t) = u2(t) 0, проходящей через точку N (1,0). Изобразите найденную траекторию на фазовой плоскости.

5. Сформулируйте задачу минимизации T min Глава 3. Постановка задачи оптимального управления при условиях x(t) 2, x(-1) = 1, x(T ) = -1, x(-1) = x(T ) = 0 в форме задачи оптимального быстродействия системой, описываемой двумя фазовыми переменными и одной управляющей функцией. Выпишите граничные условия и опишите допустимую область управлений.

Указание. Выполните замену переменных y1 = x, y2 = x, u = x.

Глава 4. Принцип максимума Принцип максимума Понтрягина4– это определенного типа необходимое условие экстремума, которое дает возможность среди всех возможных допустимых процессов выделить те, которые могут претендовать на роль оптимальных. Для определенного класса задач управления принцип максимума является не только необходимым, но и достаточным условием оптимальности.

Здесь рассматриваются варианты принципа максимума для различных задач оптимального управления – с фиксированным и нефиксированным временем управления, для автономных и неавтономных систем, для задач, в которых начальное и конечное состояния системы не обязательно жестко фиксированы.

Обсуждается схема применения принципа максимума и дается экономическая интерпретация сопряженных переменных, участвующих в его формулировке.

4.1. Принцип максимума для задач с закрепленными концами 4.1.1.Принцип максимума для задачи с фиксированным временем управления Рассмотрим задачу оптимального управления объектом, поведение которого описывается системой дифференциальных уравнений dy = f1(t, y1,..., yn,u1,...,ur ), dt dy= f2(t, y1,..., yn,u1...,ur ), dt t0 t T. (4.1) dyn = fn(t, y1,..., yn,u1,...,ur ), dt с заданным начальным моментом времени t = t0, фиксированным конечным моментом времени управления t = T, начальным состоянием y(t0) = y(0) Rn конечным состоянием y(T ) = y(1) Rn, критерием качества управления Л.С. Понтрягин (1908-1988)– выдающийся российский математик, академик РАН.

Глава 4. Принцип максимума T (4.2) I(u) = f0(t, y1(t),..., yn(t),u1(t),...,ur (t))dt tи областью управления U,U Rr. При этом относительно функций y, u, f0, f1,..., fn будем считать выполненными все требования, которые понадобятся при формулировке принципа максимума (см., например, [4]).

Задача оптимального управления для системы (4.1) заключается в максимизации интегрального функционала (4.2) на множестве всех допустимых управлений, переводящих систему (4.1) из заданного начального состояния y(0) в начальный момент времени t0 в заданное конечное состояние y(1) к фиксированному моменту времени T. Решением этой задачи является * * * оптимальное управление (векторная функция) u*(t) = (u1 (t),u2(t),...,ur (t)) и * * * оптимальная траектория (векторная функция) y*(t) = (y1 (t), y2(t),..., yn(t)), в совокупности образующие оптимальный процесс y*(t),u*(t).

Принцип максимума – это определенного типа необходимое условие оптимальности, которое позволяет среди всех возможных допустимых процессов отобрать те, которые могут претендовать на роль оптимальных. В идейном смысле принцип максимума имеет много общего с известным из курса математического анализа условием экстремума функций нескольких переменных (применительно к задачам экстремума с ограничениями-равенствами), хотя по форме они сильно отличаются друг от друга.

Как известно, в формулировке необходимых условий экстремума для функции нескольких переменных с ограничениями-равенствами участвует функция Лагранжа. В теории оптимального управления подобную роль выполняет функция Гамильтона (функция Понтрягина) или гамильтониан:

n (4.3) H(t,y,Y,u) = fi(t, y,u), Y i i=где y = (y1, y2,..., yn ), u = (u1,u2,...,ur ), f0, f1,..., fn – функции из (4.1), (4.2) и = (y0,y1,...,yn ). Нетрудно видеть, что функция Гамильтона H всего имеет 2n + r + 2 переменных.

Для удобства последующей записи введем обозначение y= (y1,y2,...,yn).

Переменные y0,y1,...,yn называют сопряженными переменными. Если использовать упомянутое выше соответствие между принципом максимума и необходимым условием экстремума в терминах функции Лагранжа, то можно сказать, что сопряженные переменные – это своеобразный аналог множителей Лагранжа.

Теорема 4.1 (принцип максимума для задачи с фиксированной продолжительностью управления). Пусть вектор-функция u*(t) является оптимальным Введение в оптимальное управление управлением, а вектор-функция y*(t)– соответствующей оптимальной траекторией в сформулированной задаче оптимального управления с закрепленными концами и фиксированными начальным t0 и конечным T моментами времени.

Тогда необходимо существуют неотрицательное число y* и векторная * функция y*(t) = (y1(t),y* (t),...,y* (t)) с непрерывными на отрезке [t0,T] 2 n компонентами такие, что выполняются следующие три условия * 1) вектор-функция *(t) = (y*,y1(t),...,y* (t)), t0 t T, является нену0 n левой5;

* y*(t) = (y1(t),y* (t),...,y* (t)) 2) вектор-функция является решением 2 n сопряженной системы уравнений n d y1 H(t,y,,u) fj (t,y*,u*) =- = y y1, j dt y1 u=u* (t ) j = y= y* (t ) n d y2 H(t,y,,u) fj (t,y*,u*) =- =y y2, t0 t T,(4.4) j dt y2 u=u* (t ) j = y= y* (t ) n fj (t,y*,u*) d yn H(t,y,,u) =- =y yn, j dt yn u=u* (t ) j = y= y* (t ) в которой y0 = y* ;

3) при каждом значении t [t0, T], при котором все компоненты управляющей вектор-функции u*(t) непрерывны, функция Гамильтона H(t, y*(t),*(t),u) векторной переменной u = (u1,u2,...,ur ) достигает максимума на множестве U при u = u*(t), т.е.

, t0 t T (4.5) H(t, y*(t), y*(t), u*(t)) = mx H(t, y*(t), y*(t),) uU Следует заметить, что в утверждении теоремы 4.1 центральным является условие максимума (4.5). Именно поэтому данную теорему называют принципом максимума.

Сопряженная система (4.4) состоит из n уравнений относительно n неизвестных функций y1,y2,...,yn (которые называют сопряженными или двойственными переменными). Она представляет собой линейную однородную систему обыкновенных дифференциальных уравнений, в которой * * * Это означает, что либо число отлично от нуля, либо среди функций 1 (t),..., (t) 0 n найдется по крайней мере одна, не равная тождественно нулю на отрезке [t0,T ].

Глава 4. Принцип максимума fj (y*,u*) матрицу коэффициентов образуют функции, i, j = 1,2,...,n, аргуyi мента t.

С помощью функции Гамильтона H исходную систему (4.1) вместе с сопряженной системой (4.4) часто записывают в следующем симметричном виде dy dH(t,y,y,u) i =, dx dyi dyi dH(t, y,y,u) =-, dx dyi i = 1,2,...,n.

Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 10 |






















© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.