Четверг, 2020-10-22, 11:43 PM
Коллекция материаловГлавная

Регистрация

Вход
Приветствую Вас Гость | RSS
Меню сайта
Главная » 2014 » Август » 8 » Скачать Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин. бесплатно
5:12 AM
Скачать Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин. бесплатно

Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин

Диссертация

Автор: Левочкина, Мария Сергеевна

Название: Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин

Справка: Левочкина, Мария Сергеевна. Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин : диссертация кандидата физико-математических наук : 01.01.05 Москва, 2006 86 c. : 61 06-1/1106

Объем: 86 стр.

Информация: Москва, 2006


Содержание:

ВВЕДЕНИЕ
Глава
I Нредварительные сведения из теории линейных систем управления и понятие оптимальности почти наверное и по вероятности 1, Линейные дискретные системы унравления: основные нонятия
2 Задача онтимального регулирования
3 Оптимальность но вероятности и ночти наверное в задачах динамического управления
Глава
II Задача линейного регулятора, возмущенного носледовательностью зависимых случайных величин, для случая постоянных параметров
1 Постановка задачи 2, Основные результаты по стохастической оптимальности
§3 Вспомогательные утверждения 4, Доказательства основных результатов
Глава
III Задача линейного регулятора, возмущенного последовательностью зависимых случайных величин, для случая переменных нараметров
1 Постановка задачи
2 Основные результаты по стохастической оптимальности
3 Доказательства
Глава
IV Нрименение но лученных результатов к задаче пенсионного финансирования
1 Оптимальное финансирование ненсий как задача динамического управления
2 Стохастическая оптимальность в задаче пенсионного финансирования
ЗАКЛЮЧЕНИЕ СНИСОК ЛИТЕРАТУРЫ

Введение:

1. Описание области исследования. Диссертация посвящена исследованию стохастической оптимальности в задачах динамического управления, возникающих, в частности, в некоторых экономических приложениях. Рассматривается линейная динамическая система управления с квадратичным целевым функционалом, возмущенная последовательностью определенным образом зависимых случайных величин. Для исследования стохастической оптимальности используются так называемые вероятностные критерии, связанные с изучением асимптотического поведения (в некотором вероятностном смысле) интегрального целевого функционала, когда горизонт планирования стремится к бесконечности. Известно, что традиционные подходы в теории стохастической динамической онтимизации основаны на исследовании математических ожиданий (м.о.) указанных целевых функционалов. Точнее, если задача рассматривается на фиксированном конечном интервале времени, то сравниваются м.о. функционала для разных управлений. В случае, если система может рассматриваться на бесконечном интервале времени, сравнивается асимптотическое поведепие м.о. функционала, когда горизонт плапировапия стремится к бесконечности. Управлепия, являющиеся решением соответствующих экстремальных задач, если они существуют, в дальнейшем называются управлениями, оптимальными в среднем (на конечном или бесконечном интервале времени). В частности, управлением оптимальным в среднем на бесконечном интервале времени обычно называется унравление, минимизирующее верхний предел среднего по времени м.о. целевого функционала. С помощью вероятностных критериев определяется более сильное в некотором смысле свойство оптимальности но сравнению с оптимальностью в среднем. Точнее, исследуются унравления, доставляющие экстремум не только м.о. целевого функционала, но и самому функционалу (при некоторой нормировке, зависящей от длины интервала планирования) с вероятностью, асимптотически близкой к единице при больших интервалах. Исследованию в указанной области посвящено большое количество работ, в которых рассматриваются некоторые частные модели, такие как линейная система с квадратичным функционалом (линейный регулятор см. [42],[34],[38], [14], [37] для случая дискретного времени, [48],[1], [32], [17] для случая ненрерывного времени) или ARMAX-модель ([30]), так и управляемые процессы достаточно общего вида ([18],[21], [23],[И],[12],[40], [311), 2. Постановка задачи исследования стохастической оптимальности для управляемой марковской цепи. Пусть управляемая марковская цепь xt, t 0,1,2,,.., со значениями в R описывается рекуррентным соотношением Xt ht{t:Xt-i,at), (1) где 1, 2, независимые случайные величины (св.), at элемент нространства R"* и ht К х W х R" ч- В!, t 1,2,, некоторые измеримые функции. Будем интерпретировать at как решепие, принимаемое в момент t. Ниже для любой последовательпости элемептов ai,a2, положим а* Пусть хо X начальное состояние цени, которое в дальнейшем будем считать фиксированным. Для любого целого Т 1 рассмотрим функционал JT{a) EQt{xt,(t), t=i (2) где Xf удовлетворяет (1) нри хо х, а. измеримая функция qt онределяет цену управления в момент времени t. В качестве класса Ы донустимых управлений будем рассматривать класс всевозможных неупреждаюш,их управлений, т.е. случайных процессов ui,U2,, где щ св., измеримая относительно сг-алгебры Для Т 1 будем обозначать {0,Т} интервал времени {t: t 0,1, ,Т}. Управление iF называется оптимальным в среднем на интервале {О, Т}, если где inf берется по мпожеству if-, множеству всех сужений uF унравлений {ui,U2,} из и. Ясно,что vF, если оно суш,ествует, может зависеть от Т, так что, рассматривая последовательность {й}, мы имеем дело со схемой серий в случае, когда горизонт планирования неограниченно возрастает (Т со), классической является постановка задачи минимизации ожидаемых средних за единицу времени потерь (долговремепного среднего): limsup Е jTiu) min. Аналогичная постановка рассматривается также в случае непрерывного времени, в частности для управляемых диффузионных процессов. Концепция стохастической оптимальпости как в случае дискретного, так в случае ненрерывного времени возникает в задаче на бесконечном интервале времени, В различных работах на эту тему наблюдается различие в терминологии и определениях это "оптимальность в смысле закона больших чисел"([45]), "в смысле центральной предельной теоремы", или "по распределению" ([10], [46]), "асимптотическая оптимальность по вероятности и п.н."([14], [15]), "overtaking" оптимальность п.н. ([39]) и др. При этом многие определения стохастической онтимальности связаны с предположением эргодичности нроцесса, соответствующего онтимальному в среднем унравлению. Так как для этого процесса эргодическое среднее сходится к ожидаемому среднему значению, и это значение минимально, то можно сравнивать его, в частности, с любым конкурирующим эргодическим, также и в стохастическом смысле. (При отсутствии эргодичности у конкурирующего нроцесса обычно рассматривается верхний предел среднего по времепи значения функционала). Соотвествующее нонятие стохастической оптимальности в рамках описапной выше, а также аналогичных других постановок связано с определением, при котором: 1)существует унравление п и число 0, такие что: e, 2)для любого допустимого управлепия и: Э. (3) (4) Заметим, что данное определение является достаточно ограничительным. В общем случае, например для неоднородных схем.предел в левой части (3) может не существовать или может равняться не числу, а случайной величине. Если все же для управления п условие (3) вынолнено, то из (4) следует неравенство: limsupT" JT (,U) lim Т" JT {П) Ясно, что более строго и желательно, если это возможно, иметь дело с liminf а не с limsup, как в даппом неравенстве. Указанная постановка задачи, а так же и некоторые другие постановки, связанные с исследованием стохастической оптимальности, либо накладывают исходные ограничения на свойства процесса, (например, однородность, ограпичеппость мпожества состояний), либо нриводят к сильным ограничениям на класс допустимых управлений (см. [45], [46], [23]). В данной работе мы будем придерживаться концепции "асимптотической оптимальности почти наверное и по вероятности", предложеппой В.И.Ротарем в [18], и развитой затем в работах [21, 32, 17, 1], связанной с изучением асимптотического поведепия разности значений функционалов для оптимального в средпем и произвольного управления. Положительную часть указанной разности в дальнейшем будем называть процессом дефекта оптимального (в среднем) управлепия. Соотвествующее определение стохастической онтимальности обобщает многие другие постановки и позволяет избежать многих ограничений, таких как однородность, эргодичность и т.д. Для любого действительного числа d обозначим d d, если с? О, и d+ О, если d называется 1) оптимальной почти наверное (п.н.) с весовой функцией д, или доптимальной п.н., если для любой п.у. и {и}, и G Ы, при Г со дт(Ми*) Ми)У- О Н.Н.; (5) 2) оптимальной по вероятности с весовой функцией д, или д-оптимальной по вероятности, если для любого г О и любой п.у. и {и}, и Е Ы, при Т 00 Р {дЛМи*) Ми)) s) 0. (6) Данное определение введено В.И.Ротарем ([21]) для случая Эт Т и обобщено Di Mazi G.B. и Ю.М.Кабановым ([32]) на случай произвольных т, имеющих скорость стремления меньшую Т (соответствующие вероятностные критерии были названы "чувствительными"). Заметим, что управления с указанным свойством существуют при более слабых условиях, чем в (3)-(4). Кроме того, данный подход позволяет изучать более тонкие свойства оптимальных управлений, рассматривая верхние функции (или оценки скорости роста) для процесса дефекта, которые могут иметь порядок стремления к бесконечности гораздо меньший, чем у длины интервала плапировапия ([1],[17]). Отметим также, что введенное определение включает в себя многие определения, встречающиеся в литературе. Если весовая функция равна константе в (5), то получается "overtaking"oптимaльпocть п.п., если ру в (5) асимптотическая оптимальность п.н., если 9т h в (6) асимптотическая оптимальность по вероятности, если 9т фп оптимальность по распределению. 3. Связь чувствительных вероятност,ных критериев стохастической опт,имальности и верхних функций для процесса дефекта. В большинстве задач динамической оптимизации кандидатом на роль асимптотически оптимального в том или ином вероятностном смысле управления выступает управление, оптимальное в среднем. Тогда при рассматриваемой нами постановке задача исследования стохастической оптимальности может ставиться как задача получения асимптотических верхних оценок Ит (различных типов) для скорости возрастания процесса дефекта оптимального в среднем управления при стремлении горизонта нланирования Г к бесконечности. Тип оценки связан с типом критерия, или исследуемой оптимальности -оптимальности по вероятности или п.н., где дт функция, некоторым образом связанная с ктОценка при исследовании "Оптимальности по вероятности гарантирует стремление к нулю вероятности выхода за границу Нт процесса дефекта. При исследованиии "Оптимальности п.н. соответствующая функция дает асимптотическую верхнюю оценку с вероятностью единица для скорости роста того же процесса дефекта (является для него верхней функцией). Соответствующая -оптимальность в обоих случаях тогда имеет место но крайней мере для функции вида 9т о(1/ Ит), что означает стремление к нулю (по вероятности или почти наверное) нроцесса дефекта, умноженного на функцию д. Получение наилучших оценок указанных типов связано с понятием таких чувствительных вероятностных критериев, при которых скорость возрастания процесса дефекта оценивается с максимально возможной точностью. При этом чувствительность критерия определяется соответствующей (неслучайпой) весовой функцией от горизонта управления, при умножении на которую гарантируется стремление процесса дефекта к нулю по вероятности или ночти наверное. Для модели линейного регулятора с непрерывным временем в ([1]) была получена наилучшая оценка при исследовании -онтимальности п.н. Было показано, что для процесса дефекта, соответствующего оптимальному в среднем на бесконечном интервале унравлению, такой оценкой является функция Нт Ь\пТ, где 6 некоторая константа, что соответствует р-оптимальности п.н. для функции вида 9т о{1/1пТ). Кроме того, в ([17]) было показапо, что оценкой при исследованиии доптимальности по вероятности в той же модели является любая функция /ij-, стремящаяся к бесконечности, что соответствует -оптимальности по вероятности указанного управления для любой функции вида 5г о( 4. Модель линейного регулятора и стохастическая оптимальность. Обобщение модели, рассмат-риваемое в данной работе. Модель линейного регулятора с дискретным временем исследовалась относительно стохастической онтимальности в [15], [14], где были получены результаты для случая дт Т. Стохастическая оптимальность для линейных управляемых систем обсуждалась также в [И] (а для случая пепрерывного времени в [12]), где рассматривается более общий случай и для управляемой марковской цепи, а также для общей схемы дипамической оптимизации приводятся некоторые условия, при которых п.у. й {й"} является Т-оптимальной по вероятности и почти наверное. В силу общности ностановки задачи эти условия являются достаточно ограничительными, например, в случае линейных систем они приводят к требованию ограниченности цены управлепия, что не имеет место в случае линейного регулятора. Приведем здесь обобщение модели линейного регулятора с дискретным временем, которое рассматривается в данной работе. Пусть Xt случайный процесс со значениями в пространстве R", t 0,1,2, и Xt At xt-i -\-Bt щ +Gt Q (7) излагаемых ниже потребностей, связанных с экономическими нриложениями, задача линейного регулятора, возмуш,енного носледовательностью зависимых (описанным выше образом) случайных величин, требует отдельного рассмотрения. В классических задачах возмуш,ения обычно описываются белым шумом, что в случае дискретного времени соответствует носледовательности независимых случайных величин. Однако в ряде экономических приложений наблюдается зависимость возмуш,аюш,их переменных в разные моменты времени. В частности, это имеет место в нриведенной в главе 4 модели финансирования ненсионного фонда. Задача оптимального финансирования рассматривается как задача динамического управления (обзор нодобных постановок можно найти, например, в [20]), где изменение состояние системы (величина резерва ненсионного фонда) формально описывается линейной унравляемой системой, возмуш,енной носледовательностью случайных величин, образуюн1,их случайный нроцесс тина авторегрессионного (этот нроцесс онисывает пенсионные вьшлаты), и некоторой неслучайной функцией времени. 5. Описание модели пенсионного задана планируемая соотношением траектория финансирования. фонда, Пусть развития описываемая где ft cf так называемые целевые (рассчитанные с помош,ью какоголибо актуарного метода (см, например, обзор в [20])) значепия размера фонда и суммарных ненсионных взносов на основе прогнозируемых суммарных ненсионных вынлатpf, t l,2,,pt- (неслучайная) ставка инвестиционной доходности на периоде [t l,t), /о fo известное начальное состояние. В реальности за счет колебаний случайных факторов (инфляции, инвестиционной доходности, смертности) происходит отклонение траектории развития фонда от нланируемой. В качестве источника неопределенности будем здесь рассматривать колебания численности нопуляции участников ненсионной схемы, в частности, за счет смертности (этот риск особенно важен для схем, небольших по числу участников). Точнее, предноложим, что суммарные ненсионные вьшлаты р, i 1,2,, удовлетворяют соотношению Pt auPt-i a2tPt-2 astPt-s 6, (И) где аи О, г l,,s, 1,2, независимые св., Е О, Е cг, 10

Скачивание файла!Для скачивания файла вам нужно ввести
E-Mail: 1662
Пароль: 1662
Скачать файл.
Просмотров: 173 | Добавил: Диана33 | Рейтинг: 0.0/0
Форма входа
Поиск
Календарь
«  Август 2014  »
ПнВтСрЧтПтСбВс
    123
45678910
11121314151617
18192021222324
25262728293031
Архив записей
Друзья сайта
  • Официальный блог
  • Сообщество uCoz
  • FAQ по системе
  • Инструкции для uCoz
  • Copyright MyCorp © 2020 Создать бесплатный сайт с uCoz