1. В рамках первой задачи проекта, связанной с исследованием возможностей комбинирования традиционных численных методов и методов машинного обучения, были получены следующие результаты:- исследованы особенности применения комбинирования методов машинного обучения и методов Монте-Карло для вычисления цен опционов, зависящих от траектории цены базового актива в моделях Леви;- применены нейронные сети для моделирования значений факторов Винера-Хопфа для комбинирования с численным методом Винера-Хопфа при вычислении цен опционов, функции выплат которых зависят от экстремума процесса Леви.- исследован вопрос возможностей применения машинного обучения к вычислению сверток с факторами Винера-Хопфа, которые обычно вычисляются с помощью быстрого преобразования Фурье.
1.1.В рамках исследования особенностей применения комбинирования методов машинного обучения и методов Монте-Карло для вычисления цен опционов описаны принципы построения гибридного метода Монте-Карло, комбинирующего классические численные методы построения функции распределения конечного положения процесса экстремума и методы машинного обучения для обращения функции распределения с помощью тензорных нейронных сетей. Применение тензорных нейронных сетей прямого распространения с одним скрытым слоем для вычисления значений обратной функции распределения процесса инфимума или супремума позволит повысить вычислительные характеристики метода Монте-Карло за счет ускорения вычислений на графических процессорах. В частности, при помощи теоремы Цыбенко мы можем аппроксимировать с помощью простых нейронных сетей функции распределения на заданных отрезках, но в методах Монте Карло нам обычно нужна аппроксимация обратной функции. Мы доказываем теорему, которая обосновывает возможность симуляции процессов экстремума с помощью нейросети Цыбенко с заданной точностью и надежностью. Как показали вычислительные эксперименты, для аппроксимации в окрестности нуля функции распределения экстремума процесса Леви с носителем на одной из полуосей может потребоваться значительное количество узлов в скрытом слое, если в качестве функции активации использовать логистическую функцию s(x). Для решения этой проблемы можно воспользоваться композицией логистической функции с линейным выпрямителем ReLU(x), а именно, для приближения функций распределения процессов супремума и обратных к ним функций в качестве функции активации мы предлагаем взять 2s(ReLu(x))-1, которая также является сигмоидальной и совпадает с нулем на отрицательной полуоси. Проведенные в ходе исследования вычислительные эксперименты показали, что обратные функции распределения аппроксимируются с помощью простейших нейронных сетей хуже, чем сами функции распределения. Это объясняется тем, что функции активации сами являются функциями распределения, поэтому лучше аппроксимируют именно такой класс функций. Для решения выявленной проблемы были доказаны вероятностные аналоги теорем универсальной аппроксимации. Эти теоремы обосновывают тот факт, что на практике мы можем с заданной точностью аппроксимировать функцию распределения приращения процесса Леви монотонной ИНС прямого распространения с одним входным нейроном, одним выходным нейроном и одним скрытым слоем из N нейронов и со стандартной логистической функцией в качестве функции активации. Полученные результаты позволяют дать содержательную вероятностную интерпретацию для монотонных искусственных нейронных сетей прямого распространения с одномерным входом, выходом и одним скрытым слоем в терминах функций распределения непрерывных случайных величин определенного типа. В частности, мы показали, что любую непрерывную, бесконечно делимую случайную величину можно успешно аппроксимировать смесью логистических распределений. На основе доказанных теорем, мы предлагаем новый подход к разработке методов Монте-Карло, комбинированный с искусственными нейронными сетями для вычисления цен опционов в моделях Леви. В отличие от прямолинейного подхода комбинирования нейронных сетей с методами Монте-Карло, мы аппроксимируем функцию распределения, а не ее обратную. Более того, мы даем четкую вероятностную интерпретацию построенной аппроксимирующей нейросети, которая помогает нам моделировать процесс Леви, используя только отдельные ее компоненты. Когда требуемая ИНС построена, мы можем извлечь из ее структуры весов вероятностные характеристики каждой случайной компоненты в смеси распределений. Поэтому нам нужна не сложная аппроксимация обратной функции распределения нейронными сетями, как в прямолинейных подходах к гибридным методам Монте-Карло, а обращение простых компонентов построенной ИНС. Это делает наш новый подход более эффективным. Заметим, что этот подход можно применить к процессам Леви, приращения которых имеют плотность вероятности. В качестве дальнейших исследований было бы интересно распространить результаты доказанных теорем (с некоторыми изменениями) на более общие случайные величины. Благодаря специальным библиотекам, таким как Tensorflow, присущий искусственным нейронным сетям параллелизм позволяет получить вычислительные преимущества по сравнению со стандартными численными методами за счет использования графических процессоров. Результаты исследования особенностей применения комбинирования методов машинного обучения и методов Монте-Карло для вычисления цен опционов опубликованы в журнале Journal of Mathematical Sciences (2023 г.), индексируемом в Scopus, приняты к публикации в журнале “Теория вероятностей и ее применения”, индексируемом в Scopus/Web of Science, и представлены на престижных международных конференциях (Восьмой международной конференции по стохастическим методам, международной конференции «Современные методы и проблемы теории операторов и гармонического анализа и их приложения – 2023»).
1.2. В рамках применения нейронных сетей для аппроксимации факторов Винера-Хопфа для комбинирования с численным методом Винера-Хопфа, разработан подход к моделированию значений факторов Винера-Хопфа с помощью нейронных сетей прямого распространения с одним скрытым слоем. Нейронная сеть аппроксимирует функцию вычисления коэффициентов полиномов-сомножителей по заданному вектору коэффициентов факторизуемого полинома. На входную последовательность коэффициентов наложены следующие условия: количество элементов последовательность на единицу меньше заданной степени двойки, сумма всех коэффициентов равна единице, до середины последовательность возрастает, после середины – убывает. На выходные последовательности наложены следующие ограничения: последовательность коэффициентов первого полинома-сомножителя возрастает, второго полинома-сомножителя – убывает, суммы коэффициентов для каждого сомножителя равны единице. Нейронная сеть реализована на основе библиотеки TensorFlow для языка Python. Количество входных нейронов соответствует количеству коэффициентов факторизуемого полинома и на единицу больше степени полинома. Количество нейронов на выходе соответствует количеству коэффициентов многочленов-сомножителей. Количество коэффициентов каждого сомножителя равно половине ближайшей к степени исходного полинома степени двойки. Самый маленький коэффициент каждого сомножителя вычисляется как разность суммы предсказанных коэффициентов с единицей. Количество нейронов на скрытом слое подбирается эмпирически с целью получения практически значимой точности результата факторизации. В результате разработаны генератор обучающих данных и обобщенная функция потерь, подходящие для обучения нейросети факторизации полинома произвольной степени. В функции потерь сравниваются значения факторизуемого многочлена степени M-2 , (M -степень двойки) и произведения факторов в точках равным корням степени M из единицы. Выбор указанных точек позволяет эффективно вычислять значения указанных многочленов и коэффициенты многочлена при генерации обучающей выборки с помощью алгоритма быстрого преобразования Фурье (прямого) и (обратного), соответственно. В ходе работы проведены эксперименты по разложению многочленов 2-й, 6-й и 254-й степени на многочлены-сомножители. Для полинома 2-й степени точность разложения составляет 3.45e-06 при 8 нейронах на скрытом слое. Для полинома 6-й степени точность работы сети составляет 6.31e-06 при 1024 нейронах на скрытом слое. Для полинома 254-й степени точность 8.99e-05 при 2048 нейронах. Время вычисления факторов нейронной сетью после обучения составляет в среднем 0.05 сек. Таким образом, нейросеть для факторизации Винера-Хопфа может достаточно быстро генерировать необходимый набор коэффициентов для факторов, которые потом можно использовать для вычисления барьерных опционов методом Винера-Хопфа. По результатам исследования возможностей применения нейронных сетей для аппроксимации факторов Винера-Хопфа для комбинирования с численным методом Винера-Хопфа подготовлена и принята к печати статья в сборнике трудов конференции «Актуальные проблемы прикладной математики, информатики и механики» 2023 года и подготовлена расширенная статья для отправки в журнал «Engineering Letters», индексируемый в Scopus/Web of Science. Результаты работы представлены международных научных конференциях «Современные методы и проблемы теории операторов и гармонического анализа и их приложения – 2023» и «Актуальные проблемы прикладной математики, информатики и механики». Программа обучения и тестирования работы нейросети для факторизации полиномов произвольной степени реализована на языке Python, подготовлена заявка на регистрацию программы в Роспатенте.
1.3. В рамках исследования вопроса возможностей применения машинного обучения к вычислению сверток с факторами Винера-Хопфа, которые обычно вычисляются с помощью быстрого преобразования Фурье, предложена методика сведения вычисления сверток факторов Винера-Хопфа с функциями цены двубарьерного опциона к вычислению типового интеграла. Основная идея заключается в применении явных формул символов факторов упрощенной факторизации Винера-Хопфа для умеренно устойчивых процессов Леви, разработанной руководителем проекта, разложении функции цены в ряд Фурье и трансформации контура интегрирования путем сведения интегрирования вдоль разреза для каждого слагаемого ряда Фурье. В результате получается набор типовых интегралов, для вычисления которых можно обучить нейросеть. Полученные результаты будут оформлены в виде статьи. Обзор современного состояния вычислительной математики и перспектив создания различных видов гибридных методов вычисления цен опционов в моделях Леви, комбинирующих традиционные численные методы и методы машинного обучения опубликован в журнале Stochastic Modelling & Computational Sciences, индексируемом в Scopus.
2. В рамках второй задачи проекта, связанной с разработки нового эффективного метода упрощенной факторизации Винера-Хопфа для общих моделей Леви с приложением для вычисления цен опционов с барьерами, была решена задача вычисления цен двухбарьерных опционов в общих моделях Леви, включающих в себя процессы Леви с неограниченной вариацией скачков. В данном проекте мы развиваем идеи метода упрощенной факторизации Винера-Хопфа, разработанного для вычисления опционов с барьерами относительно процессов Леви с ограниченной вариацией скачков. На первом шаге, применяется рандомизация Карра, эквивалентная дискретизации времени, при которой промежуток времени T разбивается на n частей. Обоснование сходимости метода по времени осуществляется с помощью интерпретации рандомизации Карра как обращения преобразования Лапласа с помощью формулы Поста-Виддера. На следующем шаге необходимо последовательно вычислить типовые математические ожидания функции с предыдущего шага, зависящей от положения процесса в рандомизированный момент времени при условии, что процесс не вышел за нижний и верхний барьеры. Сложность данной вспомогательной задачи заключается в том, что ее решение в отличие от однобарьерного случая требует факторизации матрицы функций размера 2 на 2, которая неизвестна в явном виде. Современные подходы к решению этой задачи достаточно сложны, требуют приближенных факторизационных формул и итерационной схемы приближенного решения системы из двух спаренных интегральных уравнений методом Винера-Хопфа на каждом шаге по времени или применения приближенной матричной факторизации. Оба подхода сложны с точки зрения практической реализации. В рамках нашего подхода мы предлагаем интуитивно понятное приближение процесса последовательными спектрально положительными, спектрально отрицательными и спектрально положительными скачками, причем спектрально положительные скачки соответствуют половине рандомизированного момента времени. В результате получается последовательность задач для интегро-дифференциальных уравнений, каждая из которых решается методом Винера-Хопфа в явном виде в случае процессов ограниченной вариации. Для процессов неограниченной вариации ситуация сложнее. Мы раскладываем характеристическую функцию рандомизированного спектрально положительного(отрицательного) процесса в виде произведения двух факторов Винера-Хопфа, первый из которых соответствует показательному распределению, а второй вычисляется ка отношения. Параметр показательного распределения численно находится как единственный нуль исходной характеристической функции с помощью метода Ньютона. Для быстрого нахождения корня можно воспользоваться методами машинного обучения (построить нелинейную регрессии или нейросеть). Первый фактор является обратным к дифференциальному оператору и поэтому как и обратный сохраняет носитель функции в пределах барьеров, а второй фактор выводит носитель только за верхний или нижний барьер. Таким образом, комбинируя последовательное применение указанных операторов Винера-Хопфа с характеристической функцией нашего интервала, мы получаем решение вспомогательной задачи. Обоснование метода решения вспомогательных задач осуществлялось с помощью интерпретации предложенного представления процесса как метода расщепления Марчука-Стренга для дифференциальных уравнений типа обратного уравнения Колмогорова. В нашем случае, получаемые уравнения будут интегро-дифференциальными, что создает дополнительные источники ошибок, за счет того, что действие интегральных операторов, характеризующих скачки выводит носитель функции за интервал, ограниченный нижним и верхним барьером. Решить эту задачу позволяет разложение процесса на сумму спектрально отрицательного и спектрально положительного процессов Леви. Однако сходимость метода оказывается достаточно медленной. Причина заключается в том, что решения трех вспомогательных факторизационных задач на каждом шаге по времени можно интерпретировать как отдельные приближенные обращения второго порядка преобразования Лапласа для малых значений параметра времени. Подобная интерпретация дает направления улучшения сходимости. Действие операторов Винера-Хопфа на функции осуществляется помощью быстрого преобразования Фурье. Результаты по второй задаче, связанной с разработкой нового эффективного метода упрощенной факторизации Винера-Хопфа для общих моделей Леви с приложением для вычисления цен опционов с барьерами, представлены на международном научном семинаре (Международный научный семинар по теории операторов и гармонического анализа и их приложений «OTHA Spring 2023» (Сателлитная сессия)) и оформлены в виде статей (уже опубликованной в журнале Stochastic Modelling & Computational Sciences о перспективах метода упрощенной факторизации Винера-Хопфа) и планируемых публикациях (статья будет направлена в журнал Data Science in Finance and Economics и подготовлена еще одна публикация).
3. В рамках третьей задачи проекта была разработана новая методология реальных опционов, ориентированная на качество, для моделирования и управления многоступенчатыми проектами НИОКР по разработке лекарств, основанная на составных опционах с процессами Леви. Усиления прикладного экономического аспекта методологии удалось достичь благодаря коллаборации с Эшрефом Трушиным (Eshref Trushin), ученым из Школы бухгалтерского учета, финансов и экономики, Университет Де Монфор, Лестер, Великобритания. В сравнении с существующими подходами оценки стоимости многофазных проектов НИОКР по разработке лекарств, новая методика использует более реалистичный фактор формирования цены на лекарства и более адекватную модель. В разработанном подходе предлагается моделировать текущую оценку эффективности лекарства, а не приведенную стоимость продажи лекарств при условии успешного запуска проекта, которую обычно моделирую с помощью геометрического броуновского движения. Поскольку важная информация о проекте обычно поступает не постоянно, а в случайные моменты времени и порциями, что приводит к систематическим скачкам в оценке качества лекарства, то для моделирования эффективности лекарства был выбран сложный процесс Пуассона. Математическая модель, метод вычисления цен сложных опционов, формулы для вероятностей достижения определенных уровней эффективности и вероятностей перехода на следующую стадию по критериям эффективности и коммерческой целесообразности, формулы для оценки ожидаемых потерь от выхода из проекта и пример оценки нового проекта по предложенной методике в сравнении с существующим подходом разработаны руководителем проекта. Цена сложного опциона в начале каждой стадии оценивается как математическое ожидание выплаты, которая определяется разностью между ценой опциона на следующий этап разработки и размером инвестиций в эту стадию при условии, что текущая оцениваемая эффективность лекарства превышает барьер эффективности, установленный менеджером. Используя сложный процесс Пуассона с дискретными скачками, мы представляем цену опциона как сумму произведений условных вероятностей достижения уровней эффективности выше барьеров и соответствующих выплат. Все вычисления выполняются, начиная с последнего этапа НИОКР до первого методом обратной индукции. В случае небольшого количества ожидаемых скачков эффективности цену опциона можно рассчитать численно в Excel по разработанным в рамках проекта формулам или с помощью быстрого преобразования Фурье по мере увеличения количества скачков. Для модели сложного процесса Пуассона со скачками вверх и вниз одинаковой амплитуды метод оценки сложных опционов программно реализован на языке Visual Basic в MS Excel. Результаты применения метода реальных опционов для оценки стоимости многоэтапного проекта по разработке нового лекарства оформлены в виде статьи (препринт размещен в репозитории SSRN: http://dx.doi.org/10.2139/ssrn.4650638), которая направлена в журнал Management Science, индексируемый в Scopus/Web of Science, и представлены на престижных международных конференциях (Восьмой международной конференции по стохастическим методам, Ежегодной конференции Британской ассоциации бухгалтерского учета и финансов). Тезисы доклада на восьмой международной конференции по стохастическим методам опубликованы в “Теория вероятностей и ее применения”.
В качестве нового практического приложения разрабатываемых методов вычислительной математики в рамках проекта возникла новая задача вычисления мер риска для переменных аннуитетов в моделях Леви в рамках коллаборации с Вей Сяо (Wei Xiao), ученым Центрального финансово-экономического университета (Пекин, Китай). Решение данной задачи связано с достаточно сложной задачей вычисления азиатских опционов с плавающей ценой исполнения и требует исследования совместного распределения конечного положения экспоненциального процесса Леви и интеграла от его траектории по времени. Предварительные результаты о подходах к решению данной задачи были представлены на Международной конференции 2023 года по актуарной науке, количественным финансам и управлению рисками (2023 International Conference on Actuarial Science, Quantitative Finance, and Risk Management) (Пекин, Китай), тезисы доклада опубликованы в материалах конференции.