III. Случайно-возмущенные динамические системы и принцип максимума энтропии
(Журавлев В.М., Миронов П.П. Случайно-возмущенные динамические системы и принцип максимума энтропии. Ученые записки УлГУ, 2013, N2)
1. Введение
Широко используемыми приемами анализа динамики случайно-возмущенных механических систем, описываемых уравнениями Гамильтона, являются различные методы усреднения. Одним из таких методов усреднения является метод усреднения по ансамблю траекторий механической системы, который связан с именем Осборна Рейнольдса (см. [1, 2, 3, 4]), который первым применил его для описания турбулентности. Метод Рейнольдса связан с представлением о турбулентном течении, как о случайном процессе. Введение случайных процессов в теорию означает, что мы отказываемся описывать процесс детально и предполагаем получить замкнутое описание динамики в среднем, т.е. только для средних параметров и моментов случайных величин. Поэтому в методе Рейнольдса исходная задача сводится к исследованию моментов распределений соответствующих случайных параметров среды (компонент скорости, давления, плотности и т.д.). Такой же подход применяется и для описания конечномерных динамических систем и, в частности, к задачам статистического описания сложной динамики механических систем.
Хотя методы описания систем на основе усреднения по ансамблю их состояний вблизи некоторых их ``средних'' состояний хорошо изучены и имеют широкий круг применения, однако основной трудностью описания систем по методу Рейнольдса является отсутствие универсальных рецептов замыкания системы уравнений для цепочки моментов случайных полей в системах. Эту проблему, возникающую в нелинейных системах, обычно называют проблемой замыкания моментов. Для решения проблемы замыкания цепочки уравнений Рейнольдса предлагался целый ряд идей и методов (см. например, [1, 2, 3, 5] и библиографию там), однако общепринятого решения этой проблемы до сих пор не найдено.
Одним из общих подходов к выводу уравнений для усредненных параметров нелинейных систем с хаосом являются методы является метод максимальной энтропии (ММЭ), заимствованный из концепций термодинамики и статистической физики [4]. Этот подход представляется наиболее точным и корректным, поскольку указывает естественный путь к отысканию состояний, вблизи которых в основном и происходит эволюция систем, что является основным признаком их наблюдаемости в экспериментах. Максимум энтропии обеспечивает условие того, что система находится вблизи такого своего макросостояния, которое реализуется на микроуровне максимальным числом способов. Поэтому она должна проводить основное время своего существования на множестве этих микросостояний (наблюдаемость). Однако общая формулировка такого подхода в ранее существовавших подходах [4], не была конкретизирована точной и универсальной формулировкой представления вариационного принципа максимума энтропии для исследуемых динамических систем. Такой подход был предложен в [6, 7, 8]. Основная идея его состоит в явном вычислении энтропии нелинейной гидродинамической системы в предположении ее локального равновесия и в последующем отыскании максимума этой найденной энтропии по усредненным параметрам системы. Такой подход можно назвать принципом вторичного максимума энтропии. Возможность повторно вычислять максимум энтропии системы связана с тем, что в случае достижения локального равновесия в системе каждая точка среды приходит к равновесию, вообще говоря, отличающемуся от равновесия соседних точек. В силу непрерывности среды параметры равновесия меняются непрерывно, что и отражается в изменчивости средних полей и моментов флуктуаций. Такое состояние можно назвать слабо неравновесной Глобальное распределение усредненных полей и моментов при этом и будет определять величину энтропии различных типов локального равновесия. Естественно, что среди таких глобальных распределений должны существовать такие, которые обеспечивают максимум энтропии системы в целом среди всех возможных состояний с локальным равновесием. Основой предлагаемого подхода как раз и является метод отыскания таких состояний со вторичным максимумом энтропии.
Такой подход широко используется в задачах теории передачи информации по линиям связи [9], а так же в задачах обработки данных, в частности в теории спектрального оценивания временных рядов [10, 11, 12]. Основой применения ММЭ в этих областях как раз и является возможность вычислять максимум энтропии системы по усредненной информации о ее состоянии.
2. Многомерный метод максимальной энтропии с высшими моментами
Для N-мерной вещественной непрерывной случайной величины ${\bf S} = \{\xi_1(t),\xi_2(t),\ldots,\xi_N(t)\}$, принимающей значения ${\bf x}=\{x_1,\ldots,x_N\}\in R^N$, рассмотрим задачу отыскания совместного распределения $\rho_{{\bf S}}\Big({\bf x}\Big)=
\rho_{\xi_1(t),\ldots,\xi_N(t)}\Big(x_1,\ldots,x_N\Big)$ имеющего максимальную энтропию (по Шеннону) при заданных моментах случайной величины ${\bf S}$ вплоть до фиксированного порядка $Q_i$ по каждой координате $x_i$:
$$M_{k_1,k_2\ldots,k_N} = \frac{1}{Z}\int\limits_{R^N}x_1^{k_1}x_2^{k_2}\cdots x_N^{k_N}\rho_{{\bf S}}\Big({\bf x}\Big) dx_1dx_2\cdots dx_N,\quad 0\le k_1\le Q_1, \cdots, 0\le k_N \le Q_N,\tag{3.1}\label{DefM}$$
где $Z$ - статистическая сумма, вычисляемая из условия нормировки:
$$\int\limits_{R^N}\rho_{{\bf S}}({\bf x}) dx_1dx_2\cdots dx_N =1.\tag{2}\label{EqNorm}$$
Заметим, что четность порядков необходима для обеспечения сходимости интегралов в (\ref{DefM}) . Введем понятие мультииндексов ${\bf k} = (k_1,k_2,\ldots,k_N)$ как совокупность индексов $k_1,k_2,\ldots,k_N$. Определим для мультииндекса операцию модуля по формуле: $|{\bf k}|=k_1 + k_2 +\ldots + k_N$. Тогда имеют смысл следующие сокращенные обозначения: $\Lambda_{{\bf k}} =\Lambda_{k_1,k_2,\ldots,k_N},~~M_{{\bf k}}=M_{k_1,k_2,\ldots,k_N}$
полезные для дальнейшего. Поставленная задача с водится к вариационной задаче, которую мы в дальнейшем будем называть первой вариационной задачей. Первая вариационная задача сводится к отысканию максимума функционала: $$H=-\int\limits_{R^N} \rho_{{\bf S}}\Big({\bf x}\Big)\ln\rho_{{\bf S}}\Big({\bf x}\Big)dx_1dx_2\cdots dx_N\tag{3.2}\label{FunkHC}$$ при условии, что заданы числовые значения ${\bf M}^{(0)}$ всех моментов ${\bf M} = (M_{k_1,k_2\ldots,k_P})$ (\ref{DefM}) : ${\bf M}={\bf M}^{(0)}$. С помощью метода множителей Лагранжа переходим от задачи на условный максимум к задаче на абсолютный максимум для функционала:
$$\widetilde{H}=-\int\limits_{R^N} \rho_{{\bf S}}\Big({\bf x}\Big)\ln \rho_{{\bf S}}\Big({\bf x}\Big)dx_1dx_2\cdots dx_N + \sum\limits_{|{\bf k}|=0}^{|{\bf Q}|}\Lambda_{{\bf k}}\Big(M_{{\bf k}}-M^{(0)}_{{\bf k}}\Big).\tag{3.4}\label{FunkHA}$$ Здесь ${\bf Q}=\{Q_1,\ldots,Q_N\}$ - мультииндекс порядков моментов по каждой координате: $|{\bf Q}|=Q_1+\cdots+Q_N$.
Искать решение этой вариационной задачи будем среди распределений следующего общего вида:
$$\rho_{{\bf S}}\Big({\bf x}\Big)= \frac{1}{Z({\bf L})}\exp\left\{-\sum\limits_{|{\bf k}|>0}^{{\bf Q}|}{\bf L}_{{\bf k}}x_1^{k_1}x_2^{k_2}\cdots x_N^{k_N}\right\},\tag{3.5}\label{DefRhoN}$$
где $Z({\bf L})$ - соответствующая статистическая сумма:
$$ Z({\bf L}) = \int\limits_{R^N} \exp\left\{-\sum\limits_{|{\bf k}|>0}^{|{\bf Q}|}{\bf L}_{{\bf k}}x_1^{k_1}x_2^{k_2}\cdots x_N^{k_N}\right\} dx_1dx_2\cdots dx_N =1.\tag{3.6} \label{DefZ}$$
Здесь введено обозначение ${\bf L}=(\Lambda_{k_1,k_2,\ldots,k_N})$. Исходя из этого определения, связь между множителями Лагранжа ${\bf L}$ первой вариационной задачи и моментами ${\bf M}$ может быть представлена в виде следующей формулы: $$M_{k_1,k_2,\ldots,k_N}=-\frac{\partial \ln Z({\bf L})}{\partial\Lambda_{k_1,k_2,\ldots,k_N}}.\tag{3.7}\label{ConLM}$$
Не трудно теперь видеть, что решение вариационной задачи $\delta \widetilde{H} =
0$, дается выражением (\ref{DefRhoN}) при условии, что совокупность множителей Лагранжа ${\bf L}$ вычисляется из соотношений: $$M^{(0)}_{k_1,k_2,\ldots,k_N}=-\frac{\partial \ln Z({\bf L})}{\partial\Lambda_{k_1,k_2,\ldots,k_N}}.\tag{3.8}\label{ConLM1}$$
Соответствующее максимальное значение функционала энтропии (\ref{FunkHC}) можно записать в следующем общем виде: $$H_{max} = \ln Z({\bf L}) - \sum\limits_{|{\bf k}|>0}^{|{\bf Q}|}\Lambda_{{\bf k}}\frac{\partial \ln Z({\bf L})}{\partial \Lambda_{{\bf k}}}.\tag{3.9}\label{DefHmax}$$
Это соотношение позволит нам перейти к решению второй вариационной задачи, связанной с динамикой конечно-мерных систем, к формулировке которой мы теперь переходим
3. Метод Рейнольдса для конечномерных динамических систем
Метод Рейнольдса в применении к конечномерным динамическим системам [6, 8] сводится к вычислению усредненных уравнений относительно средних значений динамических переменных и их моментов из самих исходных уравнений динамической системы. При этом предполагается, что исходные уравнения в первоначальном виде могут содержать аддитивные случайные добавки, которые исчезают после усреднения по ансамблю. Системы с такими внешними случайными добавками в дальнейшем мы будем называть случайно-возмущенными динамическими системами. Скрытое внешнее воздействие внешних случайных сил на изменения средних значений динамических переменных случайно-возмущенных систем в этом случае проявляется в зависимости со временем моментов случайных динамических переменных. Поскольку после усреднения в уравнениях для средних значений динамических переменных системы случайные аддитивные добавки исчезают, то отличить эти системы с первоначальным присутствием внешних сил или их отсутствием оказывается не возможным. Это может служить основанием для предположения, что усредненные динамики таких систем неотличимы и объединить их для общего анализа.
Рассмотрим $N$ -мерную динамическую систему ${\bf x}=\{x_1,\ldots,x_N\}$, координаты которой описываются системой дифференциальный уравнений общего вида:
$$\dot{x}_{\alpha} = f_\alpha({\bf x},t)+\varepsilon_{\alpha},\quad\alpha=1,\ldots,N, \tag{3.10}\label{DefDSys}$$
где предполагается, что случайные внешние возмущения $\varepsilon_\alpha$ обладают тем свойством, что при усреднении по ансамблю всех возможных реализаций этих случайных процессов их математические ожидания равны нулю: $$<\varepsilon^{(t)}_\alpha>=0.$$
При этом все детерминированные составляющие обобщенных силовых функций, действующих на систему, должны быть учтены в записи силовых функций $f_{\alpha}({\bf x},t)$.
Вывод уравнений Рейнольдса производится следующим образом. Случайные внешние возмущения системы приводят к возникновению случайных возмущений ее динамических параметров, которые можно представить в следующем виде: $${\bf x}={\bf X}+{\bf x}',~~\dot{{\bf x}}=\dot{{\bf X}}+\dot{{\bf x}'},$$ где ${\bf X}=<{\bf x}>$ - средние по ансамблю динамические переменные системы, а ${\bf x}'$ - случайные их возмущения с нулевыми математическими ожиданиями: $<{\bf x}'>=<\dot{{\bf x}}'>=0$ . Следуя методу Рейнольдса [1], уравнения для усредненных параметров системы (\ref{DefDSys}) будут иметь следующий вид: $$\dot{X_\alpha} = <f_\alpha({\bf x},t)>=F_\alpha({\bf X},{\bf M},t),\quad\alpha=1,\ldots,N.\tag{3.11}\label{EqFX}$$ Здесь ${\bf F}({\bf X},t) = <{\bf f}({\bf x},t)>$ - усредненные силовые функции, а ${\bf M}$ - совокупность тензоров всех моментов случайных флуктуаций с компонентами $M_{{\bf k}}(t)=M_{k_1,\ldots, k_N}=<{x'}_1^{k_1}\cdots {x'}_N^{k_N}>$ и введен мультиндекс ${\bf k}=(k_1,\ldots, k_N)$, $|{\bf k}|=k_1+\ldots+k_N$. Представляя силовые функции ${\bf f}({\bf x},t)$ в виде ряда Тейлора в окрестности точки ${\bf x}={\bf X}$, результат вычисления усредненной силовой функции ${\bf F}$ можно записать в следующем виде:
$$F_\alpha({\bf X},{\bf M},t) = \sum\limits_{|{\bf k}|=0}^\infty C({\bf k}) \left.\frac{\partial^{|{\bf k}|} f_\alpha({\bf x},t)}{\partial x^{\bf k}}\right|_{{\bf x}={\bf X}}<x'^{\bf k}>=\sum\limits_{|{\bf k}|=0}^\infty C({\bf k}) \left.\frac{\partial^{|{\bf k}|} f_\alpha({\bf x},t)}{\partial x^{\bf k}}\right|_{{\bf x}={\bf X}}M_{{\bf k}}(t),\tag{3.12}\label{DefF}$$ где $C({\bf k})=\Big(k_1!\cdots, k_N!\Big)^{-1}$ . По определению: $<x'_\alpha>=M_{{\bf 1}_\alpha}=0$ , где мультииндексы ${\bf 1}_\alpha$ и ${\bf 0}$ имеют следующие компоненты: $${\bf 1}_\alpha =\{q_1,q_2,\ldots,q_N\}: q_{\beta}= \left\{\begin{array}{ll} 0, & \beta\not=\alpha,\\1, & \beta=\alpha,\end{array}\right.,\quad \textbf{0} = \{0,0,\ldots,0\}.$$
Для дальнейшего наиболее важным обстоятельством является то, что усредненные силовые функции являются линейными функциями моментов .
4. Метод максимальной энтропии для динамических систем
Система уравнений Рейнольдса $(\ref{EqFX})$ содержат кроме средних значений координат ${\bf X}$ еще и моменты этих величин $M_{\bf k}$, для которых уравнения отсутствуют. Поэтому для замыкания этой системы уравнений воспользуемся методом максимальной энтропии в форме, предложенной в [6, 7, 8]. Идея использования метода максимальной энтропии для замыкания системы уравнений Рейнольдса состоит в том, что распределения, имеющие максимум энтропии, описывают макросостояния систем, которые реализуются наибольшим числом микросостояний. Последнее означает, что такие состояния системы должны наблюдаться гораздо чаще, чем любые другие возможные состояния системы.
Рассмотрим континуальное вероятностное распределение $\rho_{\{{\bf x}'\}[t_1,t_N]}$, являющееся распределением непрерывного случайного процесса ${\bf S}$ с N переменными ${\bf x}'(t)=\{x'_1(t),\ldots,x'_N(t)\}$ , заданного на интервале времени $[t_1,t_2]$. Следуя идеологии метода максимальной энтропии, для решения задачи замыкания уравнений Рейнольдса необходимо максимизировать функционал энтропии континуального распределения $\rho_{\{{\bf x}'\}[t_1,t_N]}$ при условии, что на моменты этого распределения накладываются дополнительные условия, которые сводятся к совокупности из N усредненных уравнений Рейнольдса $(\ref{EqFX})$, выполняющихся в каждый момент времени $t\in[t_1,t_2]$. Формально эта задача сводится к континуальному аналогу задачи о максимуме энтропии, рассмотренной в разделе 2 данной статьи. Выражение для энтропии системы с распределением $\rho_{\{{\bf x}'\}[t_1,t_2]}$ можно условно записать в виде континуального интеграла: $${\cal S} = -\int \rho_{\{{\bf x}'\}[t_1,t_2]} \ln \rho_{\{{\bf x}'\}[t_1,t_2]} D\{{\bf x}'\}[t_1,t_2].$$
Однако в реальности исследование такого рода выражений является чрезвычайно сложным. Поэтому возникает необходимость использовать некоторые упрощающие ситуацию свойства исследуемых уравнений. Одним из таких важных свойств уравнений Рейнольдса $(\ref{EqFX})$ является их локальность. Поскольку уравнения $(\ref{EqFX})$ выполняются в каждый момент времени независимо, то континуальное распределение $\rho_{\{{\bf x}'\}[t_1,t_2]}$, доставляющее максимум энтропии ${\cal S}$, должно обладать свойством независимости случайных величин ${\bf x}'(t)$ и ${\bf x}'(t')$ и для любых двух моментов времени $t\in [t_1,t_2]$ и $t'\in [t_1,t_2]$ . Такой вывод нетрудно сделать, анализируя аналогичную задачу с дискретным временем и, затем, переходя к пределу с непрерывным временем [9].
Энтропия совместных распределений независимых случайных величин обладает свойством аддитивности (см., например, [9]). Независимость векторов ${\bf x}'(t)$ в различные моменты времени означает, что $\rho_{\{{\bf x}'\}[t_1,t_2]}$ можно представить в виде континуального произведения удельных распределений $\rho_{{\bf x}'}({\bf x}|t)$. Мы будем полагать, что выполнены все необходимые и достаточные условия для того, что бы можно было бы записать следующее выражение: $$\ln\rho_{\{{\bf x}'\}[t_1,t_2]} = \int\limits_{t_1}^{t_2}\ln\rho_{{\bf x}'}({\bf x}|t) dt,$$ являющееся следствием требования указанной попарной независимости ${\bf x}'(t)$ и ${\bf x}'(t')$ для $t\not= t'$. В силу этого выражение для энтропии для континуального распределения $\rho_{\{{\bf x}'\}[t_1,t_2]}$ можно записать в следующем общем виде:
$${\cal S}=\int\limits_{t_1}^{t_2} \sigma(t) dt,\tag{13}\label{DefS}$$
где $\sigma(t)$ - удельная энтропия распределения $\rho_{{\bf x}'}({\bf x}|t)$:
$$\sigma(t) = - \int \rho_{{\bf x}'}({\bf x}|t) \ln\rho_{{\bf x}'}({\bf x}|t)dx'_1\cdots {dx'}_N.$$
Уравнения (11) можно рассматривать как уравнения на моменты случайной величины ${\bf x}'(t)$. В силу этого, задача о максимуме энтропии сводится к задаче, рассмотренной в первом разделе. В этом случае вид удельного распределения вероятностей $\rho_{{\bf x}'}({\bf x}|t)$ будем искать в виде, аналогичном (\ref{DefRhoN}) : $$\rho_{{\bf x}'}({\bf x}|t)=\frac{1}{Z({\bf L})}\exp\left\{-\sum\limits_{|{\bf k}|>0}\Lambda_{{\bf k}}{x'}_1^{k_1}\cdots{x'}_N^{k_N}\right\},\tag{3.14}\label{DefRhoPXN}$$ где статистическая сумма определяется по аналогии с $(\ref{DefZ})$ следующим образом: $$ Z(\Lambda) = \int\limits_{R^N}\exp\left\{-\sum\limits_{|{\bf k}|>0}\Lambda_{{\bf k} {\bf l}}{x'}_1^{k_1}\cdots {x'}_N^{k_N}\right\} d{x'}_1\cdots d{x'}_N.\tag{3.15}\label{DefZH}$$
При этом в этих соотношениях $\Lambda_{{\bf k}}=\Lambda_{k_1,\ldots, k_N}$ - множители Лагранжа в первой вариационной задаче, а в качестве удельной энтропии $\sigma(t)$ мы можем взять выражение $(\ref{DefHmax})$ для максимального значения энтропии конечномерного (удельного) распределения в момент времени $t$ : $$\sigma = \ln Z({\bf L}) - \sum\limits_{|{\bf k}|}\Lambda_{{\bf k}}\frac{\partial \ln Z({\bf L})}{\partial\Lambda_{{\bf k}}}.\tag{3.16}\label{Defgs}$$
Предполагается, что в соотношениях $(\ref{DefRhoPXN})$ и $(\ref{DefZH})$ сумма по каждой компоненте мультииндекса ${\bf k}=(k_1,k_2,\ldots,k_n)$ берется до своего максимального порядка, содержащегося в мультииндексе ${\bf Q}$. В дальнейшем мы будем полагать, что максимальный порядок может быть равным бесконечности: $|{\bf k}|=k_1+\cdots+k_n =\infty$. Такая ситуация возникает всякий раз, когда силовые функции зависят от координат динамической системы не полиномиальным образом и могут быть представлены в виде бесконечных рядов Тейлора. Поэтому верхний предел в суммах мы будем опускать, полагая, что величина этого предела будет определяться конкретной задачей.
Исходя из этих рассуждений, решение задачи о максимуме энтропии континуального распределения рассматриваемой задачи сводится к отысканию условного максимума функционала: $${\cal S} = \int\limits_{t_1}^{t_2} \left(\ln Z({\bf L}) -\sum\limits_{|{\bf k}|>0}\Lambda_{{\bf k}}\frac{\partial \ln Z({\bf L})}{\partial\Lambda_{{\bf k}}}\right) dt,\tag{3.17}\label{DefFuncSC}$$
Поскольку функционал $(\ref{DefFuncSC})$ содержит только множители Лагранжа $\Lambda_{{\bf k}}$, а уравнения (11) - моменты $M_{{\bf k}}$, то к уравнениям следует добавить еще и общие соотношения, связывающие $\Lambda_{{\bf k}}$ и $M_{{\bf k}}$: $$ M_{k_1,\ldots,k_N} = -\frac{\partial\ln Z({\bf L})}{\partial\Lambda_{k_1,\ldots,k_N }}.\tag{3.18}\label{ConLMXP}$$
В результате этих построений задача о замыкании уравнений Рейнольдса $(\ref{EqFX})$ на основе метода максимальной энтропии сводится к отысканию максимума функционала $(\ref{DefFuncSC})$ при условии выполнения уравнений $(\ref{EqFX})$ . Эту задачу мы будем называть второй вариационной задачей. С помощью метода множителей Лагранжа эта условная вариационная задача сводится к отысканию безусловного максимума следующего функционала
$$\begin{eqnarray*}&& \widetilde{{\cal S}} =\int\limits_{t_1}^{t_2}{\cal L} dt = \int\limits_{t_1}^{t_2} \left(\ln Z({\bf L}) - \sum\limits_{|{\bf k}|+|{\bf l}|>0}^{{\bf k}_0}\Lambda_{{\bf k}{\bf l}}\frac{\partial\ln Z({\bf L})}{\partial\Lambda_{{\bf k}{\bf l}}}\right) dt +\tag{3.19}\label{DefFuncSI} \\ &&+ \int\limits_{t_1}^{t_2}\sum\limits_{\alpha=1}^N A_{\alpha}\left[\dot{X_\alpha}-F_\alpha \right]dt + \int\limits_{t_1}^{t_2}\sum\limits_{|{\bf k}|>0}G_{{\bf k}}\left[M_{{\bf k}} + \frac{\partial\ln Z({\bf L})}{\partial\Lambda_{{\bf k}}}\right]dt.\end{eqnarray*}$$
Здесь функции $A_{\alpha}(t)$ и $G_{{\bf k}}(t)$ - множители Лагранжа второй вариационной задачи на максимум функционала $(\ref{DefFuncSI})$ . Вариации всех функций $X_{\alpha}(t),~M_{{\bf k}}(t)$ и множителей Лагранжа первой $\Lambda_{{\bf k}}(t)$ и второй задач $A_{\alpha}(t)$ и $G_{{\bf k}}(t)$ считаются независимыми.
5. Полная система уравнений для моментов
Полная система уравнений, соответствующая максимуму функционала (\ref{DefFuncSI}) , теперь может быть записана в следующем виде: $$\begin{eqnarray*} && \dot{X_{\alpha}} = F_{\alpha},\quad \dot{A}_{\alpha}+ \sum\limits_{\beta=1}^N\frac{\partial F_{\beta}}{\partial X_{\alpha}}A_{\beta} = 0,\quad\alpha=1,\ldots,N.;\tag{3.20}\label{Eq1}\\ && G_{{\bf k}} = \sum\limits_{\beta=1}^N\frac{\partial F_{\beta}}{\partial M_{{\bf k}}}A_{\beta}=C({\bf k})\sum\limits_{\beta=1}^N\frac{\partial^{|{\bf k}|} f_{\beta}({\bf X},t)}{\partial X_1^{k_1}\cdots \partial X_N^{k_N}}A_{\beta},\tag{3.21}\label{Eq4}\\ && M_{k_1,\ldots,k_N} = -\frac{\partial \ln Z({\bf L})}{\partial \Lambda_{k_1,\ldots,k_N }},\quad\sum\limits_{|{\bf k}|>0}\Big(\Lambda_{{\bf k}}-G_{{\bf k}}\Big)\frac{\partial^2 \ln Z({\bf L})}{\partial\Lambda_{{\bf k}}\partial \Lambda_{{\bf m}}}=0.\tag{3.22}\label{Eq6}\end{eqnarray*}$$
Соотношения (\ref{Eq6}) являются системой линейных однородных алгебраических уравнений относительно $\Big(\Lambda_{{\bf k}}-G_{{\bf k}}\Big)$ с матрицей вторых производных функции $\ln Z({\bf L})$. Если эта матрица не вырождена, то эта система имеет единственное решение:
$$G_{{\bf k}} = \Lambda_{{\bf k}}.\tag{3.23}\label{SolGL}$$
Из этого соотношения и (\ref{Eq4}) следует, что коэффициенты $\Lambda_{{\bf k}}$ не зависят явно от моментов ${\bf M}$. Это свойство является следствием линейной зависимости усредненных силовых функций от моментов.
Пользуясь этим принципом и тем, что явно связь между $\ln Z({\bf L})$ и $M_{{\bf k}}$ не используется при выводе уравнений, функционал (\ref{DefFuncSI}) и его модификации можно записывать в сокращенном виде: $$\widetilde{{\cal S}} = \int\limits_{t_1}^{t_2} \left(\ln Z({\bf L}) - \sum\limits_{|{\bf k}|>0}\Lambda_{{\bf k}{\bf l}}M_{{\bf k}}\right) dt + \int\limits_{t_1}^{t_2}\sum\limits_{\alpha=1}^N A_\alpha\left[\dot{X_\alpha}-F_\alpha \right]dt.$$
В этом случае множитель Лагранжа $G_{{\bf k}}$ явно не возникают, а соотношения (\ref{Eq6}) при необходимости считаются выполняющимися по определению.
Как и в классической механике, из (\ref{Eq1}) вытекает существование закона сохранения, аналогичного закону сохранения полной энергии, который далее мы будем называть законом сохранения удельной энтропии. Это закон имеет следующий вид: $$ \Xi=\sum\limits_{\alpha=1}^N\left[A_\alpha\dot{X}_\alpha\right]-\sigma({\bf L})\equiv \sum\limits_{\alpha=1}^N\left[A_\alpha F_\alpha({\bf X},{\bf M},t)\right]-\sigma({\bf L})={\rm const},$$ и выполняется в случае явной независимости функций от времени. Здесь
$$\sigma = \ln Z({\bf L}) - \sum\limits_{|{\bf k}|+|{\bf l}|>0}\Lambda_{{\bf k}{\bf l}}\frac{\partial \ln Z({\bf L})}{\partial \Lambda_{{\bf k}{\bf l}}}.$$
Рассматривая $\Xi$ как функцию параметров системы, уравнения (\ref{Eq1})-(\ref{Eq6}) можно записать в форме гамильтоновских уравнений со связями: $$\begin{eqnarray*} && \dot{X_\alpha} = \frac{\partial \Xi}{\partial A_\alpha},\quad \dot{A_\alpha} = -\frac{\partial \Xi}{\partial X_\alpha},\quad\alpha=1,\ldots,N.;\tag{3.24}\label{EqClose}\\ \nonumber && \Lambda_{{\bf k}} = \frac{\partial \Xi}{\partial M_{{\bf k}}},\quad M_{k_1,\ldots,k_N } = -\frac{\partial \ln Z({\bf L})}{\partial \Lambda_{k_1,\ldots,k_N }}.\end{eqnarray*}$$
6. Удельная плотность вероятности
Для анализа полученной системы уравнений введем производящую функцию, пользуясь следующим общим правилом: $$L({\bf z},{\bf X},{\bf A},t) = \sum\limits_{|{\bf k}|>0}^{\infty}\Lambda_{{\bf k}}z_1^{k_1}\cdots z_N^{k_N} .\tag{3.25}\label{DefL}$$
В этом соотношении учитываются и условия $<{x'}_\alpha> = 0$. Используя связь между производными функции ${\bf F}$ (\ref{Eq4}) , находим: $$L({\bf z},{\bf X},{\bf A},t) = \left[\sum\limits_{|{\bf k}|>0}^{\infty}z_1^{k_1}\cdots z_N^{k_N}C({\bf k})\sum\limits_{\beta=1}^N\frac{\partial^{|{\bf k}|} f_\beta({\bf X},t)}{\partial X_1^{k_1}\cdots \partial X_N^{k_N}}A_{\beta}\right].\tag{3.26}$$ Сворачивая ряд Тейлора (\ref{EqLF}) , получаем:
$$\begin{eqnarray*} L({\bf z},{\bf X},{\bf A},t) = h({\bf z}+{\bf X},{\bf A},t)-h({\bf X},{\bf A},t)=\sum\limits_{\beta=1}^N \left[f_{\beta}({\bf z}+{\bf X},t)-f_{\beta}({\bf X},t)\right]A_{\beta}.
\end{eqnarray*}\tag{3.27}\label{DefLH}$$
В результате удельное распределение и его статистическая сумма имеют вид:
$$\rho_{{\bf X}'}({\bf z}|t) = \frac{1}{Z({\bf X},{\bf M},{\bf A},t)}e^{-L({\bf z},{\bf X},{\bf M},{\bf A},t)},\quad Z({\bf X},{\bf M},{\bf A},t) = \int\limits_{R^{N}} e^{-L({\bf z},{\bf X},{\bf A},t)} d{\bf z}^N.\tag{3.28}\label{DefrhoZW}$$
Используя это компактное представление для удельного распределения, усредненные силовые функции можно представить в таком виде:
$$\begin{eqnarray*}&&F_\alpha({\bf X},t) = <f_\alpha({\bf X}+{\bf X}',t)> = f_\alpha({\bf X},t) +\sum\limits_{|{\bf k}|>0}C({\bf k})M_{{\bf k}}\frac{\partial^{|{\bf k}|}f_\alpha({\bf X},t)}{\partial {\bf X}^{{\bf k}}}=\\ &&=f_\alpha({\bf X},t) +\frac{1}{Z({\bf X},{\bf M},{\bf A},t)}\sum\limits_{|{\bf k}|>0}\int\limits_{R^{N}}\frac{z_1^{k_1}\cdots z_N^{k_N}}{k_1!\cdots, k_N!} \frac{\partial^{|{\bf k}|}f_\alpha({\bf X},t)}{\partial {\bf X}^{{\bf k}}}e^{-L({\bf z},{\bf X},{\bf A},t)}d{\bf z}^N=\\ &&= f_\alpha({\bf X},t) +\frac{1}{Z({\bf X},{\bf M},{\bf A},t)}\int\limits_{R^{N}}\Big[ f_\alpha({\bf z}+{\bf X},t)-f_\alpha({\bf X},t)\Big] e^{-L({\bf z},{\bf X},{\bf A},t)}d{\bf z}^N=\\ && = f_\alpha({\bf X},t)- \frac{\partial \ln Z({\bf X},{\bf M},{\bf A},t)}{\partial A_{\alpha}}\end{eqnarray*}$$
В результате уравнения усредненной динамики (\ref{EqClose}) можно переписать следующим образом: $$ \begin{eqnarray*} \nonumber && \dot{X_\alpha} = f_\alpha({\bf X},t) -\frac{\partial \ln Z({\bf X},{\bf M},{\bf A},t)}{\partial A_\alpha},\quad \dot{A_\alpha} = \sum\limits_{\beta=1}^N\left(\frac{\partial f_\beta({\bf X},t)}{\partial X_\alpha}-\frac{\partial^2 \ln Z({\bf X},{\bf M},{\bf A},t)}{\partial A_\beta\partial X_\alpha}\right)A_\beta,\\ \nonumber && \alpha=1,\ldots,N.\end{eqnarray*}$$
Анализ полученных уравнений сводится теперь к анализу статистической суммы удельного распределения, которые определяются свойствами производящей функции или, в конечном итоге, свойствами силовых функций $f_\alpha({\bf X},t)$.
7. Системы с квадратичной нелинейностью
Рассмотрим встречающиеся часто на практике в задачах механики, динамики кластеризации и химической кинетики системы с квадратичной нелинейностью, для которых: $$f_\alpha({\bf X}) = \sum\limits_{\beta=1}^N K_{\alpha\beta}x_{\beta}+\sum\limits_{\beta,\gamma=1}^NC_{\alpha\beta\gamma}x_\beta x_{\gamma}.\tag{3.29}\label{DeffQ}$$ Коэффициенты $C_{\alpha\beta\gamma}$ являются постоянными. В этом случае без труда находим:
$$L=\sum\limits_{\alpha=1}^N A_{\alpha}\Big(f_{\alpha}({\bf z}+{\bf X})-f_{\alpha}({\bf X})\Big)= \sum\limits_{\beta=1}^N A_\alpha K_{\alpha\beta}z_{\beta}+\sum\limits_{\alpha,\beta,\gamma=1}^N A_\alpha \Big[C_{\alpha\beta\gamma} z_\beta z_\gamma+2C_{\alpha\beta\gamma}z_\beta X_{\gamma}\Big].$$
Статистическая сумма удельного распределения в этом случае должна иметь следующий вид:
$$ Z({\bf X},{\bf A},t) = \int\limits_{R^N} \exp\Big\{-\sum\limits_{\alpha=1}^N \lambda_\alpha z_\alpha - \sum\limits_{\alpha,\beta,\gamma=1}^N A_\alpha C_{\alpha\beta\gamma} z_\beta z_\gamma\Big\}d{\bf z}^N.\tag{3.30}\label{EqZQ}$$
Здесь $\lambda_{\gamma}=\sum\limits_{\beta=1}^N A_\alpha K_{\alpha\gamma}+2\sum\limits_{\alpha,\beta}^N C_{\alpha\beta\gamma}A_{\alpha}X_{\beta}$. Свойства этого интеграла и определяют условия существования и свойства усредненной динамической системы.Интеграл справа в соотношении (\ref{EqZQ}) существует при интегрировании по всему вещественному пространству , тогда и только тогда, когда квадратичная форма в показателе экспоненты подинтегрального выражения положительно определена:
$$\sum\limits_{\alpha,\beta,\gamma=1}^N A_\alpha(t) C_{\alpha\beta\gamma} z_\beta z_\gamma \ge 0.$$
Если это условие не выполняется, то полученное решение вариационной задачи является фиктивным, поскольку интеграл справа в (\ref{EqZQ}) не существует при интегрировании по всему $R^N$ . В этом случае полученное решение может существовать лишь при определенных дополнительных ограничениях. Аналогичные требования, связанные с существованием статистической суммы относятся и к общему случаю. Если статистическая сумма не существует, то это означает, что в исходной постановке задачи при заданных силовых функциях $f_{\alpha}({\bf X},t)$ не существует решения задачи на максимум энтропии. Это означает не существование решения с независимыми флуктуациями ${\bf X}'(t)$ в различные моменты времени, что предполагалось при выводе функционала первой вариационной задачи. Однако при некоторых дополнительных ограничениях такое решение может существовать. Такие ограничивающие условия будем в дальнейшем называть стабилизирующими условиями.
Примером может служить система Вольтерра-Лотки [13]:$$\dot{x}=\alpha x - \beta xy + \varepsilon_1,~~~\dot{y}=-\mu y - \nu xy + \varepsilon_2,\tag{3.31}\label{EqVL}$$
Для этой системы находим:
$$L= \Big(A_1\alpha+ (A_2\nu -A_1\beta)Y) z_1+\Big((A_2\nu -A_1\beta)X-A_2\mu\Big) z_2 + (A_2\nu -A_1\beta) z_1z_2.$$
Эта функция не является положительно определенной на всем вещественном пространстве. Статистическая сумма для распределения с такой функцией $L$ не может существовать без дополнительных условий. Таким условием может быть, например, требование $z_1\ge 0,z_2\ge 0$. Если же в задаче допускаются флуктуации на всем вещественном пространстве, то в задачу приходится вносить дополнительные условия на дисперсии флуктуаций. Например, задача регуляризируется, если считать дисперсии известными функциями времени: $$<x'^2>=\sigma_1^2(t),~~<y'^2>=\sigma_2^2(t).\tag{3.32}\label{Consigma}$$
В этом случае функция $L$ примет вид:$$ L= \Big(A_1\alpha+ (A_2\nu -A_1\beta)Y)z_1+\Big((A_2\nu -A_1\beta)X-A_2\mu\Big) z_2 + (A_2\nu -A_1\beta) z_1z_2+A_3z_1^2+A_4z_2^2,
$$ где $A_3$ и $A_4$ - множители Лагранжа, соответствующие условиям (\ref{Consigma}) . В результате распределение становится норимруемым. Решение такой задачи исследовалось в работе [13]. Другие примеры такого рода приведены в работе [14].
8. Заключение
В работе построен метод замыкания систем усредненных уравнений Рейнольдса для случайно-возмущенных конечномерных динамических систем с помощью метода максимальной энтропии. Результатом применения метода к таким динамическим системам является совокупность уравнений, имеющих форму уравнений Гамильтона со связями, для которой роль функции Гамильтона выполняет удельная энтропия системы. В частности, на траектория системы удельная энтропия сохраняется. В работе представлен общий вывод функции распределения для флуктуаций в системе и силовых функций, которые выражаются через производные от статистического веса распределения. Это позволяет исследовать поведение различных систем под действием внешних или внутренних флуктуаций.
Работа выполнена при частичной финансовой поддержке РФФИ, проект 11-01-00747-а, а так же при частичной поддержке Министерства образования и науки РФ.
Список литературы
[1] А. С. Монин, А.М. Яглом. Статистическая гидромеханика. Ч.1. М.: Наука, (1967), 639 С; Ч.2 (1969), 720 С.
[2] У. Фриш. Турбулентность. Наследие Колмогорова. М.: Фазис, (1998), 343 с.
[3] П. Г. Фрик. Турбулентность: Модели и подходы. Ч.1 Пермь, (1998), 107 C.; Ч.2 Пермь, (1999), 138 C.
[4] Ю.Л.Климонтович. Введение в физику открытых систем. М.: ``Янус-К'', (2002), 284 C.
[5] В.Н. Николаевский. Пространственное осреднение и теория турбулентности. В сб. Вихри и волны. Серия Новое в зарубежной науке N 33. Механика. Под ред. В.Н. Николаевского. М.: Мир, 266 (1984)
[6] Журавлев В.М., Шляпин В.А. Нелинейный мир, 2008, Т.6, N7, c. 352-363
[7] Журавлев В.М. ЖТФ, 2009, N1, c. 16-27
[8] Журавлев В.М., Шляпин В.А. В сб. Прикладная математика и механика, 2009, УлГТУ, Ульяновск, с. 72-88
[9] Р. Л. Стратанович. Теория информации. М.: Со. радио (1975), 424 с.
[10] Б. Р. Фриден. Оценки, энтропия, правдоподобие. ТИИЭР, 73, N 12, 78 (1985)
[11] Burg J.P. In proc/ 37-th Meet. Society of Exploration Geophysisists. Oklahoma city, Oct. 31, 1967
[12] Дворянинов Г.С., Журавлев В.М., Прусов А.В. Метод максимальной энтропии в многомерном спектральном анализе. Преп. МГИ АН УССР, 1986. Ч. 1,2.
[13] В.М. Журавлев, П.П. Миронов. Динамика случайно-возмущенной системы Вольтерра-Лотки и метод максимальной энтропии. Нелинейный мир, - Т.9, N 4, 2011. C. 201-212
[14] В.М. Журавлев, П.П. Миронов. Случайно-возмущенные динамические модели и метод максимальной энтропии. Вест. Сам. Гос. Тех. Ун-та. Серия Физ.-мат. Науки. 2013. N1. C. 1-9
- Войдите на сайт для отправки комментариев
- 5227 просмотров