На Хабре имеется несколько статей, главным образом в помощь начинающим аналитикам данных, в которых описываются всевозможные статистические распределения случайных величин. Упоминания об одном единственном я в них не нашел. Имя ему К-распределение. Хочу вам показать этого единорога.

На практике такое распределение используется, как правило, довольно узкими специалистами. В основном при математическом моделировании работы радиолокационных станций (РЛС), а также радаров с синтезированной апертурой и то в определенных условиях. Аналитиками данных в повседневной жизни конечно же не используется. Хотя, возможно К-распределение может описывать какие-то процессы, кто знает, эта сторона вопроса требует дополнительного изучения. Предлагаю аналитикам данных над этим подумать, а также всем желающим.

Примечательно то, что в настоящее время в отечественной научной литературе К-распределение упоминается крайне редко, а если и упоминается, то вскользь и в очень краткой форме. Следует отметить, что недавно, о нем все-таки появилась статья в Википедии, опять же в кратком изложении. Соответственно из нее тяжело что-либо понять, особенно человеку, плохо знакомому с математической статистикой, ну или просто подзабывшему данную область научного знания. Также, если Вы начнете искать информацию в поисковиках, возможно наткнетесь на мои статьи в научных журналах, где я исследую К-распределение. Материал возможно будет интересен специалистам в области математики, аналитикам данных, разработчикам, а также специалистам в области радиоэлектронных и телекоммуникационных систем.

Ниже я опишу К-распределение плотности вероятности, расскажу для чего в основном в настоящее время оно применяется и что описывает. Надеюсь, что Вы узнаете для себя что-то новое из этого текста.

Несколько лет назад, в процессе обучения в аспирантуре, у меня возникла необходимость рассмотреть вопрос о влиянии радиолокационных помех от взволнованной морской поверхности на качество обнаружения радиолокационными станциями малоразмерных объектов, расположенных на взволнованной морской поверхности.

Изучив массу иностранной и отечественной литературы по мешающим радиолокационным отражениям от взволнованной водной глади, я узнал о К-распределении. Как я уже упоминал выше, оказалось, что подробно К-распределение описано только в иностранной литературе [1-6].

Опишем К-распределение применительно к радиолокационным помехам от морской поверхности. Для интереса, рассмотрим его в контексте из области радиолокации, в котором оно изначально использовалось и было изобретено. Если не рассматривать контекст, то в обезличенном виде вывод будет точно таким же, только вместо огибающей помех от моря (под огибающей понимается обычный модуль принимаемого сигнала, в нашем случае, мешающих отражений от моря), обозначенной ниже, как E, будет обезличенная случайная величина.

Известно, что для РЛС с длинными зондирующими импульсами, когда облучается участок морской поверхности намного больший чем протяженность морской волны, амплитуда морских помех имеет гауссовское распределение, а их огибающая – рэлеевское распределение. Под огибающей понимается модуль. По мере уменьшения длительности зондирующих импульсов, то есть при увеличении разрешения радара по дальности, а также при существенном влиянии малых углов скольжения (угол между морской поверхностью и лучом РЛС), распределение амплитуды помех становится негауссовским, и закон распределения огибающей, особенностью которого является более длинный "хвост" распределения, существенно отличается от рэлеевского.

Частично подходящие статистические модели морских отражений, основанные на лог-нормальном распределении и распределении Вейбулла, нашли применение только благодаря экспериментальным исследованиям морских отражений и не основаны на физическом понимании механизмов их возникновения. Другим распределением, которое становится все более популярным, является составное K-распределение, имеющее преимущество по сравнению с другими моделями морских отражений. Модель помех, основанная на К-распределении, имеет теоретическое обоснование и физическую интерпретацию.  

В ходе практических исследований в различных условиях было обнаружено, что излученные сигналы в основном рассеиваются рябью на морской поверхности. Возникающие более крупные структуры на морской поверхности, которые можно назвать гравитационными волнами, а также «барашки», острые кромки волн перед обрушением, брызги и пена после обрушения перекатывающихся волн приводят к изменению уровня мощности отражений [1-3]. Таким образом, огибающая помех для морских РЛС с короткими зондирующими импульсами и высоким разрешением может быть хорошо описана двумя компонентами. Первый компонент основан на распределении Рэлея.

Второй компонент изменяет локальную среднюю мощность (дисперсию) первого компонента, т.е. мощность морских отражений изменяется по причине влияния более крупных неоднородностей на морской поверхности. Локальная средняя мощность изменяется во времени, и от ячейки разрешения к ячейке. Этот компонент описывается гамма распределением.

Запишем формулу для гамма распределения плотности вероятности, как зависимость от мощности принимаемых помех x. Формула будет играть большую роль в моделировании помех от структур морских неоднородностей для РЛС с короткими импульсами.

P{g}\left(x\right)=\frac{b^{\nu}}{\Gamma\left(\nu \right)}x^{\nu-1}exp\left(-bx\right), 0\leq x\leq\infty

где b – масштаный коэффициент или параметр «шкалы»; v - параметр формы, определяется условиями наблюдения и параметрами локатора [3]; Г(v) - гамма-функция.

Запишем плотность распределения вероятности рэлеевского процесса

Pr\left(E|x\right)=\frac{2E}{x}exp\left(-E^{2}/x\right), 0\leq E\leq\infty

где E - огибающая принятого сигнала (его модуль).

Усредним рэлеевский процесс Pr(E|x) гамма распределением Pg(x)

P\left(E\right)=\int_{0}^{\infty}{Pr\left(E|x\right)P{g}\left(x\right)dx}=2E\int_{0}^{\infty}{exp\left(-E^{2}/x\right)P{g}\left(x\right)\frac{dx}{x}}

Тогда формула для К-распределения будет иметь вид

P\left(E\right)=\frac{2Eb^{\nu}}{\Gamma \left(\nu \right)}\int_{0}^{\infty}{x^{\nu-2}}exp\left(-bx-E^{2}/x\right)dx==\frac{4b^{(\nu +1)/2}E^{\nu }}{\Gamma (\nu )}K_{\nu -1}(2E\sqrt{b}), 0\leq E\leq\infty

К-функция или,так называемая, модифицированная функция Бесселя, которая присутствует в формуле и дает название модели.

Моменты n огибающей К-распределения находятся по формуле [1, 2]:

M\left\{E^{n} \right\}=b^{\frac{-n}{2}}\left(\frac{\Gamma(1+n/2)\Gamma(\nu+n/2) }{\Gamma(\nu )} \right)

Также известна плотность вероятности огибающей Е аддитивной смеси К-помехи с гауссовским шумом, например, внутренним шумом радиоприемника [1]

P\left(E\right)=\frac{2Eb^{\nu}}{\Gamma \left(\nu \right)}\int_{0}^{\infty}\frac{{x^{\nu-1}}exp\left(-bx\right)}{x+P_{n}}exp\left(-E^{2}/(x+P_{n})\right)dx

где Pn – мощность (дисперсия) гауссовского шума (в нашем случае, приемника РЛС).

Мощность (она же дисперсия) Pp помехи с К-распределением определяется параметрами ν и b, как половина второго начального момента ее огибающей (модуля), а именно зависимостью [1]:

P_{p}=0.5M\left\{E^{2} \right\}=0.5(\nu/b)

Тогда мощность (дисперсия) смеси К-помехи с гауссовским шумом связана с параметрами распределения зависимостью:

P_{p}=0.5M\left\{E^{2} \right\}=0.5(\nu/b+P_{n})

На рисунке представлен вид К-распределения плотности вероятности значений огибающей E (ну или обезличенной случайной величины, как вам удобнее) без смеси с гауссовским шумом для различных значений его параметров v и b.

С недавнего времени для математического моделирования, расчетов и обработки данных использую Python. Очень уж он мне нравится. И конечно же ни в одной из предназначенных для математических расчетов библиотек датчика, который мог бы выдавать случайные числа с К-распределением плотности вероятности я не нашел. Но его можно сделать самостоятельно. Если уважаемая публика проявит интерес, то я напишу еще статью, где мы математически выведем формулы для формирования случайных чисел с К-распределением плотности вероятности, для того, чтобы сделать свой собственный датчик таких чисел (выше приведенные формулы не генерируют такие числа, они только описывают плотность распределения вероятности в зависимости от параметров распределения), который можно было бы использовать для экспериментов, а также покажем, что полученные значения действительно имеют К-распределение (все сделаем конечно же на Python). Если вам было бы интересно, пишите в комментариях.

Для особо любознательных привожу список источников:

1. Ward K. Sea clutter: scattering, the K distribution and radar performance. 2nd edition. Croydon, CPI Group Ltd, 2013. 586 p.

2. Watts S. The modeling of radar sea clutter. A thesis submitted to the University of Birgingham for the degree of doctor of science. University of Birmingham, 2013. 27 p.

3. Antipov I. Analysis of sea clutter returns. Salisbury, DSTO Electronic and surveillance research laboratory, 1998. 45 p.

4. Antipov I. Simulation of sea clutter returns. Salisbury, DSTO Electronic and surveillance research laboratory, 1998. 71 p.

5. Ward K, Baker C, Watts S. Maritime surveillance radar. Part 1: Radar scattering from the ocean surface. IEE Proc, 1990, No. 2, pp. 51-62.

6. Ryan J., Johnson M. Radar performance prediction for target detection at sea. IEE Proc, 1992, No. 365, pp. 13-17.

Комментарии (6)


  1. Bigata
    07.10.2021 05:51

    Автору респект, серьёзная тема. А другие стат методы не рассматривали?


    1. MilashchenkoEA Автор
      07.10.2021 06:25

      Применительно к отражениям от моря?


      1. Bigata
        07.10.2021 07:25

        Да


        1. MilashchenkoEA Автор
          07.10.2021 08:48

          Ещё могут подходить лог-нормальное распределение, распределение Вейбулла и Райса. Это общеизвестная информация. Но К-распределение описывает статистику мешающих отражений наиболее точно по сравнению с другими. Проверял на записях с реальных РЛС, работающих по морю.


  1. GeorgeGFedoroff
    07.10.2021 06:19

    Python хорош, спору нет. А еще для статистики хорош R, и для него есть К-распределение. https://cran.r-project.org/web/packages/qqtest/vignettes/K-distribution.html
    Но обязательно напишите как вы реализовали генерацию.


    1. MilashchenkoEA Автор
      07.10.2021 06:22

      Спасибо за информацию, с R никогда не знакомился, интересно посмотреть было бы, как там реализовано распределение.