Пример гетероскедастичного шума. Красными прямоугольниками обозначены области с пикселями, значения в которых сомнительны: можно ли доверять этим значениям?
Пример гетероскедастичного шума. Красными прямоугольниками обозначены области с пикселями, значения в которых сомнительны: можно ли доверять этим значениям?

Здравствуй, Хабр! На связи отдел компьютерной томографии Smart Engines.

Как уже, наверное, известно нашему читателю, мы занимаемся разработкой томографического программного обеспечения. Мы работаем над совершенствованием алгоритмов реконструкции внутренней структуры объектов, боремся с артефактами реконструкции и различного рода шумами в измеренных данных. Наша основная задача - повысить качество реконструкции, увидеть чуть больше и чуть четче то, что когда-то было недоступно человеческому глазу.

Каждый пиксель детектора "живет своей жизнью и ошибается по своему". Ошибки связаны с шумом, который в каждом пикселе распределен уникальным образом и часто зависит от самого зарегистрированного значения. Такой шум называют гетероскедастичным.

Гетероскедастичность порождает на восстановленных изображениях искажения, которые мешают правильной интерпретации получаемых результатов. Наш отдел имеет опыт в противостоянии подобным зашумленностям данных, и сегодня мы хотели бы рассказать о придуманном нами методе фильтрации гетероскедастичного шума [1].

Пример гетероскедастичного шума. Красными прямоугольниками обозначены области с пикселями, значения в которых сомнительны: можно ли доверять этим значениям?

Напомним, что компьютерная томография - неразрушающий метод восстановления внутренней морфологической структуры объектов по набору зарегистрированных под разными углами проекций. Объект зондируется рентгеновским излучением, которое при прохождении через него ослабляется. Ослабленное излучение регистрируется позиционно-чувствительным детектором. При помощи алгоритмов реконструкции в применении к полученным на детекторе рентгеновским снимкам объекта (проекциям) осуществляется восстановление внутренней морфологии объекта. В реальности все несколько сложнее - есть много препятствий на этом пути!

В измеренных проекционных данных присутствуют шумы, которые искажают реконструированное изображение и в, конечном итоге, могут привести к неверным выводам исследователя. Нередко шум на проекционных снимках характеризуется тем, что дисперсия ошибки значения регистрируемого сигнала (количество рентгеновских квантов) зависит от математического ожидания сигнала в этом пикселе, и поэтому дисперсии ошибок значений сигнала в различных пикселях неодинаковы и могут сильно различаться от пикселя к пикселю. Абсолютные значения регистрируемых значений сигнала в соседних пикселях в такой ситуации могут отличаться на несколько порядков. Описанный шум на проекционных данных называется гетероскедастичным шумом.

Причины присутствия гетероскедастичного шума разнообразны. Он может быть обусловлен существенной неоднородностью объекта и наличием сильно поглощающих включений, содержащихся в объекте. Причина может скрываться в сбое работы регистрирующего оборудования, шум может быть обусловлен необходимостью сильного ограничения дозовой нагрузки. Гетероскедастичность наблюдается, когда время регистрации одной проекции (время экспозиции) мало.

Так или иначе проявление гетероскедастичности тесно связано с природой процесса регистрации рентгеновских квантов каждым отдельным пикселем детектора, на обсуждении чего мы временно и остановимся. В компьютерной томографии при зондировании монохроматическим излучением регистрируемое пикселем детектора значение I_1 формируется потоком рентгеновских квантов, прошедших через исследуемый объект в направлении “источник-детектор” l за определенное время экспозиции, и описывается следующим выражением:

I_1=I_0 \int e^{-\mu(l)}dl,

где I_0 – число квантов зонда, \mu – линейный коэффициент ослабления рентгеновского излучения используемой длины волны материалом объекта. Процесс регистрации проекционного снимка объекта является стохастическим (случайным) процессом, и случайная величина I_1 может быть описана следующей функцией распределения Пуассона с параметром \lambda>0:

P(I_1=k)=\frac{\lambda^k e^{-\lambda}}{k!},

где P(I_1=k) – вероятность того, что дискретная величина I_1 принимает значение k. И среднее, и дисперсия распределения величины I_1 в такой модели равняются параметру распределения Пуассона \lambda.

Для решения задачи компьютерной томографии, – то есть восстановления пространственного распределения коэффициента \mu, - удобно линеаризовать исходную задачу и перейти к изучению случайной величины y=\ln I_0 - \ln I_1. Поскольку логарифм есть монотонная функция на своей области определения, распределение вероятности линеаризованной дискретной случайной величины y не меняется относительно функции распределения вероятностей изначальной величины I_1. Тогда математическое ожидание E и дисперсия Var величины y рассчитываются по формулам:

E=\sum_{i=1}^{\infty} (\ln I_0 - \ln k_i)\frac{\lambda^{k_i} e^{-\lambda}}{k_i!},Var = \sum_{i=1}^{\infty}(\ln I_0 - \ln k_i - E)^2\frac{\lambda^{k_i} e^{-\lambda}}{k_i!},

где k_i обозначает реализацию случайной величины y.

Без ограничения общности описания придуманного нами метода рассмотрим 2D случай реконструкции, то есть будем говорить о реконструкции одного сечения объекта. Модель распространения рентгеновских лучей - параллельная или веерная. В алгебраическом подходе к реконструкции дискретизация соотношения I_1=I_0 \int e^{- \mu(l)}dl и замена интегрирования суммированием позволяет сформулировать задачу компьютерной томографии как задачу решения СЛАУ

Ax=y,

A - проекционная матрица (прямой оператор проецирования) размера N \times M, N=n \times n - количество пикселей восстанавливаемого объекта x, M - количество проекционных углов, x - оценка линейного коэффициента ослабления, компоненты вектора y - линеаризованные значения, зарегистрированные всеми ячейками детектора для всех проекционных углов. Решение СЛАУ Ax=y в свою очередь может быть заменено решением оптимизационной задачи

\| Ax-y \|_2 \xrightarrow{\quad x \quad} \min.

Как модифицировать эту оптимизационную задачу для учета эффекта гетероскедастичности?

Величины математического ожидания E=\sum_{i=1}^{\infty}(\ln I_0 - \ln k_i) \frac{\lambda^{k_i}e^{-\lambda}}{k_i!} и дисперсииVar = \sum_{i=1}^{\infty}(\ln I_0 -\ln k_i - E)^2\frac{\lambda^{k_i}e^{-\lambda}}{k_i!} линеаризованной случайной величины y ввиду быстрой сходимости рядов могут быть достаточно точно оценены частичными суммами этих рядов. К частичным суммам очень близкими оказываются результаты симуляции процесса регистрации сигнала ячейкой детектора методом Монте-Карло. На рис. 1 приведены результаты сравнения значений частичной суммы дисперсии Var и результатов симуляции методом Монте-Карло. В качестве генератора случайных величин использовался генератор для распределения Пуассона numpy.random.poisson (lam=i, size=5000). Модельные расчеты проводились для значений в интервале \lambda от 30 до 500 с шагом 0.5. Для каждого значения было сгенерировано 5000 значений. 

Рис. 1. Сравнение теоретического результата с результатом моделирования.
Рис. 1. Сравнение теоретического результата с результатом моделирования.

Близость результатов симуляции и теоретических выкладок выступают в пользу корректности расчета дисперсий методом Монте-Карло. Так, имеем способ оценки для каждого пикселя детектора дисперсии значения сигнала, регистрируемого им. Вычисленные оценки дисперсий для всех пикселей могут быть представлены в виде матрицыD

Будучи вычисленными, значения, обратные значениям квадратного корня из дисперсии разных пикселей D могут быть использованы в качестве весов для коррекции проекционной матрицы A с целью учета свойства гетероскедастичности наблюдений. Таким образом, чем больше дисперсия данных, тем меньше мы доверяем измеренному в этой ячейке детектора значению. При решении задачи реконструкции, припишем вес, равный обратному среднеквадратическому отклонению (корень из дисперсии) каждому наблюдаемому значению сигнала: 

y^*=y \circ \frac{1}{\sqrt{D}},

здесь \frac{1}{\sqrt{D}} обозначает матрицу, составленную из значений, обратных значениям среднеквадратического отклонения значений сигнала, который зарегистрирован пикселями детектора, \circ - операция поэлементного умножения матриц (произведение Кронекера матриц). Использование веса из обратных значений среднеквадратических отклонений значений сигнала соответствует тому, что пикселю детектора с большим значением дисперсии зарегистрированного сигнала мы “доверяем” меньше, чем пикселю с относительно небольшой дисперсией сигнала (именно поэтому матрица D носит название матрицы “доверия”). Тогда исходная СЛАУ Ax=y перепишется в виде

\frac{1}{\sqrt{D}} \circ Ax = y^*,

и оптимизационная задача может быть переформулирована как

F = \| \frac{1}{\sqrt{D}} \circ Ax - y^* \|_2 \xrightarrow{\quad x \quad}\min.

Для ее решения мы используем метод наискорейшего спуска. После выписывания в явном виде градиента минимизируемого функционала F

\nabla F = 2A^T \left( \frac{1}{\sqrt{D}} \circ \left[\frac{1}{\sqrt{D}} \circ Ax - y^* \right] \right)

может быть явно выписан шаг k+1 итерации метода:

x_{k+1}=x_k-\gamma_k \nabla F(x_k),

где \gamma_k- шаг спуска.  Оптимальное значение шага рассчитывается одним из методов решения оптимизационной задачи \gamma_k=\arg \min_{\gamma} (x_k - \gamma \nabla F(x_k)). На этом описание нашего метода учета гетероскедастичности завершено.

Разработанный метод учета гетероскедастичности был протестирован нами на синтетических данных. Для этого был использован фантом размером 50 × 50 пикселей, изображение которого представлено на рис. 2.

Рис. 2.  Изображение фантома, использованного в экспериментах.
Рис. 2.  Изображение фантома, использованного в экспериментах.

Были проведены эксперименты, моделирующие различные ситуации, имеющие место на практике в ходе измерения проекционных данных [1]:

  1. время экспозиции (время регистрации одной проекции) различается для первой и второй половины проекционных данных;

  2. сбой отклика детектора случился при одном из проекционных углов;

  3. наличие на проекционных данных шума (к значениям идеальной синограммы добавлен нормально распределенный аддитивный шум);

  4. время регистрации каждой проекции (время экспозиции) одинаково мало.

Результаты всех экспериментов на синтетических данных показывают увеличение точности реконструкции при учете гетероскедастичности. На рис. 3 представлены реконструированные изображения в проведенных экспериментах методом SIRT (а) и предложенным методом с учетом гетероскедастичности (б). Количество итераций метода SIRT в проведенных экспериментах составляет 50-100 итераций. В экспериментах 1 и 2 среднеквадратическое отклонение результата реконструкции от использованного для расчета проекций фантома при реконструкции методом SIRT составило 6.8e-1 (эксперимент 1) и 2.4e-4 (эксперимент 2), при реконструкции описанным методом с учетом гетероскедастичности– 4.4e-6 (эксперимент 1) и 1.6e-6 (эксперимент 2).  В экспериментах 3 и 4 также наблюдается уменьшение среднеквадратического отклонения результата реконструкции при учете гетероскедастичности (в пределах одного порядка).

Рис. 3.  Результаты реконструкции алгебраическими методами в экспериментах 1-4: а – методом SIRT, б – предлагаемым методом.
Рис. 3.  Результаты реконструкции алгебраическими методами в экспериментах 1-4: а – методом SIRT, б – предлагаемым методом.

Полученные результаты эксперимента 3 при этом демонстрируют высокую чувствительность нового подхода к наличию аддитивного нормально распределенного шума. Это следует учитывать при выборе метода реконструкции, если сбор проекций проведен в нестабильных условиях. 

В случае эксперимента 4 с малым временем экспозиции об улучшении качества реконструкции говорит визуально большая однородность фона на изображении, восстановленном с учетом гетероскедастичности (б), чем при использовании метода SIRT для реконструкции (а). Это свойство оказывается важным при применении автоматических методов оценки качества реконструкции, в которых привлечены интегральные метрики сравнения с опорным (идеальным) изображением. Более подробно ознакомиться с описанием и результатами приведенных экспериментов можно в нашей статье [1].

Заключение

Полученные результаты демонстрируют, что учет гетероскедастичности действительно позволяет повысить качество реконструкции. Учет свойства гетероскедастичности шума не нов, однако к нему не перестают апеллировать и сегодня при создании и исследовании различных математических инструментов.

На этом и наши исследования вовсе не заканчиваются - мы планируем в дальнейшем оценить вклад учета гетероскедастичности при решении задачи реконструкции на реальных данных и, может быть, внедрить в наше томографическое программное обеспечение Smart Tomo Engine. Будем держать тебя в курсе, Хабр!

Список литературы

  1. Чукалина М. В. и др. УЧЕТ ГЕТЕРОСКЕДАСТИЧНОСТИ В ИЗМЕРЯЕМЫХ ТОМОГРАФИЧЕСКИХ ПРОЕКЦИЯХ ПРИ РЕАЛИЗАЦИИ АЛГЕБРАИЧЕСКОГО ПОДХОДА В ТОМОГРАФИЧЕСКОЙ РЕКОНСТРУКЦИИ //Сенсорные Системы. – 2022. – Т. 36. – №. 1.

Комментарии (9)


  1. N-Cube
    15.06.2023 12:20

    В спутниковой интерферометрии это все давно придумано и применяется. Я уже публиковал на хабре статью про то, как свести задачу взвешенного метода наименьших квадратов к классической (например, в numpy есть быстрый решатель именно для этого случая) и как это помогает устранить помехи даже в случае временного перекрытия луча реальными объектами (облаками, в случае спутниковой интерферометрии). Весьма древняя эта «инновация» :)


    1. SmartEngines Автор
      15.06.2023 12:20

      Здравствуйте. Статью про ускорение метода обязательно почитаем, спасибо. “Инновацией” было как применять метод в компьютерной томографии, какие именно брать веса.


      1. N-Cube
        15.06.2023 12:20

        В интерферометрии есть два подхода для выбора весов - основанный на парной корреляции пикселов между снимками и на постоянных отражателях (как у вас в статье, выбираются пикселы с низкой дисперсией). Первый вариант работает, когда стабильных пикселов мало и по ним картинку не получить, второй - когда много стабильных пикселов и можно анализировать только их. Самое интересное, конечно, использовать комбинированный подход. Вероятно, у вас тоже можно оба метода и их комбинацию применить.


  1. Lex20
    15.06.2023 12:20

    Вот я не понял почему рука на рентгене пиксельная. Не проще ли разрешение повысить чем гадать что там? Или пускай нейросеть будет гадать, там функции огого какого порядка.


    1. SmartEngines Автор
      15.06.2023 12:20
      +2

      Увеличение дозовой нагрузки уменьшит "пиксельность", мы предложили подход для малодозовой нагрузки. При частых КТ, например в ковид, малодозовость обследований – важный момент.


      1. Lex20
        15.06.2023 12:20

        Понял. Не лучше ли МРТ в таких случаях? Или УЗИ? Если что я только Хауса по теме смотрел, но мне для себя интересно. Я так понимаю КТ от безысходности применяют?


        1. Matshishkapeu
          15.06.2023 12:20
          +1

          Тащемта КТ и МРТ видят разный контраст. Для КТ объекты контрастны по разному содержанию тяжелых элементов, которые ослабляют рентген (кости на фоне мышц, лёгкие на фоне прочих тканей). МРТ реагирует на разное содержание в тканях атомов водорода (связки на фоне суставной жидкости, жировая ткань на фоне органов), . Что то видно лучше в одном, что то в другом.


          1. Lex20
            15.06.2023 12:20

            Ок, спасибо


  1. Sdima1357
    15.06.2023 12:20

    Довольно древний метод, ничего нового. Сейчас распространены более продвинутые техники структурного подавления шума СТ.

    1 по большому счету важно не время проекции, а только количество поглощенных/пропущенных фотонов, ведь мы измеряем поглощение фотонов материалом, поэтому в реальных сканах излучение источника даже специально ослабляют по краям для выравнивания сигнала на детекторе и получения равномерного шума на реконструкции.

    2 проверять методы лучше на значительно больших размерностях картинки, хотя бы на 128х128 несмотря на сильное замедление реконструкции . Я проверяю на 512х512

    3 сбойные проекции можно просто включать в итеративную реконструкцию с малым весом

    И ответ на вопрос в заголовке - Да, шум мешает. Его можно надежно уменьшить увеличением дозы и ненадежно - шумоподавлением :(