Быстрое тестирование пациентов во время пандемии имеет огромную важность. Но когда тестов на COVID-19 [в Британии] не хватает, или тестирование идёт медленно – нельзя ли придумать способ улучшить этот процесс? Я, как математик и инженер, задал себе вопрос – может ли теоретик сделать что-либо, чтобы помочь медикам удовлетворить требованиям ВОЗ о проверке максимально возможного количества пациентов.
Возможно, существует способ проверить много пациентов при помощи небольшого количества пробирок. Вместо того, чтобы использовать по пробирке на каждый тест, мы могли бы использовать несколько пробирок для проверки большего количества образцов – если привлечём к этому логику.
Идея простая. Образец, взятый от каждого из наших теоретических пациентов, распределяется на половину всех имеющихся у нас пробирок в разных комбинациях. Если у нас есть десять пробирок, мы распределяем образцы от каждого пациента в пять разных пробирок, комбинируя их по-разному.
Любая пробирка с отрицательным результатом говорит о том, что все пациенты, образцы которых попали в неё, дадут отрицательный результат. Пробирки с положительным результатом могут содержать образцы нескольких положительных пациентов – а каждый конкретный пациент будет признан положительным, если все связанные с ним пробирки дадут положительный результат.
Такой подход особенно эффективен на ранних стадиях эпидемии, когда положительный результат может дать небольшое количество людей.
Изменяем подход
Чем больше пациентов заражаются, тем сложнее определить, у кого из них вирус, поскольку в пробирках с положительным результатом будет содержаться материал от большего числа пациентов. Чтобы решить эту проблему, нужно исправить подход так, как показано в следующем примере.
Допустим, у нас есть шесть пробирок и 20 пациентов. Пробирки расставлены по порядку и пронумерованы: №1, №2, №3, №4, №5 и №6. Каждому пациенту присваивается шестизначный номер из нулей и единиц (в двоичной системе). Каждая цифра соответствует определённой пробирке – 0 означает, что в эту пробирку образец пациента не попал, а 1 – что попал.
К примеру, у пациента №1 будет число [0 0 0 1 1 1], означающее, что его материал содержат только пробирки №№4, 5 и 6. Пациенту №2 выдали число [0 0 1 0 1 1], что означает, что его образцы содержат пробирки №№3, 5 и 6. И так далее, для каждого из 20 пациентов.
Распределив по пробиркам образцы от всех 20 пациентов, мы отправляем их на проверку. Если после этого к нам придут положительные тесты для пробирок №№4, 5 и 6, мы сможем сказать, что положительный результат будет только у пациента №1 с номером [0 0 0 1 1 1], поскольку образцы только этого пациента добавлялись в три этих пробирки, №№4, 5 и 6, и ни в какие другие.
Теперь самое сложное. Допустим, нам пришли положительные результаты для пробирок №№3, 4, 5 и 6. Мы можем сразу отбросить пациентов, чьи пробы попадали в пробирки №1 и №2, но по поводу остальных определённости у нас нет, поскольку для этих пробирок у нас есть несколько возможностей. Больны ли пациенты с номерами [0 0 1 0 1 1] и [0 0 1 1 1 0], или же с [0 0 0 1 1 1], [0 0 1 0 1 1] и [0 0 1 1 0 1], или же все они вместе? Все эти комбинации дадут положительный результат для пробирок №№3, 4, 5 и 6. Можно ли получить определённый ответ по поводу того, кто из пациентов болен?
Да, но только если тест может давать не просто положительный или отрицательный результат, а некую степень положительности – к примеру, определять количество антител в образце. Тогда мы сможем сравнить количество позитивности в разных пробирках, что даст нам представление о правильной комбинации положительных пациентов.
Степень положительности
Возвращаясь к нашему примеру, если положительность для пробирок №4 и №5 одинаковая (допустим, в них одинаковое количество антител), но отличается в пробирках №3 и №6, то мы можем заключить, что пациенты [0 0 0 1 1 1] и [0 0 1 0 1 1] положительными быть не могут, поскольку образец от первого пациента [0 0 0 1 1 1] находится в пробирках №4 и №5, а образец от второго [0 0 1 0 1 1] в пробирках №5 (но не №4). Это значит, что положительность в этих пробирках не может быть одинаковой, если оба пациента больны (в пробирках №5 будет положительность обоих пациентов, а в №4 – только одного).
Одинаковая положительность в обоих пробирках №4 и №6 будет только у пациентов [0 0 0 1 1 1] и [0 0 1 1 1 0], поскольку пробы их обоих добавили в обе пробирки №4 и №5, что дало одинаковую положительность в обоих пробирках.
В приведённом примере мы смогли проверить 20 пациентов при помощи всего шести пробирок. Однако этот метод можно масштабировать на тысячи пациентов, и для их проверки понадобится гораздо меньше пробирок. И даже когда машины, способные проводить тесты за пять минут, уже находятся в разработке, этот подход может всё равно быть быстрее – и дешевле там, где ресурсов не хватает.
Получается, что при помощи математики мы можем улучшить проверку собранных образцов, особенно в тех местах и в то время, когда проверки встречаются с трудностями. В таких случаях этот подход потенциально может помочь смягчить влияние нового коронавируса и спасти множество жизней.
SDKiller
Это из категории вредных советов наверное.
Представляю как уставшие от 12-часовых смен, с красными глазами, сотрудники лаборатории, со шпаргалками раскладывают в нужной последовательности образцы 20 пациентов в 6 пробирок и думают "а правильно ли я разложил?"
Kostiantyn
С учетом нелинейности роста соотношения количества пробирок к количеству проб — это выглядит не так и плохо.
Хотя на практике, наверно, стоит ограничиться 10 пробирками что бы уменьшить человеческий фактор.
Но как написали ниже — это только "в стране розовых пони", ведь непонятно как поведут себя пробы крови (или чего там еще берут) от разных людей при смешивании, а так же уменьшение концентрации положительного образца десятками и сотнями отрицательных.
ebragim
Бред говорите. Такие лаборанты и в случае "одна пробирка = один пациент" могут накосячить и отправить в карантин здорового, отпустив больного.
Так же, в больших лабораториях работа тест-систем автоматизирована, просто при программировании протокола изменить алгоритм.