Многие из нас знакомы с тем, как следы, такие как волосы, волокна, пороховые остатки и почва, используются в криминалистике для установления связи между человеком и конкретным местом, объектом или событием. Осознание того, что во многих местах обитают уникальные популяции бактерий, наводит на мысль, что определение перемещений людей с помощью микроорганизмов, которые они естественным образом переносят во время путешествий, принесло бы большую пользу медицине и эпидемиологии, не говоря уже о расследовании преступлений.
Шведские ученые разработали инструмент, который делает именно это. Используя образец микробиома — сообщества микроорганизмов, существующего в определённой среде, например, на пляже, — который носит с собой человек, он может с удивительной точностью определить, откуда был взят этот образец.
В отличие от ДНК человека, микробиом человека постоянно меняется, когда он вступает в контакт с различными средами. Таким образом, можно понять, как распространяются болезни, выявить потенциальные источники инфекции и локализовать появление устойчивости микроорганизмов. Такое отслеживание также даёт криминалистические ключи, которые можно использовать в уголовных расследованиях.
Микробные сообщества оставляют особые географические следы, как и люди. Некоторые данные, полученные из этих сообществ, являются глобальными, но некоторые ограничены определёнными регионами или средами. В своем новом исследовании учёные сосредоточились на бактериях.
Были проанализированы обширные наборы данных образцов микробиома из городской среды, почвы и морских экосистем. Ученые обучили модель искусственного интеллекта определять уникальные пропорции этих «отпечатков» и связывать их с географическими координатами. Результаты оказались очень мощным инструментом, который может с впечатляющей точностью определять место происхождения образца микробиома.
ИИ успешно определял источник загрязнения в 92% городских проб. Однако ученые обнаружили, что наибольшее соответствие между прогнозами ИИ и городами выборки наблюдалось в тех городах, которые были хорошо представлены в обучающем наборе данных. Чтобы выяснить, влияет ли большое количество выборок в регионах на точность инструмента, они переобучили модель только на 31 городе с менее чем 100 выборками и рассчитали точность прогнозирования на уровне 87%, что лишь немного меньше 92% точности полного набора данных.
Чтобы оценить точность ИИ в малых масштабах, они обучили его на данных из трёх наиболее густонаселённых городов: Нью-Йорка, Гонконга и Лондона. В Гонконге ИИ смог различить две станции метро, расположенные на расстоянии 172 м друг от друга. В Нью-Йорке он отделил киоск от поручня на расстоянии менее метра. Однако в Лондоне инструмент продемонстрировал низкую точность прогнозирования: только половина образцов была правильно отнесена к своим географическим кластерам. Исследователи объяснили это неопрятным состоянием станций лондонского метро (образцы были собраны до пандемии COVID-19) по сравнению со станциями в Гонконге, которые они назвали «абсолютно чистыми».
По словам ученых, добавление данных о микробиоме по мере их сбора только улучшит этот инструмент. Ученые только начали понимать взаимосвязь между микроорганизмами и окружающей средой. Сейчас они планируют составить карту микробиома целых городов, что может способствовать судебно-медицинским исследованиям и позволит лучше узнать организмы, населяющие наши улицы, сады, кожу и тела.
Источник: журнал Genome Biology and Evolution