Многие современные промышленные производства и сферы по добыче полезных ископаемых включают в себя воздействие на работников химических веществ, небезопасных и вредных для их здоровья. Поэтому тестирование токсичности, то есть уровня того, насколько химическое соединение смертельно опасно для человеческой жизни, чрезвычайно важно для безопасной работы миллионов рабочих в разных промышленностях. Несмотря на это, большинство из 85000 химических соединений, содержащихся в потребительских продуктах, не протестировано на безопасность полноценно.
Тестирование на животных влечёт за собой такие проблемы, как этические соображения, но ещё и выходит слишком затратным по деньгам и времени. К такому результату в своих исследованиях пришла группа учёных во главе с Даниэлем Руссо – кандидатом наук в Центре вычислительной и интегративной биологии Ратгерского университета: «Имеется срочная мировая необходимость в точных, дешёвых и быстрых методах тестирования уровня токсичности в химикатах для уверенности в безопасности людей, которые с ними работают или работают в средах, где они используются».
Ранее применялись способы компьютерного решения данного вопроса, когда парно изучались химические соединения, одно из которых было структурно подобным тому, чья токсичность уже определена. Но они не работали для уникальных соединений, и не были достаточно точны в силу того, что корреляция уровня токсичности и подобия структуры соединений была не столь высока.
Проблемы прошлых программных методов были устранены разработкой первого в своём роде алгоритма, автоматически извлекающего данные о миллионах химикатов из базы данных агентства Национальных институтов здоровья и сравнивающего протестированные соединения с не протестированными по фрагментам. В алгоритме задействованы многие математические методы, с помощью которых оцениваются степени подобия и различия фрагментов химических соединений, что в конечном итоге позволяет предсказать токсичность не тестированного химиката.
«Алгоритм, разработанный лабораториями Даниэля Россо и профессора химии Хао Чжу, обрабатывая массивные объёмы данных, распознаёт взаимосвязи между фрагментами химических соединений различных химических категорий, и делает это экспоненциально быстрее человека.» – говорит соавтор исследования Лорен Алексунес.
Обучение алгоритма было начато с 7385 химических соединений с известной токсичностью, затем добавили 600 новых соединений. Для некоторых групп химикатов получилась точность 62% предсказания уровня их пероральной токсичности. Такое сравнение химических веществ алгоритмом пролило свет на новые признаки, по которым можно определять токсичность.
В исследовании изучалась токсичность соединений при их пероральном проникновении, однако учёные полагают, что стратегию исследования можно распространить на предсказание и других типов токсичности.