Определение лекарственной устойчивости и токсигенности Clostridioides difficile

Геномный надзор за возбудителем антибиотик-ассоциированного колита — ургентного патогена CDC/ВОЗ


🧬 Описание пейплайна

Clostridioides difficile (C. diff) — грамположительная анаэробная спорообразующая палочка, ведущий возбудитель антибиотик-ассоциированной диареи и псевдомембранозного колита. CDC классифицирует CDI как ургентную угрозу («urgent threat»): в США ежегодно регистрируется >500 000 случаев и ~30 000 летальных исходов. Ключевая проблема — рост резистентности к метронидазолу и вспышки, вызванные гипервирулентными риботипами (прежде всего RT027/NAP1), устойчивыми к фторхинолонам.

Наш пайплайн обеспечивает полный цикл анализа нанопоровых данных: от выявления токсин-продуцирующих штаммов до профиля устойчивости ко всем клинически значимым антибиотикам — прямо в больничной лаборатории без передачи данных за рубеж.

  • 📥 На входе: Сырые данные в формате FASTQ после High Accuracy basecalling (Dorado SUP, химия R10.4.1). Поддерживается полногеномное секвенирование (WGS) и ампликонное секвенирование ключевых генов резистентности.
  • 📤 На выходе: HTML-отчёт для клинициста с токсинотипом, риботипом (in silico) и профилем чувствительности; технический QC-отчёт для биоинформатика.

📊 Доступность продукта

Платформа Статус доступности
OnSiteSeq Cockpit Edge 🟡 В разработке
OnSiteSeq Cockpit Desktop 🟡 В разработке
OnSiteSeq Cockpit Cloud 🔴 Не доступно

☣️ Токсины и факторы вирулентности

Первым делом пайплайн определяет токсигенный потенциал штамма — главный клинический вопрос при CDI:

Ген Белок Значение
tcdA Токсин A (энтеротоксин) Маркер патогенности (PaLoc)
tcdB Токсин B (цитотоксин) Главный фактор вирулентности CDI
tcdC Репрессор PaLoc Делеция 18 п.н. → гиперпродукция токсинов (RT027)
cdtA Бинарный токсин, компонент A Маркер гипервирулентных риботипов (RT027, RT078, RT244)
cdtB Бинарный токсин, компонент B То же

🎯 Гены и мутации резистентности

Ген Ключевые мутации Класс антибиотиков
gyrA Thr82Ile Ципрофлоксацин, фторхинолоны — главный драйвер эпидемий RT027
gyrB Asp426Asn, Lys447Glu Фторхинолоны
rpoB Val1143Gly, Arg505Lys и др. Фидаксомицин, Рифаксимин
tetM / tetW Наличие гена Тетрациклин
ermB Наличие гена Эритромицин, Клиндамицин (MLSB-феноменотип)
nimB Наличие гена Метронидазол (нитроимидазол-резистентность)
vanB Кластер vanHBXB Ванкомицин (редко, эпидемиологический маркер)

Профиль антибиотиков в отчёте

Антибиотик Класс Клиническое значение
Ванкомицин Гликопептид Первая линия (тяжёлая CDI)
Фидаксомицин Макроциклический антибиотик Предпочтителен при рецидивах
Метронидазол Нитроимидазол Исторически первая линия, рост резистентности
Рифаксимин Ансамицин Follow-on терапия при рецидивах
Ципрофлоксацин Фторхинолон Эпидемиологический маркер (RT027)
Тетрациклин Тетрациклин Эпидемиологический маркер

🧫 In silico риботипирование

PCR-риботипирование — золотой стандарт эпидемиологического надзора за CDI. Пайплайн выполняет его in silico по WGS-данным:

Риботип Особенности
RT027 (NAP1/BI) Гипервирулентный; tcdC Δ18 п.н.; bинарный токсин; устойчив к фторхинолонам
RT078 Гипервирулентный; бинарный токсин; зооноз (свиньи)
RT014 / RT020 Наиболее распространены в Европе
RT001 / RT002 Исторически доминировали в РФ
RT244 Эмерджентный гипервирулентный риботип (Австралия)

⚙️ Версии и ML-модели

Основной инструмент

Компонент Статус
OnSiteSeq CDI Pipeline 🟡 В разработке

Планируемые ML-модели

Модель Целевая задача
CDI-Tox-Classifier Классификация токсинотипа по WGS (tcdA/B/C/cdtAB)
CDI-Res-Detector Предсказание резистентности по 6 классам АБ
CDI-Ribotyper In silico риботипирование (≥30 риботипов)

Обучение планируется на открытых геномах из NCBI Pathogen Database (>5 000 геномов C. difficile) и данных европейского консорциума ESCMID CDI Study Group.


🛠 Под капотом: Зависимости и Окружение (Pipeline Stack)

Этап пайплайна Ключевые библиотеки и инструменты
1. Контроль качества (QC) porechop_abi, NanoFilt, pigz
2. Выравнивание (Mapping) minimap2 2.26, samtools >=1.17 (Референс: C. diff 630 / R20291)
3. Поиск мутаций (Variant Calling) clair3 >=1.0.4, medaka
4. Детекция токсинов и генов AMR AMRFinderPlus, abricate (базы CARD, VFDB, Resfinder)
5. In silico риботипирование mlst (схема C. difficile, PubMLST), кастомный риботипер
6. ML-инференс PyTorch, pandas, scikit-learn

🌍 Глобальный контекст: почему это важно

  • CDC, 2019 — C. difficile занесён в категорию «Urgent Threat» — наивысший уровень угрозы.
  • ВОЗ AMR Action Plan — CDI назван одной из приоритетных нозокомиальных инфекций.
  • Россия — данные о распространённости риботипов ограничены; доминируют RT001, RT002, RT014, но RT027 фиксируется в крупных стационарах.
  • Ключевая проблема диагностики — текущий стандарт (ИФА на токсины + культура) занимает 2–5 дней. Геномный анализ на месте даёт результат в тот же день и одновременно закрывает вопрос об устойчивости к антибиотикам.

🔬 Связанные источники

© 2026 Роман Горбенко, МФТИ-стартап "OnSiteSeq - Секвенирование на месте (у кровати / у стола / в поле)"