🧬 Описание пейплайна
Clostridioides difficile (C. diff) — грамположительная анаэробная спорообразующая палочка, ведущий возбудитель антибиотик-ассоциированной диареи и псевдомембранозного колита. CDC классифицирует CDI как ургентную угрозу («urgent threat»): в США ежегодно регистрируется >500 000 случаев и ~30 000 летальных исходов. Ключевая проблема — рост резистентности к метронидазолу и вспышки, вызванные гипервирулентными риботипами (прежде всего RT027/NAP1), устойчивыми к фторхинолонам.
Наш пайплайн обеспечивает полный цикл анализа нанопоровых данных: от выявления токсин-продуцирующих штаммов до профиля устойчивости ко всем клинически значимым антибиотикам — прямо в больничной лаборатории без передачи данных за рубеж.
- 📥 На входе: Сырые данные в формате
FASTQ после High Accuracy basecalling (Dorado SUP, химия R10.4.1). Поддерживается полногеномное секвенирование (WGS) и ампликонное секвенирование ключевых генов резистентности.
- 📤 На выходе: HTML-отчёт для клинициста с токсинотипом, риботипом (in silico) и профилем чувствительности; технический QC-отчёт для биоинформатика.
📊 Доступность продукта
| Платформа |
Статус доступности |
| OnSiteSeq Cockpit Edge |
🟡 В разработке |
| OnSiteSeq Cockpit Desktop |
🟡 В разработке |
| OnSiteSeq Cockpit Cloud |
🔴 Не доступно |
☣️ Токсины и факторы вирулентности
Первым делом пайплайн определяет токсигенный потенциал штамма — главный клинический вопрос при CDI:
| Ген |
Белок |
Значение |
| tcdA |
Токсин A (энтеротоксин) |
Маркер патогенности (PaLoc) |
| tcdB |
Токсин B (цитотоксин) |
Главный фактор вирулентности CDI |
| tcdC |
Репрессор PaLoc |
Делеция 18 п.н. → гиперпродукция токсинов (RT027) |
| cdtA |
Бинарный токсин, компонент A |
Маркер гипервирулентных риботипов (RT027, RT078, RT244) |
| cdtB |
Бинарный токсин, компонент B |
То же |
🎯 Гены и мутации резистентности
| Ген |
Ключевые мутации |
Класс антибиотиков |
| gyrA |
Thr82Ile |
Ципрофлоксацин, фторхинолоны — главный драйвер эпидемий RT027 |
| gyrB |
Asp426Asn, Lys447Glu |
Фторхинолоны |
| rpoB |
Val1143Gly, Arg505Lys и др. |
Фидаксомицин, Рифаксимин |
| tetM / tetW |
Наличие гена |
Тетрациклин |
| ermB |
Наличие гена |
Эритромицин, Клиндамицин (MLSB-феноменотип) |
| nimB |
Наличие гена |
Метронидазол (нитроимидазол-резистентность) |
| vanB |
Кластер vanHBXB |
Ванкомицин (редко, эпидемиологический маркер) |
Профиль антибиотиков в отчёте
| Антибиотик |
Класс |
Клиническое значение |
| Ванкомицин |
Гликопептид |
Первая линия (тяжёлая CDI) |
| Фидаксомицин |
Макроциклический антибиотик |
Предпочтителен при рецидивах |
| Метронидазол |
Нитроимидазол |
Исторически первая линия, рост резистентности |
| Рифаксимин |
Ансамицин |
Follow-on терапия при рецидивах |
| Ципрофлоксацин |
Фторхинолон |
Эпидемиологический маркер (RT027) |
| Тетрациклин |
Тетрациклин |
Эпидемиологический маркер |
🧫 In silico риботипирование
PCR-риботипирование — золотой стандарт эпидемиологического надзора за CDI. Пайплайн выполняет его in silico по WGS-данным:
| Риботип |
Особенности |
| RT027 (NAP1/BI) |
Гипервирулентный; tcdC Δ18 п.н.; bинарный токсин; устойчив к фторхинолонам |
| RT078 |
Гипервирулентный; бинарный токсин; зооноз (свиньи) |
| RT014 / RT020 |
Наиболее распространены в Европе |
| RT001 / RT002 |
Исторически доминировали в РФ |
| RT244 |
Эмерджентный гипервирулентный риботип (Австралия) |
⚙️ Версии и ML-модели
Основной инструмент
| Компонент |
Статус |
| OnSiteSeq CDI Pipeline |
🟡 В разработке |
Планируемые ML-модели
| Модель |
Целевая задача |
| CDI-Tox-Classifier |
Классификация токсинотипа по WGS (tcdA/B/C/cdtAB) |
| CDI-Res-Detector |
Предсказание резистентности по 6 классам АБ |
| CDI-Ribotyper |
In silico риботипирование (≥30 риботипов) |
Обучение планируется на открытых геномах из NCBI Pathogen Database (>5 000 геномов C. difficile) и данных европейского консорциума ESCMID CDI Study Group.
🛠 Под капотом: Зависимости и Окружение (Pipeline Stack)
| Этап пайплайна |
Ключевые библиотеки и инструменты |
| 1. Контроль качества (QC) |
porechop_abi, NanoFilt, pigz |
| 2. Выравнивание (Mapping) |
minimap2 2.26, samtools >=1.17 (Референс: C. diff 630 / R20291) |
| 3. Поиск мутаций (Variant Calling) |
clair3 >=1.0.4, medaka |
| 4. Детекция токсинов и генов AMR |
AMRFinderPlus, abricate (базы CARD, VFDB, Resfinder) |
| 5. In silico риботипирование |
mlst (схема C. difficile, PubMLST), кастомный риботипер |
| 6. ML-инференс |
PyTorch, pandas, scikit-learn |
🌍 Глобальный контекст: почему это важно
- CDC, 2019 — C. difficile занесён в категорию «Urgent Threat» — наивысший уровень угрозы.
- ВОЗ AMR Action Plan — CDI назван одной из приоритетных нозокомиальных инфекций.
- Россия — данные о распространённости риботипов ограничены; доминируют RT001, RT002, RT014, но RT027 фиксируется в крупных стационарах.
- Ключевая проблема диагностики — текущий стандарт (ИФА на токсины + культура) занимает 2–5 дней. Геномный анализ на месте даёт результат в тот же день и одновременно закрывает вопрос об устойчивости к антибиотикам.
🔬 Связанные источники
© 2026 Роман Горбенко, МФТИ-стартап "OnSiteSeq - Секвенирование на месте (у кровати / у стола / в поле)"