🧬 Описание пейплайна
Острые респираторные вирусные инфекции (ОРВИ) вызываются десятками различных вирусов с клинически неразличимой картиной. Быстрое точное определение возбудителя критично для трёх клинических задач: назначение антивирусной терапии (осельтамивир при гриппе, нирматрелвир при COVID-19), инфекционный контроль (изоляция RSV-пациентов в педиатрии) и эпидемиологический надзор (мониторинг циркулирующих штаммов гриппа).
Наш пайплайн использует метагеномное нанопоровое секвенирование (mNGS): образец (мазок из носоглотки, БАЛ) секвенируется без предварительного знания о возбудителе — все вирусы выявляются одновременно. Для выявленного гриппа A/B дополнительно определяется субтип и профиль резистентности к противовирусным препаратам.
- 📥 На входе: Сырые данные в формате
FASTQ после High Accuracy basecalling (Dorado SUP, химия R10.4.1). Материал: мазок из носоглотки / назофарингеальный аспират / БАЛ.
- 📤 На выходе: HTML-отчёт для клинициста с идентифицированными патогенами, относительной представленностью и (для гриппа) профилем резистентности к противовирусным препаратам.
📊 Доступность продукта
| Платформа |
Статус доступности |
| OnSiteSeq Cockpit Edge |
🟡 В разработке |
| OnSiteSeq Cockpit Desktop |
🟡 В разработке |
| OnSiteSeq Cockpit Cloud |
🔴 Не доступно |
🦠 Определяемые патогены
Пайплайн верифицирует присутствие следующих вирусов по метагеномным данным:
| Патоген |
Клиническое значение |
| Грипп A (H1N1pdm09, H3N2) |
Ведущий сезонный патоген; антивирусная терапия — осельтамивир, балоксавир |
| Грипп B (Victoria / Yamagata) |
Второй по значимости; субтипирование важно для тактики терапии |
| RSV A / RSV B |
Ведущая причина бронхиолита у детей; показание к нирсевимабу |
| Риновирус A / B / C |
Наиболее частый возбудитель ОРВИ; специфической терапии нет |
| Коронавирус SARS-CoV-2 |
COVID-19; при выявлении — автоматическое расширение до полного GC-пайплайна |
| Сезонные коронавирусы (HCoV-OC43, HCoV-229E, HCoV-NL63, HCoV-HKU1) |
Дифференциальная диагностика COVID-19 |
| Аденовирус (серотипы B, C, E) |
Вспышки в коллективах; серьёзное течение у иммунокомпрометированных |
| Вирус парагриппа (PIV 1–4) |
Ларинготрахеит («ложный круп») у детей |
| Метапневмовирус (hMPV A/B) |
Клинически схож с RSV; важен в педиатрии и у пожилых |
| Бокавирус (HBoV) |
Сопутствующий патоген; частое ко-инфицирование |
🎯 Субтипирование гриппа и резистентность
Для выявленного гриппа A/B пайплайн дополнительно выполняет субтипирование и анализ генов резистентности:
Гены резистентности к противовирусным препаратам
| Ген |
Ключевые мутации |
Препарат |
| NA (нейраминидаза) |
H275Y (N1), E119V (N2), R292K |
Осельтамивир (Тамифлю), Занамивир |
| PA (полимераза) |
I38T / I38F / I38M |
Балоксавир (Ксофлюза) |
| M2 (ионный канал) |
S31N, V27A, A30T |
Амантадин / Ремантадин (резистентны >99% H3N2 и pH1N1) |
Профиль противовирусных препаратов в отчёте (грипп)
| Препарат |
Класс |
Значение |
| Осельтамивир |
Ингибитор нейраминидазы |
Первая линия при гриппе A/B |
| Занамивир |
Ингибитор нейраминидазы |
Альтернатива при устойчивости к осельтамивиру |
| Балоксавир |
Ингибитор PA-эндонуклеазы |
Однократный приём; мониторинг I38T важен |
| Амантадин |
Ингибитор M2-канала |
Резистентность носит массовый характер (только справочно) |
⚙️ Версии и ML-модели
Основной инструмент
| Компонент |
Статус |
| OnSiteSeq ОРВИ Pipeline |
🟡 В разработке |
Планируемые ML-модели
| Модель |
Целевая задача |
| RespiVirus-Classifier |
Метагеномная классификация вирусных патогенов (CNN на k-мерах) |
| Flu-Subtyper |
Субтипирование гриппа A (H1N1/H3N2) и B (Victoria/Yamagata) по WGS |
| Flu-Res-Detector |
Предсказание резистентности к осельтамивиру и балоксавиру |
Обучение на геномах из NCBI Influenza Database (>1 000 000 последовательностей), GISAID EpiFlu и открытых метагеномных датасетах ОРВИ.
🛠 Под капотом: Зависимости и Окружение (Pipeline Stack)
| Этап пайплайна |
Ключевые библиотеки и инструменты |
| 1. Контроль качества (QC) |
porechop_abi, NanoFilt, pigz |
| 2. Деплеция хозяйских ридов |
minimap2 (ref: GRCh38) → исключение человеческих ридов |
| 3. Метагеномная классификация |
Kraken2 + Bracken (RefSeq viral DB + кастомные геномы) |
| 4. Целевое выравнивание |
minimap2 на референсы выявленных патогенов |
| 5. Субтипирование гриппа |
IRMA (Iterative Refinement Meta-Assembler, CDC) |
| 6. Аннотация резистентности |
Кастомная база мутаций NA/PA/M2 + snpEff |
| 7. ML-инференс |
PyTorch, pandas, scikit-learn |
🌍 Глобальный контекст
- ВОЗ — глобальный надзор за гриппом (GISRS) включает >150 национальных центров; данные о циркулирующих штаммах определяют состав вакцины ежегодно.
- Россия — ЦНИИ Эпидемиологии Роспотребнадзора ведёт еженедельный мониторинг ОРВИ; в пик сезона до 30–40% визитов к врачу — ОРВИ.
- Проблема «слепой» антибиотикотерапии — при ОРВИ антибиотики назначаются в ~40–60% случаев в РФ, несмотря на вирусную этиологию. Точная идентификация возбудителя у кровати пациента позволяет избежать избыточного назначения антибиотиков.
- RSV-сезон — ежегодные вспышки перегружают педиатрические стационары; нирсевимаб (Beyfortus) требует точной RSV-диагностики для обоснования применения.
🔬 Связанные источники
© 2026 Роман Горбенко, МФТИ-стартап "OnSiteSeq - Секвенирование на месте (у кровати / у стола / в поле)"