Применение секвенирования следующего поколения для исследования двойной ВИЧ-инфекции
- Авторы: Лаповок И.А.1, Барышев П.Б.1, Салеева Д.В.1, Кириченко А.А.1, Шлыкова (Мурзакова) А.В.1, Киреев Д.Е.1
-
Учреждения:
- Центральный научно-исследовательский институт эпидемиологии Роспотребнадзора
- Выпуск: Том 98, № 6 (2021)
- Страницы: 627-638
- Раздел: ОРИГИНАЛЬНЫЕ ИССЛЕДОВАНИЯ
- Дата подачи: 09.01.2022
- Дата принятия к публикации: 09.01.2022
- Дата публикации: 09.01.2022
- URL: https://microbiol.crie.ru/jour/article/view/1141
- DOI: https://doi.org/10.36233/0372-9311-153
- ID: 1141
Цитировать
Аннотация
Введение. Целью исследования был сравнительный анализ эффективности выявления и подтверждения двойной ВИЧ-инфекции с применением классического популяционного секвенирования (ПС) и секвенирования следующего поколения (NGS) для фрагмента гена pol ВИЧ-1, кодирующего протеазу и часть обратной транскриптазы (позиции 2253–3368).
Материалы и методы. Исследованы модельные образцы межсубтиповой двойной ВИЧ-инфекции, содержащие вирусы ВИЧ-1 субтипа B, субсубтипа A6 и рекомбинантной формы CRF63_02A1. Вирусы смешивали попарно в соотношении от 10 до 90% для создания 3 групп модельных образцов: CRF63vsB, CRF63vsA6 и A6vsB. Нуклеотидные последовательности, полученные технологиями ПС и NGS, с порогами чувствительности к минорным вариантам вируса 5, 10, 15 и 20% (NGS5–NGS20 соответственно) использовали для определения величин индекса вырожденности (DB) и индекса синонимичности (SM). Фрагмент исследуемого региона (позиции 2725–2981) служил для анализа операционных таксономических единиц.
Результаты. Применение NGS5 оказалось наиболее эффективным для выявления двойной ВИЧ-инфекции в модельных образцах. Было обнаружено статистически достоверное (p < 0,01) увеличение DB- и SM-индексов для NGS5 по сравнению с ПС. Это позволило с помощью NGS5 выявить двойную ВИЧ-инфекцию в 25 модельных образцах из 27, в то время как ПС позволяло выявлять её лишь в 15 образцах. Анализ операционных таксономических единиц подтвердил двойную ВИЧ-инфекцию во всех группах модельных образцов.
Обсуждение. Эффективность выявления и подтверждения двойной ВИЧ-инфекции зависит как от доли каждого вируса в образце, так и от генетических особенностей данных вирусов. Заключение. Внедрение в рутинную практику генетического анализа технологии NGS позволит не только более эффективно выявлять генетические особенности инфекционных агентов, но и проводить более глубокий анализ эпидемиологической ситуации.
Полный текст
Введение
Двойная ВИЧ-инфекция, т.е. доказанный факт наличия в организме одного пациента 2 и более вариантов ВИЧ (ВИЧ-1 и/или ВИЧ-2) [1], встречается в мире с различной частотой в разных странах и среди разных уязвимых групп. При этом отмечается прямая зависимость между частотой встречаемости этого явления, уровнем бедности в государстве и степенью маргинализации уязвимых групп. Так, в Нидерландах частота двойной ВИЧ-инфекции в группе мужчин, практикующих секс с мужчинами (МСМ), составляет 1% [2], в Бразилии (также среди МСМ) — более 12% [3], а в Уганде среди коммерческих секс-работниц — более 16% [4]. В группе МСМ в Китае [5] этот показатель сильно различается — по разным источникам, от 13,3 до 28%, что, вероятно, связано с сильной стигматизацией этой уязвимой группы в стране. В России частота двойной ВИЧ-инфекции не превышает 1,5% [6], что характерно для развитых стран Западной Европы.
Поскольку двойная ВИЧ-инфекция связана с генерацией новых рекомбинантных форм вируса, прогрессией инфекции и даже селекцией лекарственной устойчивости [1], её выявление и подтверждение являются очень важной задачей.
Факт двойной ВИЧ-инфекции наиболее достоверно подтверждается с помощью метода секвенирования единичных геномов (SGS, single genome sequencing), который служит «золотым стандартом» в диагностике этого явления [7, 8]. Суть методики заключается в секвенировании геномов отдельных вирусных частиц после предельного разведения образца [7], амплификации отдельных фрагментов вирусного генома и их последующего клонирования для наработки клонов, содержащих фрагменты от каждого вирусного варианта, присутствующего в образце [2]. Затем каждый клон подвергается секвенированию, а полученные нуклеотидные последовательности (НП) — филогенетическому анализу. Двойная ВИЧ-инфекция подтверждается в случае достоверного (более чем 80% независимых построений) образования отдельных кластеров на дендрограмме, характерных для отдельных вирусных вариантов [2].
Объектом исследования чаще всего выступают короткие области генома: область V2–V3 петель гена env, фрагмент гена gag, кодирующий p17 и/или p24 [9], фрагмент гена обратной транскриптазы (RT) ВИЧ-1 [8–10]. Кроме того, возможно применение одновременного анализа сразу нескольких упомянутых выше фрагментов генома [8].
Сложность использования SGS для рутинного анализа связана с его трудоёмкостью и финансовыми затратами. Так, исследование 2010 г. [8] показало, что анализ одного образца по 2 областям генома методом SGS занимает примерно 42 ч и обходится более чем в 2600 долл. США. В сравнении с этим анализ гена pol (область протеазы и обратной транскриптазы, PR-RT), проводимый методом классического секвенирования в рамках рутинного тестирования на лекарственную устойчивость ВИЧ-1, занимает всего 3 ч пробоподготовки и стоит менее 280 долл. США.
На помощь исследователям двойной ВИЧ-инфекции приходит технология секвенирования следующего поколения (next generation sequencing — NGS), позволяющая выявлять минорные варианты вируса с представленностью в пробе менее 1% [11]. Такая чувствительность позволяет использовать технологию NGS как альтернативу SGS. Этот подход является не только более технологичным, но и более выгодным. Так, NGS для одновременного анализа сразу 3 областей генома занимает около 9,5 ч и стоит чуть более 1000 долл. США, что более чем в 4 раза быстрее и более чем 2,5 раза дешевле, чем SGS [8].
Полученные в ходе NGS данные о НП в образце, именуемые также «ридами», подвергаются последующему математическому анализу для формирования операционных таксономических единиц (operational taxonomic units, OTUs) — НП, образованных ридами с определённой степенью схожести [9]. Дальнейший филогенетический анализ OTUs проводится аналогично анализу единичных геномов, получаемых в результате SGS.
Несмотря на относительную технологическую доступность анализа по подтверждению двойной ВИЧ-инфекции, открытым остаётся вопрос первичного выявления таких образцов. Действительно, на факт двойной ВИЧ-инфекции наиболее часто указывают изменения клинической картины: резкое увеличение концентрации РНК ВИЧ (вирусной нагрузки) в крови пациента, падение числа CD4-клеток на фоне длительной непрогрессии или медленной прогрессии ВИЧ-инфекции [7][12][13]. Однако данные проявления справедливы лишь для суперинфекции ВИЧ, когда заражение новым вирусным вариантом происходит уже после формирования иммунного ответа на заражение первым вирусом [14]. В случае же коинфекции ВИЧ (инфицирования 2 и более вирусными вариантами одновременно или спустя короткий промежуток времени) [15] или при недостаточно регулярном обследовании пациента факт двойной ВИЧ-инфекции может не регистрироваться.
Впрочем, детектировать факт двойной ВИЧ-инфекции возможно при дополнительном исследовании результатов тестирования лекарственной устойчивости ВИЧ-1. Анализ лекарственной устойчивости, в основе которого лежит классическое секвенирование по Сэнгеру (называемое также популяционным секвенированием — ПС) [7][14], позволяет получать НП различных областей генома ВИЧ-1, в том числе наиболее часто исследуемой области PR-RT, кодирующей протеазу и обратную транскриптазу вируса. Было обнаружено, что наличие большого количества спорных или вырожденных нуклеотидных позиций (для которых получен сигнал об одновременном наличии в этом положении генома сразу нескольких нуклеотидов) в участке RT (позиции 2550–3554) указывает на одновременное присутствие в образце разных вариантов ВИЧ-1 [2]. Чем больше число вырожденных нуклеотидов (индекс вырожденности — DB-индекс) в последовательности, тем выше вероятность двойной ВИЧ-инфекции в образце.
Другим подходом является подсчёт отношения числа синонимичных замен к числу всех возможных сайтов синонимичных замен области PR-RT, позиции 2253–3554 (индекс синонимичности — SM-индекс) [8]. При этом несинонимичные мутации (приводящие к изменению аминокислотной последовательности) целенаправленно не учитываются. Этот метод основан на том, что в природе несинонимичные мутации зачастую являются следствием изменения вируса под влиянием факторов организма или применяемой терапии, в то время как синонимичные мутации выражают естественное разнообразие вирусной популяции при двойной ВИЧ-инфекции. Поэтому в случае двойной ВИЧ-инфекции обнаруженные мутации будут в основном синонимичными.
Вполне естественно, что эффективность анализа вырожденности и синонимичности наиболее высока для двойной ВИЧ-инфекции, вызванной разными субтипами ВИЧ (межсубтиповая), разными группами, например M и О (межгрупповая), или типами вируса (межтиповая, связанная с одновременной инфекцией ВИЧ-1 и ВИЧ-2), по сравнению с внутрисубтиповой, вызванной разными генетическими вариантами одного субтипа [1].
Сложность применения ПС для выявления двойной ВИЧ-инфекции связана с чувствительностью этой технологии: данное секвенирование способно выявлять варианты вируса с представленностью в вирусной популяции от 20% и выше [16]. Решением этой проблемы может служить вышеописанная технология NGS, которая уже доказала свою успешность при выявлении мутаций лекарственной устойчивости в регионе PR-RT по сравнению с ПС [17]. При этом важно корректно устанавливать порог чувствительности NGS к минорным вирусным вариантам. Так, в рутинной практике анализа лекарственной устойчивости наиболее надёжным и информативным является порог чувствительности 5% [17][18].
Поскольку ранее успешно был апробирован подход по анализу OTUs для небольшого фрагмента RT (положения 2708–3242) [8], применение технологии NGS для секвенирования региона PR-RT может позволить как детектировать двойную ВИЧ-инфекцию (через подсчёт DB- и SM-индексов), так и подтверждать её.
Целью настоящего исследования был сравнительный анализ эффективности выявления двойной ВИЧ-инфекции с применением ПС и NGS с различными порогами чувствительности к минорным вирусным вариантам для региона PR-RT, а также оценка эффективности применения полученных результатов NGS для подтверждения двойной ВИЧ-инфекции методом анализа OTUs.
Материалы и методы
Была смоделирована межсубтиповая двойная ВИЧ-инфекция путём попарного смешивания образцов плазмы крови, содержащей ВИЧ-1 3 вариантов: субтипа B, субсубтипа A6 и рекомбинантной формы CRF63_02A1. Концентрацию РНК ВИЧ-1 каждого образца для правильного смешивания определяли с помощью тест-системы «АмплиСенс ВИЧ-монитор-FRT» (ЦНИИ Эпидемиологии). Всего было подготовлено 9 вариантов попарных смесей вирусов с представленностью каждого вируса в смеси от 10 до 90%. Кроме этого, исследованию подвергались контрольные образцы, содержащие только ВИЧ-1 субтипа B, субсубтипа A6 и CRF63_02A1. Уровень вирусной нагрузки в каждом модельном образце составлял 5000 копий/мл.
Классическое ПС проводили с помощью набора «АмплиСенс HIV-Resist-Seq» (ЦНИИ Эпидемиологии) в соответствии с инструкцией производителя. Секвенирование очищенных фрагментов осуществляли с помощью генетического анализатора «Applied Biosystems 3500» («LifeTechnologies») в соответствии с инструкциями производителя. Данные секвенирования обрабатывали с помощью программного обеспечения «ДЕОНА» (версия 1.7.0). Как итог, были получены НП фрагмента PRRT ВИЧ-1 (нуклеотидные позиции 2253–3368 относительно HXB-2, номер GenBank K03455).
При подготовке проб к NGS использовали двухэтапный протокол «вложенной» (nested) ПЦР для получения 4 перекрывающихся специфических фрагментов ДНК ВИЧ-1 длиной 427–586 нуклеотидов. На первом этапе (раунде) амплификацию сочетали с обратной транскрипцией с применением полимеразы TaqF и обратной транскриптазы MMLv (ЦНИИ Эпидемиологии). Амплифицированные фрагменты генома ВИЧ-1 очищали с помощью магнитных частиц Sera-Mag Magnetic Speed Beads («GE Healthcare Biosciences»). Концентрации нуклеиновых кислот во фрагментах измеряли с помощью флуориметра «Qubit 2.0» («Invitrogen»). Очищенные препараты амплифицированных фрагментов ВИЧ-1 смешивали в равных пропорциях, и 50 нг конечной смеси использовали для получения библиотек для секвенирования на платформе «Illumina». Библиотеки готовили по протоколу Nextera («Illumina») со следующей модификацией: амплификацию проводили с использованием ДНК-полимеразы Q5 HighFidelity («NEB») в присутствии интеркалирующего красителя EvaGreen («Biotium»). Секвенирование выполняли с помощью «MiSeq» («Illumina»), используя MiSeq Reagent Kit V3 («Illumina»).
Результаты секвенирования и сборки генома (положения 2253–3368) обрабатывали с помощью программы «HyDRA Web v1.6.1»1. Автоматически были собраны консенсусные НП с порогом чувствительности к минорным популяциям 20, 15, 10 и 5% (NGS20, NGS15, NGS10 и NGS5 соответственно).
Для полученных НП были подсчитаны DB- и SM-индексы в соответствии с методикой, описанной в литературе [2][8].
DB-индекс рассчитывали как общее число вырожденных нуклеотидных оснований в области RT (нуклеотидные позиции 2550–3368). В качестве порога величины DB-индекса, свидетельствующего о факте двойной ВИЧ-инфекции, проверялись два значения: 34 и 45 [2].
SM-индекс рассчитывали по формуле:
SM = X/372,
где SM — индекс синонимичности, X — общее число синонимичных замен в исследуемом фрагменте генома, 372 — общее число аминокислот, кодированных фрагментом PR-RT гена pol (нуклеотидные позиции 2253–3368). Возможными порогами SM-индекса были выбраны значения 0,05 и 0,08 [8].
Статистический анализ различий величин DBи SM-индексов, полученных с помощью разных технологий и для различных модельных образцов, проводили через расчёт t-критерия Стьюдента. Для анализа качественных показателей (эффективности выявления двойной ВИЧ-инфекции) использовали точный двусторонний критерий Фишера [19]. Различия считали достоверными при p < 0,01.
Формирование OTUs для результатов NGS проводили для 1 из 4 фрагментов, кодирующих часть обратной транскриптазы (нуклеотидные позиции 2725–2981) в соответствии с рекомендациями2. Филогенетический анализ по методу максимального правдоподобия (Maximum Likelihood), а также поиск оптимальной модели нуклеотидных замен для полученных OTUs проводили в программе «Mega 6.0». В качестве референтных были использованы следующие НП из международной базы данных GenBank: K03455 и AY819715 (субтип B), AY500393 и EU861977 (субсубтип A6), AY829204 и JN230353 (CRF63_02A1). Также вместе с OTUs модельных образцов были проанализированы варианты OTUs, полученные для контрольных образцов, используемых для создания данных моделей двойной ВИЧ-инфекции.
Результаты
Анализ DB- и SM-индексов в моделях двойной ВИЧ-инфекции
Нами отмечена зависимость величины DB- и SM-индексов не только от того, какие вирусные варианты присутствовали в смеси, но и от их соотношения (рис. 1, 2). Величины обоих индексов для модельных образцов BvsA6, содержащих в качестве минорного варианта субсубтип A6, были выше, чем у образцов, содержащих минорные количества вируса субтипа B. Аналогичный эффект был отмечен для моделей CRF63vsB и CRF63vsA6, в которых в минорных количествах присутствовал рекомбинантный вирус. Это говорит о «доминировании» вируса субсубтипа A6 в моделях BvsA6 и CRF63 — в моделях CRF63vsB и CRF63vsA6, что снижало степень вырожденности в полученных НП.
Рис. 1. Значения DB-индекса, полученные при использовании технологий ПС и NGS20-NGS5 для модельных образцов двойной ВИЧ-инфекции CRF63vsB, CRF63vsA6 и BvsA6.
Горизонтальными штрихованными линиями обозначены заданные пороговые значения индекса.
Fig. 1. DB counts obtained by using PS and NGS20-NGS5 technologies for CRF63vsB, CRF63vsA6, and BvsA6 model samples of dual HIV infection.
Horizontal hatched lines indicate the specified threshold values for the count.
Рис. 2. Значения SM-индекса, полученные при использовании технологий ПС и NGS20-NGS5 для модельных образцов двойной ВИЧ-инфекции CRF63vsB, CRF63vsA6 и BvsA6.
Горизонтальными штрихованными линиями обозначены заданные пороговые значения индекса.
Fig. 2. SM counts obtained by using PS and NGS20-NGS5 technologies for CRF63vsB, CRF63vsA6, and BvsA6 model samples of dual HIV infection.
Horizontal hatched lines indicate the specified threshold values for the count.
Как ожидалось, величины DB- и SM-индексов в НП исследованных моделей, полученные с помощью NGS, в основном оказались выше, чем в НП, полученных методом ПС. Так, средняя величина DB-индекса для всех модельных образцов, полученных с помощью ПС, составила 25,59 (95% ДИ 15,60–35,54), в то время как для NGS20, NGS15, NGS10, NGS5 — 27,48 (95% ДИ 18,27–36,69), 37,44 (95% ДИ 27,56–47,33), 49,19 (95% ДИ 38,17– 60,20) и 68,19 (95% ДИ 55,81–80,56) соответственно. Тем не менее статистически достоверные различия (p < 0,01) в уровне DB-индекса были обнаружены лишь при сравнении ПС или NGS20 с NGS10 и NGS5, а также между NGS15 и NGS5.
Также было отмечено значительное возрастание среднего значения SM-индекса с увеличением чувствительности технологии секвенирования: для ПС оно составило 0,069 (95% ДИ 0,046–0,092), а для NGS20, NGS15, NGS10, NGS5 — 0,067 (95% ДИ 0,048–0,086), 0,088 (95% ДИ 0,066–0,109), 0,115 (95% ДИ 0,092–0,138) и 0,146 (95% ДИ 0,126– 0,166) соответственно. Как и в случае DB-индекса, статистически достоверными были различия между ПС или NGS20 и NGS10–NGS5. Однако уже между результатами NGS15 и NGS10 имелись достоверные различия, что говорит о большей эффективности технологии NGS при анализе SM-индекса.
При этом такое значительное увеличение степени вырожденности от ПС к NGS5 касалось смесей вирусов, но не контрольных образцов, содержащих только A6, B или CRF06_02A1. Средний DB-индекс, полученный для контрольных образцов методом ПС, составил 2,50 (95% ДИ 1,68–3,32), а для NGS20, NGS15, NGS10 и NGS5 — 1,17 (95% ДИ 0,44–1,89), 2,00 (95% ДИ 1,03–2,97), 3,83 (95% ДИ 2,97–4,75) и 11,33 (95% ДИ 7,92–14,74) соответственно. Средний SM-индекс для ПС и всех вариантов NGS составил 0,008 (95% ДИ 0,006–0,010), 0,004 (95% ДИ 0,003– 0,005), 0,006 (95% ДИ 0,004–0,008), 0,011 (95% ДИ 0,008–0,014) и 0,022 (95% ДИ 0,016–0,027) соответственно. Данные различия между технологиями секвенирования были статистически незначимы (p > 0,01). Ни в одном случае DB- или SM-индекс, полученный для контрольных образцов любой технологией, не преодолевал минимальное пороговое значение, описанное в литературе [2][8] для данного анализа, — 34 для DB-индекса и 0,05 для SM-индекса.
В то же время рост вычисляемых индексов с увеличением чувствительности технологии секвенирования позволил выявить больше вариантов моделей двойной ВИЧ-инфекции. Так, пороговое значение DB-индекса 34 смогли преодолеть в общей сложности только 10 из всех 27 вариантов моделей, анализируемых ПС, в то время как при использовании NGS20–NGS5 это число составило 11, 15, 18 и 22 соответственно. При использовании порогового значения 0,05 для SM-индекса двойная ВИЧ-инфекция была выявлена в 15, 14, 20, 23 и 25 вариантах для ПС и NGS20–NGS5 соответственно. Самые низкие значения вычисляемых индексов (а значит — и вероятность выявления двойной ВИЧ-инфекции) были получены для смесей BvsA6. При использовании DB-индекса статистически достоверными были различия лишь между ПС и NGS5, а при использовании SM-индекса — между ПС или NGS20 и NGS10 NGS5, что вновь свидетельствует о большей эффективности применения SM-индекса для выявления двойной ВИЧ-инфекции.
Несмотря на более высокую чувствительность технологии NGS по сравнению с ПС, при анализе среднего значения SM-индекса отдельно для каждого типа моделей отмечалось незначительное снижение этого показателя в смесях CRF63vsB у NGS20 и NGS15 по сравнению с ПС (0,055 и 0,068 против 0,071 соответственно) (рис. 3).
Рис. 3. Средний уровень DB- и SM-индексов, полученный при использовании технологий ПС и NGS20-NGS5 для модельных образцов двойной ВИЧ-инфекции CRF63vsB, CRF63vsA6 и BvsA6.
Горизонтальными штрихованными линиями обозначены заданные пороговые значения для DB- и SM-индексов.
Fig. 3. The average DB and SM counts estimated with PS and NGS20–NGS5 methods for CRF63vsB, CRF63vsA6, and BvsA6 model samples of dual HIV infection.
Horizontal hatched lines indicate the specified threshold values for DB and SM counts.
Также NGS20 незначительно занизило средний DB-индекс для моделей BvsA6 по сравнению с ПС — 21,56 против 21,67.
Анализ OTUs
В среднем для каждого из 9 вариантов модельных образцов групп BvsA6, CRF63vsB и CRF63vsA6 было получено 8, 9 и 11 вариантов OTUs соответственно. В качестве оптимального порога схожести ридов был выбран порог 90%. При использовании пороговых значений выше 90% отмечалась генерация большого количества OTUs с неясными результатами последующего филогенетического анализа. При снижении порогового значения число вариантов OTUs сильно сокращалось, снижая достоверность последующего анализа.
Выявлена корреляция результатов кластеризации исследуемых OTUs с результатами анализа DBи SM-индексов. Кроме того, распределение вариантов OTUs было очень неравномерным для разных вирусных вариантов: в исследуемых моделях BvsA6 77,78% OTUs относились к A6 и лишь 22,22% — к субтипу B. В моделях CRF63vsB 69,27% OTUs относились к рекомбинанту, 11,11% — к субтипу B, а 19,63% вариантов OTUs дали спорный результат, образовывая с низкой достоверностью кластеры с различными референтными НП (в основном с A6). В моделях CRF63vsA6 к рекомбинанту, субсубтипу A6 относились 57,10 и 41,15% OTUs соответственно. При этом 1,75% OTUs дали спорный результат.
Результаты анализа OTUs, полученных для моделей двойной ВИЧ-инфекции с долей каждого вируса 30 и 70%, представлены на рис. 4. Мы не обнаружили строгой корреляции между результатами генотипирования вариантов OTUs и долей вируса в образце. Так, для CRF63vsA6(70vs30) 7 вариантов OTUs были близки к CRF63, а 4 — к A6. В то же время OTUs для CRF63vsA6(30vs70) распределились между CRF63 и A6 примерно поровну.
Рис. 4. Результаты филогенетического анализа фрагмента области RT (положения 2725-2981) модельных образцов двойной ВИЧ-инфекции и контрольных образцов, выполненный по методу максимального правдоподобия (Maximum Likelihood) с использованием GTR+G модели нуклеотидных замен в 1000 независимых построениях (bootstrap level).
Достоверность кластеров ≥ 50% (в %) указана рядом с ними. Серыми ромбами выделены варианты OTUs, полученные для данного модельного образца. Последовательности OTUs, полученные для контрольного образца субсубтипа A6, обозначены чёрными кружками, для образца субтипа B — чёрными треугольниками, для CRF63_02A1 — чёрными квадратами.
Fig. 4. Results of the phylogenetic analysis of the fragment from the RT region (positions 2725–2981) of dual HIV infection model samples and control samples; the analysis was based on the maximum likelihood method and used the GTR+G model of nucleotide substitutions in 1,000 bootstrap replicates.
The statistical significance of clusters ≥ 50% is shown next to them. Grey diamonds indicate OTU variants obtained for the model sample. The OTU sequences obtained for the control sample of sub-subtype A6 are shown by black circles; the subtype B sample is shown by black triangles; black squares represent CRF63_02A1.
Схожие результаты показал и анализ CRF63vsB. Распределение OTUs между CRF63 и B для CRF63vsB(30vs70) составило 9 к 4, а для CRF63vsB(70vs30) — 9 к 2. Однако анализ модельных образцов BvsA6 продемонстрировал противоположный результат: в образце BvsA6(30vs70) к субсубтипу A6 относились 6 OTUs, а к субтипу B — 3, в то время как в образце BvsA6(70vs30) к A6 и B были отнесены 7 и 2 OTUs соответственно.
Тем не менее результаты генотипирования OTUs, полученных для моделей двойной ВИЧ-инфекции, отличались от таковых для контрольных образцов A6, B и CRF63_02A1, для которых все полученные варианты OTUs достоверно относились к соответствующему генетическому варианту.
Обсуждение
Нами впервые в России была валидирована методика анализа НП ВИЧ-1, полученных методом классического секвенирования и NGS для анализа такого редкого, но крайне важного явления, как двойная ВИЧ-инфекция.
В своём исследовании мы изучили модельные образцы двойной ВИЧ-инфекции, обусловленной одновременным присутствием в клинических образцах наиболее важных для России с эпидемиологической точки зрения вирусных вариантов. ВИЧ-1 субсубтипа A6 доминирует в России, в то время как рекомбинантный вариант CRF63_02A1 активно распространяется в стране в последние годы [20–22]. Также нами исследован вирус субтипа B как референтный, наиболее распространённый в странах Западной Европы и используемый для валидации методик оценки двойной ВИЧ-инфекции [2][8][20].
Применение анализа НП для выявления двойной ВИЧ-инфекции не только менее трудоёмко и экономически выгодно по сравнению с технологией SGS, но и позволяет проводить скрининг двойной ВИЧ-инфекции аналогично анализу лекарственной устойчивости. В нашем исследовании применение расчёта DB- и SM-индексов в последовательностях PR-RT, полученных методом ПС, позволяло выявлять двойную ВИЧ-инфекцию только в 37 и 55,56% случаев соответственно.
Наши результаты были хуже полученных зарубежными авторами. Так, расчёт DB-индекса потенциально позволяет выявить 43,2% образцов двойной ВИЧ-инфекции [2], а расчёт SM-индекса — 100% образцов [8]. Однако в исследовании зарубежных коллег анализу подвергались более длинные фрагменты PR-RT, чем в нашем исследовании: 335 [2] и 434 [8] аминокислоты при расчёте DB- и SM-индексов против 273 и 372 аминокислот в нашем исследовании соответственно. Более короткие фрагменты содержат меньшее число потенциально вырожденных позиций. К тому же в исследовании М. Pacold и соавт. [8] при расчёте SM-индекса ошибочно были причислены к образцам двойной ВИЧ-инфекции несколько образцов с моноинфекцией, в то время как ни в одном анализе, проведённом нами, подобное не наблюдалось.
Наши результаты демонстрируют, что применение технологии NGS с порогом чувствительности к минорным вариантам 5–10% позволяет выявлять двойную ВИЧ-инфекцию более эффективно, чем классическое секвенирование. Наиболее эффективным для выявления межсубтиповой двойной ВИЧ-инфекции в исследованной области гена pol (положения 2253–3368) является применение технологии NGS с 5% порогом чувствительности к минорным вариантам и с оценкой SM-индекса с пороговым значением для двойной инфекции 0,05. Данные параметры анализа позволяют выявить максимальное количество случаев двойной ВИЧ-инфекции (в 25 из 27 модельных образцов).
Несмотря на то что чувствительность классического секвенирования к минорным вирусным вариантам в образце обычно оценивают в 20% [16], NGS с таким же порогом чувствительности хуже выявляло вырожденность в некоторых моделях двойной ВИЧ-инфекции. С одной стороны, такое свойство NGS20 минимизирует число ошибок и артефактов, получаемых в результате секвенирования, что оптимально для получения полногеномных последовательностей вируса [11][17]. С другой стороны, при использовании NGS20 возникает опасность упустить вырожденность, связанную с двойной ВИЧ-инфекцией в образце.
Для большинства модельных образцов применение метода анализа OTUs участка генома с позициями 2725–2981 оказалось эффективным, что подтверждается формированием на дендрограммах достоверных кластеров (>80%) с соответствующими контрольными и референтными последовательностями. Наши результаты схожи с данными, полученными при исследовании двойной ВИЧ-инфекции среди МСМ в Испании [9]. Однако было отмечено смещение соотношения доли OTUs, не соответствующее доле вирусов в модельных образцах. В частности, в смесях 63vsB и BvsA6 большинство полученных OTUs генотипировались как CRF63_02A1 и A6 соответственно. Основным объяснением этого может быть тот факт, что степень дивергенции вирусов субсубтипа А6 и CRF63_02A1 значительно больше, чем у субтипа В. При использовании порогового значения 90% риды субтипа В удаляются автоматически. Этот несомненный недостаток данной методики должен быть учтён при изучении двойной инфекции, вызванной разными вариантами ВИЧ. Кроме того, такое смещение результатов OTUs может говорить о том, что применяемые в работе системы для амплификации и/или секвенирования амплифицируют и секвенируют различные вирусы с разной эффективностью. В результате, сигнал от более эффективно выявляемого вируса подавляет сигнал от другого варианта. Подобная неравномерная чувствительность к разным вирусным вариантам была отмечена ранее при сравнении ПЦР-наборов для оценки вирусной нагрузки ВИЧ-1 [23].
Тем не менее, несмотря на все недостатки метода анализа OTUs, он позволяет достоверно дифференцировать двойную ВИЧ-инфекцию от моноинфекции в большинстве модельных образцов и может быть использован в дальнейших исследованиях множественного инфицирования ВИЧ.
Стоит отметить тот факт, что активное применение классического секвенирования и NGS делает эти технологии более доступными, снижая время проведения и цену анализа по сравнению с методикой SGS. Так, цена проведённого нами анализа одного образца с применением классического секвенирования составила около 10 000 руб., что практически в 2 раза дешевле такого же исследования, проведённого в 2010 г. [8]. Благодаря своей гигантской производительности, NGS оказывается ещё более дешёвой технологией: цена анализа исследуемого геномного фрагмента каждого образца в нашем исследовании составляла около 5000 руб., что ниже стоимости аналогичного анализа NGS в 2010 г. почти в 5 раз [8].
Заключение
Наши результаты говорят о пользе технологии NGS для исследования феномена двойной ВИЧ-инфекции, демонстрируя высокую чувствительность анализа. Таким образом, внедрение в рутинную практику этой технологии позволит не только более эффективно выявлять генетические особенности инфекционных агентов, но и получать больше данных для более глубокого анализа эпидемиологической ситуации.
1. URL: https://hydra.canada.ca/pages/home?lang=en-CA
2. URL: https://www.drive5.com/usearch/manual/otus.html
Об авторах
И. А. Лаповок
Центральный научно-исследовательский институт эпидемиологии Роспотребнадзора
Автор, ответственный за переписку.
Email: i_lapovok@mail.ru
ORCID iD: 0000-0002-6328-1415
Лаповок Илья Андреевич - к.б.н., с.н.с. Научной группы разработки новых методов диагностики ВИЧ-инфекции и вирусных гепатитов
Москва
РоссияП. Б. Барышев
Центральный научно-исследовательский институт эпидемиологии Роспотребнадзора
Email: fake@neicon.ru
ORCID iD: 0000-0003-3666-2201
Барышев Павел Борисович - к.б.н., биоинформатик Научной группы разработки новых методов диагностики ВИЧ-инфекции и вирусных гепатитов
Москва
РоссияД. В. Салеева
Центральный научно-исследовательский институт эпидемиологии Роспотребнадзора
Email: fake@neicon.ru
ORCID iD: 0000-0002-5870-5594
Салеева Дарья Владиславовна - м.н.с., Научной группы разработки новых методов диагностики ВИЧ-инфекции и вирусных гепатитов
Москва
РоссияА. А. Кириченко
Центральный научно-исследовательский институт эпидемиологии Роспотребнадзора
Email: fake@neicon.ru
ORCID iD: 0000-0002-7116-0138
Кириченко Алина Алексеевна - н.с. Научной группы разработки новых методов диагностики ВИЧ-инфекции и вирусных гепатитов
Москва
РоссияА. В. Шлыкова (Мурзакова)
Центральный научно-исследовательский институт эпидемиологии Роспотребнадзора
Email: fake@neicon.ru
ORCID iD: 0000-0002-1390-8021
Шлыкова (Мурзакова) Анастасия Вениаминовна - н.с. Научной группы разработки новых методов диагностики ВИЧ-инфекции и вирусных гепатитов
Москва
РоссияД. Е. Киреев
Центральный научно-исследовательский институт эпидемиологии Роспотребнадзора
Email: fake@neicon.ru
ORCID iD: 0000-0002-7896-2379
Киреев Дмитрий Евгеньевич - к.б.н., н.с. Научной группы разработки новых методов диагностики ВИЧ-инфекции и вирусных гепатитов
Москва
РоссияСписок литературы
- Лаповок И.А., Лопатухин А.Э., Киреев Д.Е. Двойная ВИЧ-инфекция: эпидемиология, клиническая значимость и диагностика. Инфекционные болезни. 2019; 17(2): 87–93. https://doi.org/10.20953/1729-9225-2019-2-87-93
- Cornelissen M., Jurriaans S., Kozaczynska K., Prins J.M., Hamidjaja R.A., Zorgdrager F., et al. Routine HIV-1 genotyping as a tool to identify dual infections. AIDS. 2007; 21(7): 807–11. https://doi.org/10.1097/QAD.0b013e3280f3c08a
- Soares de Oliveira A.C., Pessoa de Farias R., da Costa A.C., Melillo Sauer M., Bassichetto K.C., Santos Oliveira S.M., et al. Frequency of subtype B and F1 dual infection in HIV-1 positive, Brazilian men who have sex with men. Virol. J. 2012; 9: 223. https://doi.org/10.1186/1743-422X-9-223
- Redd A.D., Ssemwanga D., Vandepitte J., Wendel S.K., Ndembi N., Bukenya J., et al. The rates of HIV-1 superinfection and primary HIV-1 infection are similar in female sex workers in Uganda. AIDS. 2014; 28(14): 2147–52. https://doi.org/10.1097/QAD.0000000000000365
- Luan H., Han X., Yu X., An M., Zhang H., Zhao B., et al. Dual infection contributes to rapid disease progression in men who have sex with men in China. J. Acquir. Immune Defic. Syndr. 2017; 75(4): 480–7. https://doi.org/10.1097/qai.0000000000001420
- Лаповок И.А., Салеева Д.В., Кириченко А.А., Мурзакова А.В., Лопатухин А.Э., Киреев Д.Е. Исследование частоты встречаемости двойной ВИЧ-инфекции в России. Инфекционные болезни. 2020; 18(4): 138–48. https://doi.org/10.20953/1729-9225-2020-4-138-148
- Gao Y., Tian W., Han X., Gao F. Immunological and virological characteristics of human immunodeficiency virus type 1 superinfection: implications in vaccine design. Front. Med. 2017; 11(4): 480–9. https://doi.org/10.1007/s11684-017-0594-8
- Pacold M., Smith D., Little S., Cheng P.M., Jordan P., Ignacio C., et al. Comparison of methods to detect HIV dual infection. AIDS Res. Hum. Retroviruses. 2010; 26(12): 1291–8. https://doi.org/10.1089/aid.2010.0042
- Casado C., Pernas M., Rava M., Ayerdi O., Vera M., Alenda R., et al. High-risk sexual practices contribute to HIV-1 double infection among men who have sex with men in Madrid. AIDS Res. Hum. Retroviruses. 2020; 36(11): 896–904. https://doi.org/10.1089/AID.2020.0068
- Popescu B., Banica L., Nicolae I., Radu E., Niculescu I., Abagiu A., et al. NGS combined with phylogenetic analysis to detect HIV-1 dual infection in Romanian people who inject drugs. Microbes Infect. 2018; 20(5): 308–11. https://doi.org/10.1016/j.micinf.2018.03.004
- Kireev D.E., Lopatukhin A.E., Murzakova A.V., Pimkina E.V., Speranskaya A.S., Neverov A.D., et al. Evaluating the accuracy and sensitivity of detecting minority HIV-1 populations by Illumina next-generation sequencing. J. Virol. Methods. 2018; 261: 40–5. https://doi.org/10.1016/j.jviromet.2018.08.001
- Yerly S., Jost S., Monnat M., Telenti A., Cavassini M., Chave J.P., et al. HIV-1 co/super-infection in intravenous drug users. AIDS. 2004; 18(10): 1413–21. https://doi.org/10.1097/01.aids.0000131330.28762.0c
- Ring K., Muir D., Mackie N., Bailey A.C. HIV-1 superinfection in a patient with known HIV-2 – A case report. Int. J. STD AIDS. 2020; 31(3): 271–3. https://doi.org/10.1177/0956462420901969
- Wagner G.A.., Pacold M.E., Kosakovsky Pond S.L., Caballero G., Chaillon A., Rudolph A.E., et al. Incidence and prevalence of intrasubtype HIV-1 dual infection in at-risk men in the United States. J. Infect. Dis. 2014; 209(7): 1032–8. https://doi.org/10.1093/infdis/jit633
- Van der Kuyl A.C., Cornelissen M. Identifying HIV-1 dual infections. Retrovirology. 2007; 4: 67. https://doi.org/10.1186/1742-4690-4-67
- Inzaule S.C., Hamers R.L., Noguera-Julian M., Casadellà M., Parera M., Kityo C., et al. Clinically relevant thresholds for ultrasensitive HIV drug resistance testing: a multi-country nested case-control study. Lancet HIV. 2018; 5(11): e638–46. https://doi.org/10.1016/S2352-3018(18)30177-2
- Кириченко А.А., Свиридова А.А., Лопатухин А.Э., Мурзакова А.В., Лаповок И.А., Гоптарь И.А. и др. Корреляция результатов высокопроизводительного и классического методов секвенирования при анализе лекарственной устойчивости вируса иммунодефицита человека у пациентов на фоне неэффективной антиретровирусной терапии. Инфекционные болезни. 2019; 17(2): 12–9. https://doi.org/10.20953/1729-9225-2019-2-12-19
- Trabaud M.A., Icard V., Ramière C., Tardy J.C., Scholtes C., André P. Comparison of HIV-1 drug-resistance genotyping by ultra-deep sequencing and sanger sequencing using clinical samples. J. Med. Virol. 2017; 89(11): 1912–9. https://doi.org/10.1002/jmv.24872
- Герасимов А.Н. Медицинская статистика: учебное пособие. М.: МИА; 2007.
- Foley B.T., Leitner T., Paraskevis D., Peeters M. Primate immunodeficiency virus classification and nomenclature: Review. Infect. Genet. Evol. 2016; 46: 150–8. https://doi.org/10.1016/j.meegid.2016.10.018
- Лаповок И.А., Лопатухин А.Э., Киреев Д.Е., Казеннова Е.В., Лебедев А.В., Бобкова М.Р. и соавт. Молекулярно-эпидемиологический анализ вариантов ВИЧ-1, циркулировавших в России в 1987–2015 гг. Терапевтический архив. 2017; 89(11): 44–9. https://doi.org/10.17116/terarkh2017891144-49
- Baryshev P., Bogachev V., Gashnikova N. HIV-1 genetic diversity in Russia: CRF63_02A1, a new HIV type 1 genetic variant spreading in Siberia. AIDS Res. Hum. Retroviruses. 2014; 30(6): 592–7. https://doi.org/10.1089/AID.2013.0196
- Holmes H., Davis C., Heath A. Development of the 1st International Reference Panel for HIV-1 RNA genotypes for use in nucleic acid-based techniques. J. Virol. Methods. 2008; 154(1-2): 86–91. https://doi.org/10.1016/j.jviromet.2008.08.014