Arp GENE NUCLEOTID SEQUENCES VARIABILITY IN RUSSIAN TREPONEMA PALLIDUM ISOLATES
- Authors: Obraztsova O.A.1, Aleinikova K.A.1, Kubanov A.A.1, Deryabin D.G.1
-
Affiliations:
- State Research Center of Dermatovenerology and Cosmetology
- Issue: Vol 95, No 3 (2018)
- Pages: 45-52
- Section: ORIGINAL RESEARCHES
- Submitted: 24.08.2019
- Accepted: 24.08.2019
- Published: 25.07.2018
- URL: https://microbiol.crie.ru/jour/article/view/413
- DOI: https://doi.org/10.36233/0372-9311-2018-3-45-52
- ID: 413
Cite item
Full Text
Abstract
Aim. Analysis of the arp gene internal fragment nucleotide sequences variability in modern russian T. pallidum subsp. pallidum strains. Materials and methods. 57 T. pallidum isolates obtained from specialized dermatovenerologic clinics of the Central (Kaluga), the North Caucasus (Stavropol) and the Siberian (Tyva) regions in 2016 — 2017 were used in the study. The sequensing of the arp gene was performed using capillary electrophoresis technology. Results. A two-round amplification of the arp gene have been proposed, which ensures a correct reading of its internal region. Four variants of 60-nucleotide repeats in the internal arp fragment are described, which differing in 6, 8 and 15 — 17 codons compositions. Various combinations of these repeats, corresponding to the reference Nichols strain, globally distributed Street 14 genogroup, and the firstly described Stavropol regional variant are shown. Conclusion. The prospect of arp gene sequencing as a way to increase T. pallidum molecular typing efficiency is postulated.
Full Text
ВВЕДЕНИЕМолекулярная эпидемиология, возникшая как результат интеграции
молекулярно-генетических методов в традиционные эпидемиологические
исследования, с конца XX века стала одним из основных инструментов кон-
троля над распространением и изменчивостью возбудителей инфекционных
заболеваний [4]. В наибольшей степени этот подход оказался востребованным
при анализе эпидемиологии некультивируемых патогенов, ярким примером
которых является возбудитель сифилиса — Treponema pallidum subsp. pallidum
[1].
Отправной точкой для разработки метода генотипирования бледной тре-
понемы стала расшифровка ее полного генома [6] и последующее сравнение
с геномами других представителей вида T. pallidum [3, 12], позволившее иден-
тифицировать на бактериальной хромосоме наиболее вариабельные локусы.
На основании двух из них — генов arp и tprII — в 1998 году был предложен
первый метод молекулярного типирования T. pallidum subsp. pallidum [13], в
дальнейшем поддержанный CDC (США) и получивший широкое распростра-
нение при анализе эпидемиологии сифилиса во всем мире как CDC-метод [2,
10].
Использование для этих целей гена arp (acidic repeat protein) определялось
особенностями его структуры: наличием консервативных терминальных
участков (в том числе мембрана-связывающего домена и сайта для сигнальной
пептидазы I), а также находящегося между ними вариабельного фрагмента из
60-нуклеотидных тандемных повторов, занимающего 51% от общей длины
гена [9]. При этом предложенный подход к выявлению подобного полимор-
физма основан на амплификации соответствующего участка гена arp и по-
следующего определения количества 60-нуклеотидных повторов на основе
характеристик электрофоретической подвижности ампликона в агарозном
геле [13]. В зависимости от числа подобных повторов (от 2 до 22) идентифи-
цируемому изоляту присваивается соответствующий цифровой индекс, в
дальнейшем дополняемый буквенным обозначением, соответствующим
определенному профилю полиморфизма длин фрагментов рестрикции про-
дуктов амплификации генов tprII (16 вариантов).
Многолетний опыт использования CDC-метода заставил констатировать
ряд ограничений его дискриминирующей способности, в том числе связанных
с выраженным доминированием вариантов T. pallidum subsp. pallidum с четыр-
надцатью повторами в гене arp [2, 10]. В этой связи, для повышения разре-
шающей способности метода было предложено дополнительное секвениро-
вание генов tp0136, tp0319, tp0548 и 23S рРНК [5], а также вариабельного
участка гена tp0548 (позиции 131 — 215) [11]. При этом последний подход,
позволивший разделить подтип 14а на 2, а 14d на 4 отдельные подгруппы, по-
лучил наибольшее распространение и в настоящее время интегрирован в си-
стему молекулярного типирования при сифилисе.
Вместе с тем, анализ гена arp (слияние tp0433 — 0434) свидетельствует о
неполном раскрытии его дифференцирующего потенциала. Основанием для
этого утверждения являются данные о неидентичном характере нуклеотидных
последовательностей тандемных повторов, на основании которых могут быть
выделены их I, II, III и II/III подтипы [9]. Другой особенностью может являть-
ся различный порядок расположения этих подтипов в составе внутреннего
фрагмента гена arp [7]. Соответственно секвенирование гена arp вместо ру-
тинной детекции ПЦР-продуктов его амплификации представляется перспек-
тивным направлением совершенствования CDC-метода, приводящим моле-
кулярное типирование T. pallidum subsp. pallidum к стандартам мультилокус -
ного секвенирования бактериальных геномов.
В этой связи, целью настоящего исследования явился анализ вариабель-
ности нуклеотидных последовательностей внутреннего фрагмента гена arp у
современных российских штаммов T. pallidum subsp. pallidum, выполненный
с использованием технологии капиллярного секвенирования (по Сенгеру).
МАТЕРИАЛЫ И МЕТОДЫ
В исследование включены 57 клинических изолятов, полученных в 2016
— 2017 гг. из специализированных медицинских учреждений дерматовенеро-
логического профиля Центрального (Калужская область), Северо-Кавказ -
ского (Ставропольский край) и Сибирского (Республика Тыва) федеральных
округов. В качестве референса использован T. pallidum subsp. pallidum штамм
Nichols, культивируемый на тестикулярной модели у кроликов.
Выделение ДНК из исследуемого биоматериала проводилось с использо-
ванием набора реагентов «Проба-НК» (ДНК-технология, Россия). Присутст-
вие генетического материала T.pallidum subsp. pallidum в полученных образцах
подтверждалось методом ПЦР с праймерами к гену polA (регион 1156 — 1531
пар оснований), кодирующему специфическую ДНК-полимеразу I данного
микроорганизма [8].
Рутинное типирование подтвержденных клинических изолятов прово-
дили с использованием CDC-метода [13] путем амплификации гена arp, а
также амплификации генов подсемейства tprII с последующей рестрикцией
эндонуклеазой Tru9 I (НПО СибЭнзим, Россия) и оценкой электрофоретиче-
ской подвижности полученных продуктов в агарозном геле относительно
маркеров молекулярных масс GeneRuler 100 bp Plus DNA Ladder (ThermoFisherScientific,
США). В соответствии с рекомендацией Marra С.М. et al. [11]
дополнительно проводили секвенирование вариабельного участка гена
tp0548.
Подбор праймеров для секвенирования вариабельного фрагмента гена arp
осуществляли с использованием банка аннотированных нуклеотидных по-
следовательностей Национального центра биотехнологической информации
США (GenBank NCBI USA) [http://www.ncbi.nlm.nih.gov/genbank/] и on-line
сервиса nucleotide BLAST [http://www.ncbi.nlm.nih.gov/].
Амплификация гена arp проводилась с использованием термоциклера
DNA Engine Dyad Peltier Thermal Cycler (Bio-Rad, США). Очистка ПЦР-
продукта после первого этапа амплификации проведена с использованием
набора «QIAquick PCR Purification Kit» (Qiagen, Германия). Очищенный ПЦР-
продукт был использован для второго этапа амплификации с применением
меченых терминирующих нуклеотидов из набора реагентов Big Dye Terminator
v3.1 Cycle Sequencing Kit (Applied Biosystems, США). Осажденные продукты
ПЦР использовали для проведения секвенирования вариабельного фрагмен-
та гена arp на приборе 3130 Genetic Analyzer (Applied Biosystems, США) с при-
менением программного обеспечения 3130 Data Collection v.3.0.
Первичная расшифровка нуклеотидных последовательностей вариабель-
ного фрагмента гена arp проведена в программе Sequencing Analysis 5.3.1. Для
выравнивания гена arp на референсные сиквенсы T.pallidum subsp. pallidum
использована программа Mega 5.
РЕЗУЛЬТАТЫ
Исследование 57 образцов генетического материала T.pallidum в соответ-
ствии с рутинной процедурой CDC относило их исключительно к 14 молеку-
лярному субтипу по гену arp. Наличие гена arp с четырнадцатью 60-нуклео-
тидными тандемными повторами продемонстрировано и в референс -
ном геноме T. pallidum
штамм Nichols. После-
дующее типирование
по генам tprII и tp0548
позволило частично
разделить анализиру-
емую выборку, выделив
в ней доминантный (14
d/f — 89,5%) и минор-
ные (14 b/g и 14 c/f по
3,5%; 14 b/f и 14 i/f по
1,7%) молекулярные субтипы. Однако однотипный характер гена arp су-
щественно снизил эффективность дискриминации данных клинических
изолятов. Тем самым полученный результат подтвердил декларированную
необходимость совершенствования CDC-метода, в частности, путем углублен-
ного анализа гена arp с применением технологии капиллярного секвениро-
вания.
Практическое решение этой задачи потребовало внесения изменений в
протокол амплификации гена arp, поскольку использование предложенных
Pillay А. et al. [13] прямого и обратного праймеров как на этапе фрагментации
анализируемого участка ДНК, так и в реакции амплификации с применением
меченых терминирующих нуклеотидов, не обеспечивало качественного про-
чтения концевых участков анализируемых нуклеотидных последовательно -
стей. В этой связи, нами была предложена процедура двухраундовой ампли-
фикации гена arp с использованием двух пар прямого и обратного праймеров
(табл. 1). При этом использование первой (внешней) пары праймеров ориен-
тировано на получение первичного ампликона размером 1643 п.о., располо-
женного между 388 и 1541 нуклеотидами в гене arp и наряду с его центральным
участком из 60-нуклеотидных тандемных повторов дополнительно включаю-
щего фрагменты 5’- и 3’-концевых консервативных участков. В свою очередь,
на этапе секвенирования с использованием терминирующих нуклеотидов ис-
пользовалась вторая (внутренняя) пара праймеров, амплифицирующая вну-
тренний участок гена arp, полученного после первого раунда амплификации
(рис. 1). Подобный подход обеспечил качественное прочтение участка гена
arp между 414 и 1409 нуклеотидами (размером 1015 п.о.), результатом которо-
го являлось как четкое определение количества 60-нуклеотидных повторов,
так и их первичных нуклеотидных последовательностей.
Результаты проведенного секвенирования во всех случаях подтвердили
присутствие во внутреннем участке гена arp четырнадцати тандемных повто-
ров, одновременно зафиксировав вариации их нуклеотидного состава, а так-
же различный характер взаимного
расположения подобных неидентич-
ных повторов.
Анализируемые повторы харак-
теризовались высоким содержа -
нием GC-пар (67%), наличием двух
палиндромных последовательностей
(CCGGCC и GAGGGGAG), а также
вариабельностью пяти триплетов в
позициях 6, 8, 15, 16 и 17 (табл. 2).
Наиболее частым вариантом являлся
60-нуклеотидный по-
втор с триплетом GTG
в 6 и AAG в 8 позици -
ях, а также триплетами
GAG, CGT и GAG в 15
— 17 позициях. Ранее
исключительное при-
сутствие аналогичных
60-нуклеотидных по-
второв было показано у
T. pallidum, выделен-
ных от обезьян, T. pallidum
subsp. pertenue и
T. pallidum subsp. endemi -
cum [7], что позволяет
предполагать их эволю-
ционную первич ность,
составившую основу для
последующей дивер-
генции гена arp. Вторым
по частоте встречаемо-
сти являлся повтор,
отличающийся от опи-
санного выше варианта
единственным одно-
нуклеотидным поли-
морфизмом — заменой
пиримидинового осно-
вания во втором поло-
жении 6 триплета, при-
водящим к изменению
кодируемой аминокис-
лоты с аланина на ва-
лин (GCG → GTG; A →
V). Более существен-
ными оказывались отли -
чия третьего и четвер-
того вариантов, нуклео -
тидные замены в 15
— 17 триплетах кото-
рых произошли по типу
транзиции, т.е. путем
замещения пу ринового
основание на пури-
новое, а пиримидино-
вое на пиримидиновое.
При этом замены пу -
ри новых осно ваний во
втором положении 15
(GAG → GGG) и 16
(CGT → CAT) трипле-
тов повлекли за собой изменение
кодируемых аминокислот с глутами-
новой кислоты на глицин (E → G) и с
аргинина на гистидин (R → H), а ну-
клеотидная замена в третьем положе-
нии 17 триплета (GAG → GAA), на-
против, не сопровождалась изме -
нением кодируемой аминокислотной
последовательности. Наконец, раз-
личия между третьим и четвертым
вариантами 60-нуклеотидного пов -
тора заключались в замене двух пу-
риновых оснований 8 триплета с
соответствующим изменением коди-
руемой аминокислоты с лизина на глицин (AAG → GGG; K → G). В целом
полученные данные достаточно хорошо согласуются с известными пред-
ставлениями о вариантах нуклеотидных последовательностей тандемных
повторов гена arp [7, 9], в то время как предложенная нами нумерация наи-
более корректно отражает вероятные последовательные изменения их пер-
вичной структуры.
Последующий анализ комбинаций расположения различных вариантов
60-нуклеотидных тандемных повторов во внутреннем участке гена arp приво-
дил к заключению существованию нескольких молекулярных субтипов дан-
ного гена (рис. 2).
Комбинация внутреннего участка гена arp у референсного штамма
Nichols при прочтении от 5’-конца заключалось в нерегулярном чередовании
повторов I и II типов, завершающихся двумя повторами IV типа на 3’-конце
фрагмента. Однако формула подобной комбинации 5’-II-II-I-II-I-I-II-II-II-
I-I-IV-IV-3’ не была зафиксирована ни у одного из современных россий-
ских клинических изолятов T. pallidum. На этом фоне наиболее распростра-
ненной в анализируемой выборке оказывалась комбинация 5’-IIII-
I-II-I-I-II-II-IV-I-I-I-III-IV-3’, установленная у 54 из 57 исследованных
клинических изолятов и по своей последовательности соответствующая
внутреннему фрагменту гена arp штамма Street 14 [12]. Тем самым соотнесе-
ние полученных данных с представлениями о существовании в глобальной
популяции T.pallidum subsp. pallidum двух обособленных генетических кла-
стеров, известными представителями которых являются штаммы Nichols
(Dallas, Chicago B и др.) и Street 14 (Philadelphia-1, AZ 11 и др.), приводило к
заключению о принадлежности российских изолятов к последней, также как
это было показано для возбудителей сифилиса, циркулирующих в странах
Восточной Европы [5]. На этом фоне у трех клинических изолятов, посту-
пивших из Северо-Кавказского федерального округа (Ставропольский край),
была обнаружена ранее неизвестная комбинация внутреннего участка гена
arp, состоящая только из повторов I и II типов, описываемая формулой 5’-IIII-
I-II-I-I-II-II-I-II-II-I-I-I-3’ и обозначенная нами как молекулярный ва-
риант Stavropol (рис. 2). Тем самым подобная находка развивает предполо-
жение о существовании в глобальной популяции T. pallidum subsp. pallidum
более значительного разнообразия гена arp, что ранее было показано на при-
мере одного из регионально распространенных вариантов — выделенного в
Индии штамма Madras [7].
ОБСУЖДЕНИЕ
Молекулярное типирование T. pallidum subsp. pallidum, основанное на ис-
следовании вариабельных генов arp, tprII и tp0548, в настоящее время стало
распространенным и востребованным инструментом слежения за глобальной
и региональной эпидемиологией сифилиса [1, 2]. В то же время, длительный
опыт использо вания данного метода заставил констатировать ряд ограничений
его дискриминирующей способности, в том числе определяемых высокой
частотой встречаемости гена arp с четырнадцатью 60-нуклеотидными тандем-
ными повторами.
Предложенным в настоящем исследовании подходом к повышению эф-
фективности генотипирования T. pallidum явился переход от электрофорети-
ческой детекции ампликонов гена arp к секвенированию его внутреннего
вариабельного участка, реализованный с использованием оригинальной двух-
раундовой процедуры амплификации.
Проведенное секвенирование гена arp позволило получить три согласую-
щихся результата: 1) отнести все исследуемые гены к вариантам с 14 нуклеотид -
ными повторами; 2) подтвердить существование 4 вариантов 60-нуклеотидных
повторов, отличающихся по составу 6, 8 и 15 — 17 триплетов [7, 9]; 3) описать
различные комбинации подобных неидентичных повторов. При этом прин-
ципиально важным результатом стало выявление в российской популяции
нескольких вариантов гена arp. Подавляющее большинство из них (54 из 57)
относились к варианту, характерному для геногруппы Street 14, что впервые
показывает её доминирование в обследованных субъектах Российской
Федерации. С другой стороны, вариант последовательного расположения
60-нуклеотидных повторов, характерный для геногруппы Nichols, был зафик-
сирован только у соответствующего референсного штамма, что свидетельст -
вует о произошедшем полном вытеснении данного генотипа. Наконец еще
одной принципиально важной находкой стало обнаружение ранее неизвест-
ного варианта гена arp, имеющего четко ограниченный ареал распростране-
ния.
Таким образом, результаты проведенного исследования принципиально
подтвердили целесообразность секвенирования гена arp для повышения эф-
фективности молекулярного типирования T. pallidum, позволив дифференци-
ровать вариант данного гена с четырнадцатью 60-нуклеотидными тандемны-
ми повторами на несколько молекулярных субтипов. Планируемое увеличение
количества исследуемых клинических изолятов с вовлечением субъектов
Российской Федерации с традиционно высоким уровнем заболеваемости
сифилисом потенциально должно еще более расширить дискриминирующую
эффективность предложенного метода, позволив охарактеризовать пандеми-
ческий и региональные молекулярные варианты T. pallidum subsp. pallidum.
Одновременно продолжение исследований в обозначенном направлении
явится шагом, приводящим молекулярное типирование возбудителя сифили-
са к стандартам мультилокусного секвенирования бактериальных геномов.
About the authors
O. A. Obraztsova
State Research Center of Dermatovenerology and Cosmetology
Author for correspondence.
Email: fake@neicon.ru
Moscow Россия
K. A. Aleinikova
State Research Center of Dermatovenerology and Cosmetology
Email: fake@neicon.ru
Moscow Россия
A. A. Kubanov
State Research Center of Dermatovenerology and Cosmetology
Email: fake@neicon.ru
Moscow Россия
D. G. Deryabin
State Research Center of Dermatovenerology and Cosmetology
Email: fake@neicon.ru
Moscow Россия
References
- Белозоров А.П., Сокол О.А. Молекулярное типирование микроорганизма Treponema pallidum подвид pallidum. Дерматологiя та венерологiя. 2013, 4 (62): 5-11.
- Кубанов А.А., Воробьев Д.В., Обухов А.П., Образцова О.А., Дерябин Д.Г. Молекулярная эпидемиология Treponema pallidum в приграничном регионе Российской Федерации (Республика Тыва). Молекулярная генетика, микробиология и вирусология. 2017, 1: 30-34.
- Cejková D., Zobaníková M., Chen L. et al. Whole genome sequences of three Treponema pallidum ssp. pertenue strains: yaws and syphilis treponemes differ in less than 0.2% of the genome sequence. PLoS Negl. Trop. Dis. 2012, 6(1). doi: 10.1371.
- Dekker M.C., van Duijn C.M. Prospects of genetic epidemiology in the 21st century. Eur. J. Epidemiol. 2003, 18 (7): 607-616.
- Flasarová M., Pospíšilová P., Mikalová L. et al. Sequencing-based molecular typing of Treponema pallidum strains in the Czech Republic: all identified genotypes are related to the sequence of the SS14 strain. Acta Derm. Venereol. 2012, 92: 669-674.
- Fraser C.M., Norris S.J., Weinstock G.M. et al. Complete genome sequence of Treponema pallidum, the syphilis spirochete. Science. 1998, 281 (5375): 375-388.
- Harper K.N., Liu H., Ocampo P.S. et al. The sequence of the acidic repeat protein (arp) gene differentiates venereal from nonvenereal Treponema pallidum subspecies, and the gene has evolved under strong positive selection in the subspecies that causes syphilis. FEMS Immunol. Med. Microbiol. 2008, 53 (3): 322-332.
- Liu H., Rodes B., Chen C.Y., Steiner B. New tests for syphilis: rational design of a PCR method for detection of Treponema pallidum in clinical specimens using unique regions of the DNA polymerase I gene. J. Clin. Microbiol. 2001, 39 (5): 1941-1946.
- Liu H., Rodes B., George R., Steiner B. Molecular characterization and analysis of a gene encoding the acidic repeat protein (Arp) of Treponema pallidum. J. Med. Microbiol. 2007, 56 (6): 715-721.
- Ma D.Y., Giacani L., Centurión-Lara A. The molecular epidemiology of Treponema pallidum subspecies pallidum. Sex Health. 2015, 12 (2): 141-147.
- Marra C.M., Sahi S.K., Tantalo L.C. et al. Enhanced molecular typing of Treponema pallidum: geographical distribution of strain types and association with neurosyphilis. J. Infect. Dis. 2010, 202: 1380-1388.
- Matejkova P., Strouhal M., Smajs D. et al. Complete genome sequence of Treponema pallidum spp. pallidum strain SS14 determined with oligonucleotide arrays. BMC Microbiol, 2008, 8:76. doi: 10.1186/1471-2180-8-76.
- Pillay A., Liu H., Chen C.Y. et al. Molecular subtyping of Treponema pallidum subspecies pallidum. Sex. Transm. Dis. 1998, 25 (8): 408-414.