Тетрануклеотидный профиль герпесвирусных ДНК
- Авторы: Филатов Ф.П.1,2, Шаргунов А.В.1
-
Учреждения:
- ФГБНУ «Научно-исследовательский институт вакцин и сывороток им. И.И. Мечникова»
- ФГБУ «Национальный исследовательский центр эпидемиологии и микробиологии имени почетного академика Н.Ф. Гамалеи»
- Выпуск: Том 97, № 3 (2020)
- Страницы: 216-226
- Раздел: ОРИГИНАЛЬНЫЕ ИССЛЕДОВАНИЯ
- Дата подачи: 25.06.2020
- Дата принятия к публикации: 25.06.2020
- Дата публикации: 25.06.2020
- URL: https://microbiol.crie.ru/jour/article/view/825
- DOI: https://doi.org/10.36233/0372-9311-2020-97-3-3
- ID: 825
Цитировать
Аннотация
Введение. Герпесвирусные ДНК (около 90% всех полногеномных последовательностей семейства Herpesvirales, представленных в GenBank) содержат в минимальной концентрации один из двух тетрануклеотидов — CTAG или TCGA. «Недопредставленность» CTAG ранее наблюдалась только в ДНК некоторых бактерий и фагов. Ранее выявленная «недопредставленность» метилируемого димера CpG находит свое выражение в низкой концентрации TCAG в ДНК герпесвирусов.
Цель работы — продолжение анализа формальных характеристик герпесвирусных ДНК, а также сопоставление их с плотностью ДНК-микрогомологий вирус/хозяин и с геномной макроструктурой герпесвирусов.
Материалы и методы. Проанализированы по 20 штаммов и изолятов каждого из пяти типов вирусов герпеса человека (HHV1, HHV2, HHV3, HHV4, HHV5), 10 штаммов HHV8, 5 штаммов HHV6A, 4 штамма HHV6B и 3 штамма HHV7. Для определения частоты тетрануклеотидов использовали инструменты GenBank, а для сравнения — фрагменты ДНК человека размером с ДНК герпесвирусов.
Результаты. Минимальная концентрация CTAG в ДНК герпесвирусов в основном характерна для двух- и односегментных геномов с прямыми или инвертированными концевыми повторами (классов A, D и E), тогда как минимальная плотность TCGA — главным образом для значительно менее структурированной ДНК (классов B, C и F). По нарастанию плотности CTAG геномы герпесвирусов человека образуют последовательность, близкую к последовательности 20 нт-гомологий ДНК герпесвирус/человек, организованной по нарастанию плотности, что также коррелирует с макроструктурой ДНК. Параллель этой минимизации со структурой ДНК вирусов герпеса или с их принадлежностью к тому или иному подсемейству в литературе не отмечена. Хотя герпесвирусные ДНК довольно велики (125–295 Кб), некоторые из них (например, ДНК HHV4, HHV5 и HHV7) демонстрируют заметные отклонения от второго правила четности ДНК и, таким образом, могут служить компонентом вирусных молекулярных сигнатур.
В Обсуждении предлагаются возможные гипотезы происхождения некоторых из отмеченных явлений.
Полный текст
Введение
Герпесвирусы семейства Herpesviridae, включая HHV, делятся на три подсемейства: альфа-HV. бета-HV и гамма-HV [1]. Другой классификацией HV является классификация по макроструктуре ДНК (рис. 1). Она не совсем совпадает с делением на подсемейства и, в соответствии с общепринятыми взглядами [2], образует 6 классов — от A до F.
Рис. 1. Основные макроструктурные классы ДНК HHV (пропорции длин геномных фрагментов произвольны). TR1 — мономерные терминальные повторы (одиночные прямоугольники); TR2 — тандемные повторы (с нефиксированным числом повторов); TR0 — терминальных повторов нет. Группа BC[F] ДНК HHV выделена серым цветом.
Fig. 1. Basic macrostructural classes of HHV DNA (the proportions of the lengths of the genome fragments are arbitrary). TR1 — monomeric terminal repeats (single rectangles), TR2 — tandem organized repeats (non-fixed number of repeats), TR0 — no terminal repeats. BC[F] group of the HHV DNA (see text) is highlighted in gray.
Альфа-HHV (HHV1, HHV2 и HHV3), а также бета-HHV (HHV5) содержат двухсегментную ДНК; каждый сегмент ограничен взаимно инвертированными мономерными концевыми повторами TR1 (ДНК классов D и E). ДНК HHV класса A (бета-HHV: HHV6A, HHV6B и HHV7) представляет собой несегментированную уникальную линейную последовательность, ограниченную прямыми мономерными концевыми повторами TR1, содержащими по два «островка» теломероподобных гексануклеотидов. Гамма-HHV содержат ДНК классов B и C, которые имеют уникальную последовательность, ограниченную прямыми тандемно организованными короткими (т.е. не мономерными) повторами, TR2.
Сегменты и концевые повторы ДНК класса F не структурированы, хотя иногда они просто не показаны в GenBank. Существуют герпесвирусные ДНК с более экзотической макроструктурой (например, скутавирусы), но их очень немного. Данные, полученные нами в предлагаемой работе, позволили нам объединить классы A, D и E в одну группу (сегменты ДНК, ограниченные мономерными концевыми повторами), а B, C и F — в другую (отсутствие макроструктуры или нефиксированное число тандемно организованных коротких концевых повторов).
Ранее мы заметили, что молекулы ДНК гер- песвируса и его хозяина содержат короткие (20-29 нт) идентичные последовательности — микрогомологии, концентрация которых не случайна и, как мы полагаем, объясняется длительными (в эволюционном масштабе) близкими межгеномными отношениями между партнерами [3]. Позже [4, 5] мы обнаружили, что такие микрогомологии имеют характерные особенности распределения в геноме герпесвируса, концентрируясь в основном в его концевых (прямых или инвертированных) повторах, особенно в тех областях TR, в которых нет генов. Самое интересное — это последовательность видов HHV по нарастанию плотности геномных микрогомологий вирус/хозяин, которая согласуется с макроструктурой ДНК: меньшая плотность — в двухсегментных ДНК, большая — в несегментированных. В качестве рабочей гипотезы мы предположили, что двухсегментные вирусные геномы, у которых терминальные повторы взаимно инвертированы, склонны в латентном состоянии замыкаться, скорее, на себя (подобно эписомам) и меньше взаимодействовать с хозяйской ДНК, в то время как односегментные, имеющие прямые повторы, могут вытягиваться вдоль хозяйской ДНК, что облегчает межгеномное взаимодействие.
В качестве подхода для анализа мы использовали сравнение частот нуклеотидов в молекулах ДНК и второе правило четности ДНК Чаргаффа, CPR2 [6], которое становится наглядным в ДНК размером более 100 000 нт [7, 8]. CPR2 формулируется так же, как первое (CPR1), но относится только к одной цепи ДНК. Оно имеет приблизительную точность, которая увеличивается по мере удлинения анализируемой цепи. Оно относится не только к моно-, но и к олигонуклеотидам до 10-15 нт — с уменьшением строгости по мере удлинения анализируемого олигонуклеотида [7, 9]. В метагеномике часто используется тетрануклеотидный анализ для формирования молекулярных сигнатур [10]. Частота тетрануклеотидов (TN) в геномах герпесвирусов достоверно соответствует CPR2 и обеспечивает более детальную характеристику ДНК, чем моно-, ди- и тринуклеотиды [7, 11]. В принципе, симметрии TN генома HHV были описаны ранее [12], но они только подтвердили соответствие CPR2. Наш подход обнаруживает другие необычные свойства этих геномов.
Цель настоящей работы — продолжение анализа формальных характеристик герпесвирусных ДНК, а также сопоставление их с плотностью ДНК-микрогомологий вирус/хозяин и с геномной макроструктурой герпесвирусов.
Материалы и методы
Мы проанализировали около 90% нуклеотидных последовательностей полноразмерных молекул вирусной ДНК каждого рода всех трех семейств герпесвирусов позвоночных и беспозвоночных, содержащихся в GenBank. Проанализировав по 20 штаммов и изолятов каждого из 5 типов HHV (HHV1, HHV2, HHV3, HHV4, HHV5), 10 штаммов
HHV8, 5 штаммов HHV6A, 4 штамма HHV6B и 3 штамма HHV7, мы убедились в практической идентичности внутривидовых результатов и поэтому приводим в таблицах данные только по ДНК рефе- ренс-штаммов каждого вида герпесвирусов.
Для сравнения использовали ДНК человека длиной 1,5 мегануклеотида (5 фрагментов по 300 000 нт каждый):
- фрагмент Chr 03 163229646-163529646;
- фрагмент Chr 05 29372672-29672672;
- фрагмент Chr 14 64016329-64316329;
- фрагмент Chr 21 15306102-15606102;
- фрагмент Chr 21 33931862-34231862.
Для определения частоты TN мы использовали инструменты GenBank.
Результаты
Мы проанализировали TN-состав полностью секвенированных ДНК практически всех герпес- вирусов отряда Herpes virales, содержащихся в GenBank. Класс ДНК, т.е. преобладание G + C или A + T в одной из ее цепей, не дает слишком много в этом отношении, разделяя HHV на две группы по классам:
- класс АТ — HHV3 (альфа) и HHV6A, 6В, 7 (бета);
- класс GC — HHV1,2 (альфа), 5 (бета) и 4,8 (гамма).
Вместе с тем динуклеотидный анализ хорошо иллюстрирует CPR2 [8], по которому A ≈ T, C ≈ G, С + Т ≈ А + Г и С + А ≈ Т + Г для одной нити ДНК. Это определяется размером герпесвирусных ДНК — 125-295 Кб.
Общее количество TN составляет 256 (44). Чтобы избежать влияния класса ДНК (GC или AT) на результаты подсчета, показанного ранее [8, 13, 14], мы проанализировали только те TN, которые содержат все 4 различных основания, т.е. «полные» TN — 4TN. В ДНК HHV1 (класс GC) наименьшим («недопредставленным») является именно такой 4TN — CTAG (91 нт на геном из ~150 тыс. пар оснований). В дНк HHV6A (класс AT) число CTAG также близко к наименьшему (303 нт) среди всех тетрамеров и является наименьшим из 4TN. Меньше только AGGG (287) и GGCT (296) — в соответствии с классом ДНК. Это обстоятельство еще раз обосновывает выбор именно «полных» наборов для анализа TN.
Из 256 TN только 24 состоят из всех 4 нуклеотидов (P4 = 4! = 24). Эти 24, в свою очередь, делятся на две группы: 8 из них (октет А) при инверсии не меняются, например CTAG|CTAG, остальные (октет В) составляют пары В1 и В2 взаимноинвертированных неидентичных TN, например, CTAG|TCAG. В таблицах и на рисунках октеты А и В показаны раздельно. Для корректного сравнения данные представлены в процентах от суммы частот TN каждого октета, А и В. В табл. 1 сравниваются данные по всем 24 обсуждаемым TN октетов А и В (референс-штаммы) всех известных типов HHV. Данные табл. 1 показывают, что тетрамер CTAG «недопредставлен» в геномах всех HHV, за исключением HHV7; в последнем «недопредставлен» тетрамер ACTG. В ДНК HHV4 «недопредставлен» тетрамер TCGA (как и в геноме человека).
Таблица 1. Профиль идентичных (октет A) и неидентичных (октеты BI и B2) тетрамеров, содержащих 4TNT 8 типов HHV (референс-штаммы), выраженный в процентах от общего числа результатов по октетам А и В раздельно
Table 1. Profile of identical (octet A) and non-identical (octets B1 and B2) tetramers containing four different nucleotides (4ТN) of eight types of HHV (reference strains), expressed as a percentage of the total number of the octets A and B separately
Примечание. Жирными буквами обозначены тетрамеры CTAG и димеры CpG в обсуждаемых в тексте тетрамерах (соответствующие ячейки обоих октетов выделены серым цветом).
Note. Bold letters are tetramers CTAG and dimers CpG in the tetramers discussed in text (corresponding cells of the both octets are highlighted in gray).
В соответствии со снижением «недопредставленности» CTAG геномы HHV образуют последовательность, которая напоминает последовательность ДНК-микрогомологий вирус/хозяин по нарастанию их плотности (рис. 2): наибольшая «недопредставленность» CTAG характерна для двухсегментных ДНК, наименьшая — для односегментных.
Рис. 2. Частота (%) CTAG среди 4TN октета А в ДНК герпесвирусов человека. HHV4 и HHV8 (классы ДНК BC[F]) отмечены серым. В прямоугольнике — четыре HhV класса DE.
Fig. 2. Frequency (%) of CTAG among other 4TNs of the octet A in human herpesvirus DNA. HHV4 and HHV8 (BC[F] DNA classes) are marked in gray. In the rectangle there are four HHVs of DE classes.
В то же время ДНК каждого HHV содержит «сверхпредставленные» TN, которые также характерны для геномов определенной макроструктуры: ACGT — для двухсегментной ДНК (классы D, E), TGCA — для односегментной (класс A, розеоловирусы) и CATG — для односегментных (классы B, C). Однако, поскольку ДНК вирусов герпеса, отличных от человека, очень слабо представлена для видов-хозяев в GenBank, мы не приводим результаты анализа по «максимальным» TN.
Колонки чисел, относящихся к ДНК каждого вируса, представляют собой TN-профили ДНК, и они — в случае HHV4, 8 и 7 — демонстрируют определенное сходство с профилем ДНК человека. В некоторых случаях (HHV4, 5, 7) представленные попарно TN октетов BI и В2 демонстрируют характерные отклонения от CPR2, которые, вероятно, связаны с недостаточными размерами ДНК этих вирусов или с недостаточным числом штаммов в GenBank, которое не обеспечивает достоверность соответствующих данных. Позитивная сторона таких отклонений заключается в том, что они могут быть использованы в качестве компонентов молекулярных сигнатур этих вирусов.
Обращает на себя внимание, что разница между максимальными и минимальными значениями в октете А существенно больше, чем в октете В. В тех случаях, когда показатели плотности TN октета В меньше, чем октета А, их «недопредставленность» напрямую связана с классом ДНК, т.е. они имеют вид [TA/AT|GC/CG]; левая и правая пары тетрамера могут меняться местами, а знак «/» означает «или». Таких TN — 8, и их причастность к формированию класса ДНК не имеет значения для использования — вместе с другими полными тетрамерами — в качестве молекулярных сигнатур. В табл. 2 суммированы данные по «минимальным» («недопредставленным») 4TN ДНК герпесвирусов человека. Анализ серий штаммов (до 20) одного и того же типа HHV показал почти полную идентичность результатов, что в первом приближении позволило считать полученные результаты достаточно надежными.
Таблица 2. Обобщенная версия данных о ДНК HHV (семейство Herpesviridae)
Table 2. A generalized version of the data on the human herpesviruses DNA (family Herpesviridae)
Примечание. Не-CTAGmin ДНК выделены курсивом (CpG — жирным курсивом). HHV, в ДНК которых CpG>GpC, выделены серым цветом.
Note. Non-CTAGmin DNAs are highlighted in italics (CpG — in bold italics). HHVs in the DNA with CpG>GpC are highlighted in gray.
Далее мы провели TN-анализ полностью секвенированных ДНК почти всех других видов вирусов суперсемейства Herpesvirales (табл. 3).
Таблица 3. «Недопредставленные» TN в ДНК герпесвирусов животных (семейства Herpesviridae, Alloherpesviridae и Malacoherpesviridae)
Table 3. A generalized version of the data on the DNA of animal herpesviruses (families Herpesviridae, Alloherpesviridae and Malacoherpesviridae)
Окончание табл. 3 / End of Table 3
Примечание. Серые ячейки — ДНК класса BC[F] и «минимальные» не-CTAG TN. D* — необычная макроструктура ДНК вируса Testudinid HV3, в которой два примерно равных сегмента, ограниченные концевыми повторами, разделены короткой уникальной последовательностью.
Note. Gray cells — BC [F] class DNA and "minimal" non-CTAG TN. Asterix in D* denotes the unusual macrostructure of the Testudinid HV3 DNA, in which two approximately equal segments bounded by terminal repeats are separated by a short unique sequence.
Таблица 3 показывает, что все герпесвирусы разделены на две группы в соответствии с двумя основными «недопредставленными» TN — CTAG или TCGA. Разница между этими двумя группами следует из их геномной макроструктуры. Минимальный CTAG (CTAGmin) характерен для классов A, D, E структурированной ДНК с большими мономерными концевыми повторами —TR1, TCGAmin характерен для менее строго структурированных классов ДНК B, C[F] с нефиксированными тандемными концевыми повторами — TR2.
Обсуждение
«Недопредставленность» TN CTAG (CTAGmin) в геномах эшерихий и сальмонелл, а также некоторых фагов известна давно [15] и продолжает изучаться [16]. Мы впервые систематически показываем эту особенность для всех известных герпесвирусных ДНК и предполагаем ее возможную связь с их структурой. CTAGmin характерен для ДНК большей группы герпесвирусов (классы A, D, E) с наличием одного или двух сегментов, ограниченных мономерными концевыми повторами (TR1, прямыми или взаимно инвертированными). TCGAmin характерен для ДНК меньшей группы герпесвирусов (классы B, C[F]) с односегментным геномом, ограниченным неопределенным числом тандемно организованных прямых концевых повторов (TR2).
На мысль о более общей природе параллелей CTAGmin|ADE и TCGAmin|BC[F] среди вирусов животных наводит «недопредставленность» CTAG за рамками отряда Herpesvirales, в частности в ДНК вирусов африканской чумы свиней (Asfarviridae) и фибромы Shope у кроликов (Poxviridae), структурированных аналогично герпесвирусам A, D, E. В то же время геномы вирусов оспы и осповакцины (Poxviridae) не структурированы подобным образом, в них нет «недопредставленности» CTAG. Эти наблюдения требуют серьезного расширения обсуждаемых исследований в других таксономических группах вирусов животных.
Термодинамическая модель CTAG в составе РНК показывает, что этот тетрамер нарушает оптимальную структуру стволовых петель молекулы, которые контролируют экспрессию генов, увеличивая их свободную энергию. Авторы этой гипотезы [15] предположили также, что общий предок Salmonella и Escherichia имел значительно более высокую плотность CTAG, но эволюционное вырождение привело к замене CTAG у его потомков, и эта тенденция в настоящее время сохраняется. В серии генов и в межгенных пространствах у Escherichia и Salmonella это вырождение выразилось в эволюционной замене CTAG, в первую очередь на CTGG.
В этом отношении наиболее уместно сравнить филогенетически родственные (одного рода) розеоловирусы человека HHV6 и HHV7. В ДНК обоих вирусов — по сравнению с другими вирусами герпеса — частоты CTAG и CTGG наиболее различны. Сравнение показывает, что если в HHV7 (NC_001716) отношение частот CTAG:CTGG составляет 530:301 соответственно, то в HHV6A (NC_001664) оно даже противоположное и составляет 303:391 — при близких размерах ДНК обоих вирусов. Если наблюдение Le Tang с соавт. [16] в какой-то мере применимо и к обсуждаемым герпес-вирусам, то HHV7, очевидно, ближе к эволюционному предшественнику обоих розеоловирусов, чем HHV6, в котором многие CTAG были заменены на CTGG. В то же время HHV6 приобрел способность интегрировать свой геном в геном хозяина, что, как правило, не является обязательным условием для более тесных отношений с ДНК хозяина [17], о чем свидетельствует сходство профиля TN HHV7 (но не HHV6) и ДНК человека (рис. 3), а также более высокий уровень ДНК-микрогомологии вирус/хозяин в HHV7, чем в HHV6, или более низкий уровень такой микрогомологии у мардивирусов с выраженными теломерными островками в концевых повторах сегментов ДНК [5, 18].
Рис. 3. 4TN-профиль ДНК HHV6A и HHV7 по сравнению с профилем 4TN ДНК человека.Октет А: ДНК человека выделена серым, вирусная ДНК — черным. Октет B: график B1 ДНК человека выделен светло-серым, B2 — темно-серым; график B1 ДНК вируса выделен жирным черным, B2 — тонким черным.
Fig. 3. 4TN profile of HHV6A and HHV7 DNA compared to human DNA 4TN profile. Octet A: human DNA is highlighted in gray, viral DNA — in black. Octet B: human B1 is highlighted in light gray, human B2 is highlighted in dark gray, virus B1 is highlighted in bold black, B2 — in thin black.
На рис. 3 дополнительно показаны некоторые особенности проанализированных профилей 4TN вирусных ДНК. В соответствии с CPR2 сходство между В1 и В2 в ДНК человека намного больше, чем в ДНК вирусов, поскольку фрагменты ДНК человека имеют здесь длину 300 Кб, а геномы HHV намного короче. В HHV7 различия между B1 и B2 достаточно характерны и могут использоваться в качестве элемента молекулярной сигнатуры ДНК этого вируса (то же относится к профилю 4TN HHV4; рис. 4). Тот факт, что GenBank представляет полные (почти полные) последовательности ДНК только трех штаммов HHV7, позволяет применять статистические методы для подтверждения представленных здесь данных с большими оговорками. По этой причине мы не использовали здесь эти методы, отметив, что сегодня это лишь похоже на факт.
На рис. 4 приведено сравнение 4TN-профиля ДНК другой пары вирусов — HHV1 и HHV4. В случае HHV1 низкое содержание CTAG позволяет вирусу вызывать острую продуктивную инфекцию и накапливаться в клетках входных ворот (в тех же фибробластах), а затем переходить в нейроны, где он будет оставаться на всю жизнь — в частности, из-за ингибирующего действия эпигенетических механизмов хозяина, одним из которых является метилирование вирусной ДНК. Концентрация динуклеотидов CpG в геноме HHV1 существенно превышает среднее значение (табл. 1).
Рис. 4. 4TN-профиль HHV1 и HHV4 ДНК по сравнению с профилем 4TN ДНК человека.Октет А: ДНК человека выделена серым, вирусная ДНК — черным. Октет B: график B1 ДНК человека выделен светло-серым, B2 — темно-серым; график B1 ДНК вируса выделен жирным черным, B2 — тонким черным.
Fig. 4. 4TN profile of HHV1 and HHV4 DNA compared to human DNA 4TN profile. Octet A: human DNA is highlighted in gray, viral DNA — in black. Octet B: human B1 is highlighted in light gray, human B2 is highlighted in dark gray, virus B1 is highlighted in bold black, B2 — in thin black.
Низкие уровни CTAG могут играть роль в обострении латентных инфекций. В случае HHV4 первичная литическая инфекция не характеризуется высоким уровнем вирусных синтезов, а после перехода в хроническую фазу она также регулируется эпигенетическими инструментами, включая метилирование цитозина в составе CpG [18, 19]. В то же время очевидная близость 4TN-профилей генома HHV4 и хозяина указывает на сходную реакцию на эти регулирующие инструменты. То же самое можно сказать о HHV8 и эпигенетической регуляции его генов [19, 20]. Из многих эпигенетических механизмов, которые модифицируют экспрессию генов вируса и хозяина, мы рассматриваем здесь только метилирование ДНК, точнее, метилирование цитозина в CpG, поскольку этот димер является частью тетрамера TCGA, что позволяет сравнивать его с другим тетрамером, CTAG, в предложенном здесь аспекте.
Гипотеза о низкой плотности тетрамера CTAG из-за его эволюционного вырождения не объясняет очевидных ограничений его использования и вовсе не касается причин низкой плотности другого тетрамера октета А, TCGA, в ДНК представителей этого же суперсемейства. Около 40% CpG, центральной пары этого тетрамера, находится в промоторных зонах млекопитающих [21, 22] и имеет гораздо более низкую плотность в полных последовательностях геномов позвоночных, чем можно было бы ожидать [23, 24]. Эта «недопредставленность» является следствием высокой частоты мутаций метилированных сайтов CpG в геномах хозяев и их вирусов, особенно тех, которые тесно взаимодействуют с ДНК хозяина.
Причины пониженного содержания CpG неоднократно обсуждались и прежде [25], однако вопрос заключается не столько в низкой плотности CpG, сколько в контексте этой пары, т.е. в составе TCGA, поскольку этот тетрамер представлен в герпесвирусных ДНК в значительно меньшей концентрации, нежели ACGT.
Данные Le Tang и соавт. [16] показывают, что само по себе минимальное содержание CTAG (и TCGA) не ограничивается герпесвирусной ДНК.
Мы проанализировали TN-профиль больших ДНК с концевыми повторами некоторых других вирусов. Обнаружено, что CTAG является «минимальным» у вирусов африканской чумы свиней (семейство Asfarviridae) и вируса фибромы Shope (семейство Poxviridae), но не у вирусов оспы и осповакцины (также семейства Poxviridae), ДНК которых не имеет терминальных повторов. Это означает, что при построении филогенетических деревьев необходимо учитывать не только изменения в генах и белках, но и эволюцию молекулы ДНК, включая ее обсуждаемые здесь характеристики.
В первом приближении для анализа плотности потенциально метилируемого цитозина в геномах герпесвирусов достаточно оценить соотношение CpG:GpC (т.е. проанализировать динуклеотидный профиль ДНК), которое не связано с типом генома (AT или GC). Эту оценку можно проследить в табл. 2: ДНК HHV с CpG>GpC (в серых ячейках). В этом случае результаты, представленные здесь, будут касаться только концентрации и соотношения CTAG/CpG в герпесвирусных ДНК, которые могут влиять на уровень вирусных синтезов. В наиболее общем (не строгом) виде это соотношение имеет зеркальный характер: наиболее низкая концентрация CTAG сопровождается самой высокой концентрацией CpG (табл. 1). Тем не менее соотношение CTAG/CpG обедняет получаемую информацию, которая указывает на различие именно в TN-профиле герпесвирусных ДНК, CTAG/TCGA. Другими словами, составляющей этого отношения является TCGA/ACGT, четко выраженное в рамках классов DE/A/BC[F] (табл. 1). В свою очередь, это указывает на необходимость учитывать контекст, который определяет функциональную ценность димера CpG. Возможно, этот контекст выходит за рамки тетрамера. Для надежных выводов необходимо расширить исследования за рамки герпесвирусов — при серьезном пополнении GenBank новыми полными последовательностями вирусных ДНК. Но в любом случае результаты, продемонстрированные здесь, указывают на то, что биологический смысл макроструктуры герпесвирусной ДНК гораздо глубже, чем принято считать.
Об авторах
Феликс Петрович Филатов
ФГБНУ «Научно-исследовательский институт вакцин и сывороток им. И.И. Мечникова»;ФГБУ «Национальный исследовательский центр эпидемиологии и микробиологии имени почетного академика Н.Ф. Гамалеи»
Автор, ответственный за переписку.
Email: felix001@gmail.com
ORCID iD: 0000-0001-6182-2241
к.м.н., д.б.н., в.н.с. лаб. молекулярной биотехнологии
ведущий научный сотрудник
РоссияАлександр Валерьевич Шаргунов
ФГБНУ «Научно-исследовательский институт вакцин и сывороток им. И.И. Мечникова»
Email: fake@neicon.ru
ORCID iD: 0000-0001-5536-1557
ведущий инженер, лаб. генетики ДНК-содержащих вирусов Россия
Список литературы
- Whitley R., Kimberlin D., Prober C. Pathogenesis and disease. In: Arvin A., Campadelli-Fiume G., Mocarsky E., Moore P.S., Roizman B., Whitley R., eds. Human Herpesviruses: Biology, Therapy and Immunoprophylaxis. Chapter 32. Cambridge: Cambridge University Press; 2007.
- Pellett P., Roizman B. Herpesviridae. In: Knipe D.M., Howley P.M., eds. Fields Virology. Philadelphia: Lippincott Williams & Wilkins; 2013: 1802-2.
- Zabolotneva A., Tkachev V., Filatov F., Buzdin A. How many antiviral small interfering RNAs may be encoded by the mammalian genomes? Biol. Direct. 2010; 5: 62. DOI: http://doi.org/10.1186/1745-6150-5-62
- Filatov F., Shargunov A. Short nucleotide sequences in herpesviral genomes identical to the human DNA. J. Theor. Biol. 2015; 372: 12-21. DOI: http://doi.org/10.1016/j.jtbi.2015.02.019
- Filatov F., Shargunov A. Microhomology of Viral/Host DNAs and macrostructure of herpesviral genome. Int. J. Virol. AIDS. 2018; 5(1): 042. DOI: http://doi.org/10.23937/2469-567X/1510042
- Rudner R., Karkas J.D., Chargaff E. Separation of B. subtilis DNA into complementary strands, 3. Direct Analysis. Proc. Natl. Acad. Sci. USA. 1968; 60(3): 921-2. DOI: http://doi.org/10.1073/pnas.60.3.921
- Forsdyke D.R. Symmetry observations in long nucleotide sequences: a commentary on the discovery note of Qi and Cuticchia. Bioinformatics. 2002; 18(1): 215-7. DOI: http://doi.org/10.1093/bioinformatics/18.1.215
- Albrecht-Buehler G. Asymptotically increasing compliance of genomes with Chargaff’s second parity rules through inversions and inverted transpositions. Version 2. Proc. Natl. Acad. Sci. USA. 2006; 103(47): 17828-33. DOI: http://doi.org/10.1073/pnas.0605553103
- Baisnee P.F., Hampson S., Baldi P. Why are complementary strands symmetric? BioInformatics. 2002; 18(8): 1021‐33. DOI: http://doi.org/10.1093/bioinformatics/18.8.1021
- Gori F., Mavroeidis D., Jetten M.S.M., Marchiori E. The importance of Chargaff’s second parity rule for genomic signatures in metagenomics. Available at: http://www.biorxiv.org/content/biorxiv/early/2017/06/04/146001.full.pdf
- Pride D.T., Blaser M.J. Identification of horizontally acquired genetic elements in Helicobacter pylori and other prokaryotes using oligonucleotide difference analysis. Genome Lett. 2002; 1(1): 2-15. DOI: http://doi.org/doi.org/10.1166/gl.2002.003
- Prabhu V.V. Symmetry observations in long nucleotide sequences. Nucleic Acids Res. 1993; 21(12): 2797‐800. DOI: http://doi.org/10.1093/nar/21.12.2797
- Albrecht-Buehler G. The three classes of triplet profiles of natural genomes. Genomics. 2007; 89(5): 596‐601. DOI: http://doi.org/10.1016/j.ygeno.2006.12.009
- Zhang S.H., Wang L. A novel common triplet profile for GCrich prokaryotic genomes. Genomics. 2011; 97(5): 330‐1. DOI: http://doi.org/10.1016/j.ygeno.2011.02.005
- Burge C., Campbell A.M., Karlin S. Over- and under-representation of short oligonucleotides in DNA sequences. Proc. Natl. Acad. Sci. USA. 1992; 89(4): 1358-62. DOI: http://doi.org/10.1073/pnas.89.4.1358
- Tang L., Zhu S., Mastriani E., Fang X., Zhou Y.J., Li Y.G., et al. Conserved intergenic sequences revealed by CTAG-profiling in Salmonella: thermodynamic modeling for function prediction. Sci. Rep. 2017; 7: 43565. DOI: http://doi.org/10.1038/srep43565
- Bhende P.M., Seaman W.T., Delecluse H.J., Kenney S.C. The EBV lytic switch protein, Z, preferentially binds to and activates the methylated viral genome. Nat. Genet. 2004; 36(10): 1099-104. DOI: http://doi.org/10.1038/ng1424
- Kaufer B.B., Flamand L. Chromosomally integrated HHV-6: impact on virus, cell and organismal biology. Curr. Opin. Virol. 2014; 9: 111‐8. DOI: http://doi.org/10.1016/j.coviro.2014.09.010
- Woellmer A., Hammerschmidt W. Epstein-Barr virus and host cell methylation: regulation of latency, replication and virus reactivation. Curr. Opin. Virol. 2013; 3(3): 260‐5. DOI: http://doi.org/10.1016/j.coviro.2013.03.005
- Lim C., Lee D., Seo T., Choi C., Choe J. Latency associated nuclear antigen of Kaposi’s sarcoma-associated herpesvirus functionally interacts with heterochromatin protein 1. J. Biol. Chem. 2003; 278(9): 7397-405. DOI: http://doi.org/10.1074/jbc.M211912200
- Pantry S.N., Medveczky P.G. Epigenetic regulation of Kaposhi's sarcoma associated herpesvirus replication. Semin. Cancer Biol. 2009; 19(3): 153-7. DOI: http://doi.org/10.1016/j.semcancer.2009.02.010
- Fatemi M., Pao M.M., Jeong S., Gal-Yam E.N., Egger G., Weisenberger D.J., et al. Footprinting of mammalian promoters: use of a CpG DNA methyltransferase revealing nucleosome positions at a single molecule level. Nucleic. Acids Res. 2005; 33(20): e176. DOI: http://doi.org/10.1093/nar/gni180
- Lander E.S., Linton L.M., Birren B., Nusbaum C., Zody M.C., Baldwin J., et al. Initial sequencing and analysis of the human genome. Nature. 2001; 409(6822): 860-921. DOI: http://doi.org/10.1038/35057062
- Stevens M., Cheng J., Li D., Xi M., Hong C., Maire C., et al. Estimating absolute methylation levels at single-CpG resolution from methylation enrichment and restriction enzyme sequencing methods. Genome Res. 2013; 23(9): 1541‐53. DOI: http://doi.org/10.1101/gr.152231.112
- Nicholas J. Evolutionary aspects of oncogenic herpesviruses. Mol. Pathol. 2000; 53(5): 222‐37. DOI: http://doi.org/10.1136/mp.53.5.222