PROTEOMIC METHODS OF PROTEIN SEPARATION AND ANALYSIS


Cite item

Full Text

Abstract

The review briefly presents principles and stages of execution of such highly effective methods of protein separation as capillary, 2D gel-electrophoresis, liquid chromatography, the possibility of their successful combination with tandem mass-spectrometry and application in various fields of proteomics. The main problems of proteomic analysis as well as ways of solving by using mass-spectrometry are examined. 2 main approaches during protein identification are described in the review, characteristics and possibilities of various top-down and bottom-up proteomic analytical programs are provided.

Full Text

Протеом - это совокупность экспрессированных белков в данном типе клеток, ткани или организме в определённый период времени. Если гены программируют набор возможных белков, то белки выполняют программу и ответственны за все биохимические процессы клетки: химический синтез, накопление и расходование энергии, дыхание, деление и апоптоз. Протеомика - это системное изучение протеома с помощью комплекса методических приемов, направленных на разделение и последующую идентификацию белков, синтезирующихся в биологическом объекте. В протеомике объектами исследований часто являются ткани и культуры клеток, которые представляют собой сложные смеси белков в широком диапазоне концентрации. Для анализа этих смесей методом масс-спектрометрии необходимо применение высокоэффективных методов разделения белков, таких как SDS-PАGE (sodium dodecyl sulphate - polyacrylamide gel electrophoresis) и двумерный (2DE - two dimensional electrophoresis) гель-электрофорез, капиллярный (3D) электрофорез, а также жидкостная хроматография. В 2D электрофорезе белки разделяются в одном направлении по заряду в соответствии с градиентом pH (изоэлектрофокусирование), который создается специальными амфотерными веществами - амфолитами, в другом направлении - по подвижности в электрическом поле. Изоэлектрофокусирование проводится на IPG (immobilized pH gradient) стрипах или в стеклянных трубочках, заполненных гелем, где разделение белков основано на таком их свойстве, как изоэлектрическая точка (pI - isoelectric point), которая определяется аминокислотным составом белка. Белки в геле с градиентом pH, к которому приложено электрическое поле, начинают двигаться к электроду с противоположным зарядом, при этом теряя или присоединяя протоны. В результате заряд и подвижность белков снижаются и становятся нулевыми при достижении точки в градиенте pH, равной их pI. Далее проводят второе разделение по массе белков и окрашивание 2D гелей Кумасси или нитратом серебра [13]. Исследуемое пятно вырезают, удаляют краситель, белок денатурируют и подвергают ферментативному гидролизу трипсином, который разрывает пептидные связи аминокислот лизина или аргинина. Трипсин переводит белки в триптические пептиды с длиной цепи в 6 - 15 аминокислот и молекулярной массой в диапазоне 1000 - 2000 Да, которые экстрагируют из геля и анализируют чаще с помощью матрично активированной лазер-ионизационной масс-спектрометрии (MALDI - matrix-assisted laser desorption/ionization). В последнее время все большую популярность среди специалистов приобретает капиллярный (3D) электрофорез, где разделение молекул по заряду и размеру происходит в тонком кварцевом капилляре, заполненном электролитом [3]. 3D электрофорез обеспечивает высокоэффективный и быстрый анализ сложных смесей при минимальной пробоподготовке и затратах на реактивы. Система для капиллярного электрофореза Agilent 3D CE (Agilent Technologies, США) имеет широкодиапазонный спектральный детектор с диодной матрицей, дающий возможность проводить высокочувствительный спектральный анализ за 0,1 сек в диапазоне волн от 190 до 600 нм с одновременной мультиволновой регистрацией электрофореграмм (до 5). Еще одним достоинством системы является программное обеспечение с автоматической идентификацией веществ, а также возможность подключения к масс-спектрометру. Капиллярный электрофорез нашел применение в фармацевтической и пищевой промышленности [2, 4], имеются сообщения об успешном использовании отечественного аналога - системы «Капель» [7]. В настоящее время хроматомасс-спектрометрия является одной из базовых аналитических технологий протеомных исследований, где масс-спектрометрия используется для структурной идентификации белков. Для этого белки первоначально гидролизуются до пептидов трипсином. Далее полученная таким образом многокомпонентная смесь пептидов подвергается различным вариантам многостадийной высокоэффективной жидкостной хроматографии (ВЭЖХ) для получения более простых смесей (2D или 3D хроматография). Так, например, при исследовании протеома митохондрий сердечной мышцы Bos taurus была использована система двумерной ВЭЖХ (Agilent 1100, ОША), включающая ионообменную и обращенно-фазовую хроматографию [10]. Кроме того, снижение сложности состава исследуемой пробы возможно за счет предварительного фракционирования белков перед двумерной ВЭЖХ или, например, за счет выделения для анализа только цистеин-содержащих пептидов аффинной хроматографией [9, 15]. Протеомный анализ чаще ведется в режиме хроматомасс-спектрометрии, поэтому помимо масс-спектрометрических данных полезно использовать и хроматографические, так как время выхода соединения из колонки определяется при других равных параметрах анализа его структурой и может быть рассчитано достаточно точно. В последние годы успешно развивается «скорострельная» протеомика, сутью которой является возможность использования пептидных маркеров белков. В качестве маркеров могут выступать меченные изотопами пептиды или пептиды, уникальные для данного белка. Предложен метод приведения хроматографических данных полипептидов и белков, полученных при различных условиях и оборудовании, к единой временной шкале для создания универсальных баз данных точных масс и времени пептидных маркеров белков (Accurate Mass and Time tags, AMT). Создание таких баз данных позволит количественно идентифицировать тысячи белков за время одного ВЭЖХ анализа (1 час) [8, 11, 18]. Масс-спектрометрия позволяет успешно решать основные задачи протеомного анализа: идентификация белков, определение первичной аминокислотной последовательности белка, выявление посттрансляционных модификаций и количественный анализ белков [5, 6, 8]. При идентификации белков различают два подхода: top-down - получение информации на основе масс-спектрометрического анализа целых, неповрежденных белковых молекул и bottom-up - восстановление информации о белках за счет анализа отдельных пептидов этих белков. Наиболее распространенным является подход bоttom-uр (снизу-вверх), который представляет собой предварительное энзиматическое расщепление белка на более мелкие фрагменты, быструю очистку полученного образца от низкомолекулярных примесей и масс-спектрометрический анализ смеси пептидов. Наиболее простым вариантом идентификации очищенных белков bоttom-uр, связанным с установлением только молекулярной массы пептидов, является пептидное картирование или peptide mass fingerprinting, основанное на том, что набор пептидов, полученных ферментативным гидролизом, уникален для каждого белка подобно отпечаткам пальцев человека. Суть метода в том, что для каждого белка с известной последовательностью рассчитываются теоретические массы пептидов с учетом возможных модификаций. Далее фактический масс-спектр продуктов гидролиза определяемого белка загружается в программу поисковик для нахождения соответствующих белковых последовательностей в базах данных (например, ишРго^. Результаты поиска выдаются в виде таблицы, где указаны конкретные белки и число соответствующих им пептидов в порядке убывания степени совпадения. Фингерпринтинг был применен для сравнительного изучения протеомных карт изогенных СТХф+ и СТХф- вариантов штамма Vibrio ^o^rae М888, экспрессии белков природного штамма холерного вибриона О1 серогруппы и PhoВ мутанта в ответ на фосфатное голодание [16], а также для дифференцирования холерного вибриона на эпидемические и неэпидемические штаммы по скорости ферментации сорбита [25]. Однако пептидное картирование пригодно для идентификации только очищенных белков, для анализа смесей белков применяется тандемная масс-спектрометрия (ВЭЖХ-МС/МС), которая проводится на приборах, объединяющих несколько анализаторов. Благодаря разработке аналитических программных методов идентификации белков, тандемная МС дает возможность идентифицировать белок по одиночным пептидам. Так, в методе секвенирования de Novo или фрагментных карт определение полной последовательности пептида проводят по его масс-спектру. Схема анализа включает денатурацию белковой смеси, в том числе разрушение дисульфидных связей, последующий трипсинолиз и анализ реакционной смеси методом ВЭЖХ-МС/МС. Далее выбирают единичный пептид в первой МС ступени и фрагментируют в столкнови-тельной ячейке. Все полученные в эксперименте тандемные масс-спектры, содержащие информацию об отношении массы к заряду (m/z) иона-предшественника, его времени удерживания, а также m/z ионов-продуктов преобразовываются программным обеспечением масс-спектрометра в текстовый вид и загружаются в поисковик. Далее программа вычисляет не только массу, но и теоретический тандемный масс-спектр протеолитического пептида. После сравнения теоретических и экспериментальных тандемных масс-спектров программа выдает пептидный сиквенс и белок, который ему соответствует, с наилучшим индексом достоверности. Важно отметить, что в отличие от пептидного картирования, достаточно сиквенса хотя бы одного пептида, чтобы идентифицировать весь белок. При обнаружении нескольких пептидных сиквенсов, принадлежащих одному и тому же белку, программное обеспечение комбинирует данные, а соответствующий белок получает больший индекс достоверности. Таким образом, с помощью тандемной масс-спектрометрии в белковой смеси без предварительного разделения возможно идентифицировать до 4000 белков, как уже известных, так и установить структуру ранее не исследованных полипептидов [1, 26]. Второй метод программного поиска называется Sequence Tag, когда фрагментные спектры используются для частичной интерпретации и определения короткой последовательности из 6 или более аминокислот. Далее эта последовательность в однобуквенной кодировке загружается в компьютерные программы MS-Pattern, FASTA, BLAST, Mascot. Соответствие определенных экспериментатором последовательностей триптических пептидов существующим в базах данных позволяет идентифицировать пептиды, а затем и сам белок. Несмотря на то, что удачные алгоритмы для распознавания Sequence Tag стали появляться только в последнее время или входят в программное обеспечение (Protein Scape, Bruker) последних разработок ведущих фирм по производству масс-спектрометрического оборудования [8, 9], этот метод более надежен, чем секвенирование de Novo, т.к. расшифровывается пусть даже часть последовательности пептида, но на основании надежной информации. Методом ма-триксной масс-спектрометрии с детекцией времени пролета ионов (МАLDI-ТОF MS) определен аминокислотный состав и изучена вторичная структура кератиноподобного белка (TFP) двустворчатого моллюска Siliqua radiate. Обнаружено, что TFP с молекулярной массой ~58 кДа включает в себя большое число остатков Gly и Phe и повторяющиеся короткие последовательности SGGG и SYGSGG [12]. Несмотря на высокую эффективность метода идентификации белков «снизу вверх», он практически никогда не позволяет точно установить изоформу белка. Для установления точной структуры белков, включая различия в изоформах, используют анализ белков «сверху вниз» (toр-dоwn). В этом варианте вслед за определением молекулярной массы целого белка идет инициирование его фрагментации с использованием всего арсенала масс-спектрометрии последнего поколения. Здесь желательно использовать приборы высокого разрешения, тандемную масс-спектрометрию не только в варианте МС2, но и МСп, кроме того, полученные спектры оказываются очень сложными и их расшифровка требует специального программного обеспечения. Показано преимущество метода toр-dоwn на анализаторе с высоким разрешением при идентификации профиля молекулярных масс и посттрансляционных модификаций интактных мембранных белков по сравнению с масс-спектрометрией с ионизацией электроспреем [24], а также успешное применение метода для идентификации изоформ [20, 23]. Из-за сложности метода toр-dоwn появился подход «с середины вниз» (middle down), который называют протеомным анализом в расширенном диапазоне (ERPA - extended range proteomic analysis). Метод заключается в неполном протеолизе исходного белка с последующим масс-спектрометрическим анализом длинных пептидов методом «сверху вниз». Такие пептиды позволяют получить информацию о местах посттрансляционных модификаций, идентифицировать конкретные изоформы [27]. Одной из задач протеомного анализа является выявление посттрансляционных модификаций, которые можно разделить на три группы: 1) посттрансляционные модификации, являющиеся следствием присоединения каких-либо функциональных групп (фосфорилирование, ацетилирование и др.); 2) посттрансляционные модификации, связанные с процессингом белка до зрелой формы; 3) модификации, возникшие в процессе пробоподготовки. Наибольший интерес представляют модификации первых двух типов, поскольку они связаны с жизненным циклом клетки. Разработана методика выделения из лизатов клеток только фосфорилированных пептидов на авидиновом сорбенте путем химической замены фосфорной группы на биотин с последующим ВЭЖХ-МС/МС анализом [21]. Идентификация модификаций второго типа наиболее сложна и требует специальной подготовки проб и обработки данных МС-анализа. Каждая из модификаций проявляется в масс-спектрах за счет характерного изменения массы аминокислотного остатка и выглядит как смещение серий пиков на величину, соответствующую молекулярной массе присоединенной функциональной группы. При обработке данных МС-анализа необходимо учитывать возможные модификации, но не более девяти по рекомендации Mascot, т.к. это сильно усложняет и увеличивает время поиска. Метод МС также применяется для количественного анализа, который включает сравнительный количественный анализ и точное количественное определение, т.е. установление абсолютного количества нескольких целевых белков. При сравнительном количественном анализе устанавливается соотношение количества одного и того же белка в разных образцах без определения молярной концентрации белка. Сравнительная протеомика объединяет безизотопные и изотопные методы анализа, когда в исходные белки или пептиды образца и контроля вводят внутренние стандарты в виде изотопно-меченных аналогов исследуемых соединений. В качестве метки могут быть использованы такие стабильные изотопы как 13C, D, 18O, 15N, при этом интенсивность сигналов в масс-спектре двух веществ, отличающихся только изотопной меткой, будет соответствовать концентрации этих веществ. Метка может вводиться in vivo, т.е. в процессе жизнедеятельности организма (SILAC - Stable Isotope Labeling by Amino acids in Cell culture), когда одна из клеточных линий выращивается на питательной среде, обогащенной тяжелыми изотопами [22]. Метод SILAC хорошо работает только на клеточных линиях бактерий, для введения меток в организм животных используют меченный корм, например, 15^спирулину для крыс или добавки 13C6, 12С б-лизина для мышей [17, 19]. При введении изотопной метки in vitro происходит химическая модификация выделенных из клеток белков или пептидов, поэтому точность этих методов ниже из-за погрешностей в пробоподготовке. Одним из самых популярных методов in vitro является ICAT (Isotope Coded Affinity Tag), где метка содержит тиол-реагирующую группу для ковалентного присоединения только к аминокислоте цистеину, изотопно-меченную связку и остаток биотина для аффинного выделения. Для дифференциации двух линий клеток (например, между нормой и патологией) в лизаты обеих линий вводят метки с различным весом. После введения метки оба лизата смешивают, смесь гидролизуют до пептидов и значительно упрощают за счет аффинного выделения на авидиновых колонках. Оставшиеся цистеинсодержащие пептиды подвергают ВЭЖХ-МС/МС анализу. Сходные пептиды из обоих лизатов появляются рядом и в хроматографическом разделении, и в масс-спектрах, различаясь на количество единиц массы метки. Идентификацию меченных ICAT пептидов проводят, указывая в поисковике возможную модификацию «ГСАТ»[14]. Для установления абсолютного количества белков используют различные варианты описанного метода внутреннего стандарта с учетом свойств белковых молекул [8]. Так, в методе абсолютной калибровки (AQUA) выбирается интересующий белок и его триптический пептид, стабильно определяющийся при качественном ^Wom-^ анализе с высокой интенсивностью, имеющий 10 - 15 аминокислотных остатков и не склонный к модифицированию. Затем синтезируется искусственный триптический пептид такой же структуры с изотопной меткой (AQUA-пептид) и вводится в пробу в известном количестве. После измерения соотношений интенсивности этих пептидов расчет проводится аналогично методам сравнительной протеомики. В настоящее время все известные последовательности белков объединены в базы данных, которые находятся в открытом доступе через интернет. Наиболее популярной является объединенная база белковых сиквенсов ишРго^ основным достоинством которой является тщательная проверка данных, а также наличие ссылок и аннотаций. Для идентификации полипептидов с использованием баз данных необходима программа-посредник, которая входит в программные пакеты всех ведущих фирм-производителей масс-спектрометрического оборудования. Программа поиска выдает список белков с уменьшающимся индексом сходства ^соге), а также информацию о белке, частью которого может являться данный пептид. При работе с любой поисковой программой (поиск по аминокислотным последовательностям пептидов, молекулярным массам пептидов или массам фрагментных ионов в тандемном спектре) необходимо помнить, что полная идентификация возможна лишь при 100% покрытии сиквенса белка, что практически невозможно. Приемлемыми считаются величины до 30 - 40%, а при анализе комплекса белков без их предварительного разделения значимыми являются показатели даже менее 10%. Таким образом, научно-технические разработки последних лет выдвинули масс-спектрометрию на ведущее место среди физико-химических методов протеомного анализа. Это обусловлено высокой чувствительностью, быстротой и универсальностью применения масс-спектрометрии для широкого спектра химических соединений, а также успешной комбинацией метода с такими эффективными разделительными техниками, как газовая и жидкостная хроматография, капиллярный и гель-электрофорез. Однако постоянно меняющаяся природа протеома вызывает сложности его исследования, что стимулирует необходимость дальнейшего развития аналитических технологий в протеомике в сторону повышения скорости и производительности анализа, а также разработку и расширение высокоинформативных баз спектральных данных и идентификационных компьютерных программ.
×

About the authors

T. A Polunina

Russian Research State Institute of Plague Control «Microb»

Saratov, Russia

Yu. S Varshavskaya

Russian Research State Institute of Plague Control «Microb»

Saratov, Russia

G. V Grigorieva

Russian Research State Institute of Plague Control «Microb»

Saratov, Russia

Ya. M Krasnov

Russian Research State Institute of Plague Control «Microb»

Saratov, Russia

References

  1. Артеменко К.А., Самгина Т.Ю., Лебедев А.Т. Масс-спектрометрическое de novo секвенирование пептидов. Масс-спектрометрия. 2006, 3 (4): 225-254.
  2. Бессонов В.В., Передеряев О.И., Богачук М.Н. Методика количественного определения водорастворимых витаминов в витаминных премиксах и пищевых продуктах с использованием мицеллярной электрокинетической хроматографии на коротком конце капилляра. Вопросы питания. 2011, 3: 67-74.
  3. Бёккер Ю. Хроматография. Инструментальная аналитика: методы хроматографии и капиллярного электрофореза. М., Техносфера, 2009.
  4. Богачук М.Н., Передеряев О.И., Раменская Г.В. Определение водорастворимых витаминов в поливитаминных препаратах методом капиллярного зонального электрофореза. Вопросы биологической, медицинской и фармацевтической химии. 2011, 9: 14-22.
  5. Веренчиков А.Н., Краснов Н.В., Галль Л.Н. Тандемные масс-спектрометры в биохимии. Науч. приборостроение. 2004, 14 (2): 4-23.
  6. Краснов Н.В., Лютвинский Я.И., Подольская Е.П. Масс-спектрометрия с мягкими методами ионизации в протеомном анализе (обзор). Науч. приборостроение. 2010, 20 (4): 5-20.
  7. Комарова Н. В. Практическое руководство по использованию систем капиллярного электрофореза «Капель». С.-Петербург, Веда, 2006.
  8. Лебедев А.А., Артеменко К.А., Самгина Т.Ю. Основы масс-спектрометрии белков и пептидов. М., Техносфера, 2012.
  9. Лютвинский Я.И., Макаров В.В., Козлов Б.Н. и др. Оценка емкости масс-спектров высокого разрешения при анализе сложных смесей. Науч. приборостроение. 2006, 16 (3): 113-121.
  10. Поляков Н.Б., Барылюк К.В., Франкевич В.Е. и др. Протеомный анализ митохондрий сердца Bos taurus.1. Использование методов протеомики для идентификации трансмембранных доменов белков внутренней мембраны митохондрий. Биоорганическая химия. 2009, 35 (1): 40-54.
  11. Придатченко М.Л., Тарасова И.А., Масселон К. и др. Единый подход к созданию универсальных баз данных точных масс и времен удерживания пептидных маркеров белков на основе модели критической хроматографии биомакромолекул. Труды МФТИ. 2009, 1 (1): 94-103.
  12. Цзэнцюн Х., Ганшэн Ч. Идентификация нового кератиноподобного фибриллярного белка в лигаменте двустворчатого моллюска Siliqua radiate и изучение его вторичной структуры. Биохимия. 2011, 76 (11): 1525-1531.
  13. Berkelman T., Stenstedt T. 2-D Electrophoresis. Principles and methods. Amersham Biosciences, 1998.
  14. Giron P., Dayon L., Sanchez J.C. Mass Spectrom. Cysteine tagging for MS-based proteomics. Rev. 2011, 30: 366-395.
  15. Kocher T., Pichler P., Swart R., Mechtler K. Analysis of protein mixtures from whole-cell extracts by single-run nanoLC-MS/MS using ultralong gradients. Nature protocols. 2012, 7 (5): 882-890.
  16. Kruger W, Lery L., Soares M. et al. The phosphate-starvation response in Vibrio cholerae O1 and phoB mutant under proteomic analysis: disclosing functions involved in adaptation, survival and virulence. Proteomics. 2006, 6: 1495-1511.
  17. Kruger M., Moser M., Ussar S. et al. SILAC mouse for quantitative proteomics uncovers kindlin-3 as an essential factor for red blood cell function. Cell. 2008, 134 (2): 353-364.
  18. May D., Fitzgibbon M., Liu Y. et al. A platform for accurate mass and time analyses of mass spectrometry data. J. Proteome Research. 2007, 6: 2685-2694.
  19. McClatchy D.B., Dong M.Q., Wu C.C. et al. 15N metabolic labeling of mammalian tissue with slow protein turnover. J. Proteome Res. 2007, 6 (5): 2005-2010.
  20. Meyer B., Papasotiriou D.G., Karas M. 100% protein sequence coverage: a modern form of surrealism in proteomics. Amino Acids. 2011, 41: 291-310.
  21. Oda Y., Nagasu Т., Chait B.T. Enrichment analysis of phosphorylated proteins as a tool for probing the phosphoproteome. Nat. Biotechnol. 2001, 19: 379-382.
  22. Ong S.E., Blagoev B., Kratchmarova I. et al. Stable isotope labeling by amino acids in cell culture, SILAC, as a simple and accurate approach to expression proteomics. Mol. Cell. Proteomics. 2002, 1 (5): 376-386.
  23. Ryan C., Souda P., Halgand F et al. Confident assignment of intact mass tags to human salivary Cystatins using top-down Fourier-transform ion cyclotron resonance mass spectrometry. J. Am. Soc. Mass Spectrom. 2010, 21: 908-917.
  24. Souda P., Ryan C.M., Cramer WA., Whitelegge J. Profiling of integral membrane proteins and their post translational modifications using high-resolution mass spectrometry. Methods. 2011, 55 (4): 330-336.
  25. Wang R., Zhang H., Qiu H. et al. Proteins involved in difference of sorbitol fermentation rates of the toxigenic and nontoxigenic Vibrio cholerae El Tor strains revealed by comparative proteome analysis. BMC Microbiology. 2009, 9: 135-144.
  26. Wei J., Sun J., Yu W et al. Global proteome discovery using an online three-dimensional LCMS/ MS. J. Proteome Res. 2005, 4(3): 801-808.
  27. Wu S.L., Kim J.K., Bandle R.W et al. Dynamic profiling of the post-translational modifications and interaction partners of epidermal growth factor receptor signaling after stimulation by EGF using extended range proteomic analysis (ERPA). Mol.Cell. Proteomics. 2006, 5: 1610-1627.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2014 Polunina T.A., Varshavskaya Y.S., Grigorieva G.V., Krasnov Y.M.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: ПИ № ФС77-75442 от 01.04.2019 г.


This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies