JoVE Logo

Войдите в систему

Для просмотра этого контента требуется подписка на Jove Войдите в систему или начните бесплатную пробную версию.

В этой статье

  • Резюме
  • Аннотация
  • Введение
  • протокол
  • Результаты
  • Обсуждение
  • Раскрытие информации
  • Благодарности
  • Материалы
  • Ссылки
  • Перепечатки и разрешения

Резюме

Этот протокол иллюстрирует, как исследовать, сравнивать и интерпретировать гликомы белка человека с помощью онлайн-ресурсов.

Аннотация

Инициатива Glyco@Expasy была выдвинута в виде набора взаимозависимых баз данных и инструментов, охватывающих несколько аспектов знаний в области гликобиологии. В частности, он направлен на выявление взаимодействий между гликопротеинами (такими как рецепторы клеточной поверхности) и углеводсвязывающими белками, опосредованными гликанами. Здесь основные ресурсы коллекции представлены на двух иллюстративных примерах, сосредоточенных на N-гликоме человеческого простат-специфического антигена (ПСА) и O-гликоме сывороточных белков человека. С помощью различных запросов к базе данных и с помощью инструментов визуализации в этой статье показано, как исследовать и сравнивать контент в континууме для сбора и корреляции разрозненных фрагментов информации. Собранные данные предназначены для подачи более сложных сценариев функции гликана. Таким образом, введенная здесь гликоинформатика предлагается в качестве средства для усиления, формирования или опровержения предположений о специфичности белкового гликома в данном контексте.

Введение

Гликаны, белки, к которым они присоединены (гликопротеины) и белки, с которыми они связываются (лектины или углеводсвязывающие белки), являются основными молекулярными субъектами на поверхности клетки1. Несмотря на эту центральную роль в клеточно-клеточной коммуникации, крупномасштабные исследования, включая гликомику, гликопротеомику или гликан-интерактомику, по-прежнему скудны по сравнению с их аналогами в геномике и протеомике.

До недавнего времени не были разработаны методы характеристики ветвящихся структур сложных углеводов, еще конъюгированных с белком-носителем. Биосинтез гликопротеинов представляет собой процесс, не управляемый шаблонами, в котором доноры моносахаридов, принимающие гликопротеиновые субстраты, а также гликозилтрансферазы и гликозидазы играют интерактивную роль. Полученные гликопротеины могут иметь сложные структуры с несколькими точками ветвления, где каждый моносахаридный компонент может быть одним из нескольких типов, присутствующих в природе1. Процесс, не управляемый шаблонами, навязывает биохимический анализ в качестве единственного варианта для получения структурных данных олигосахаридов. Аналитический процесс гликовых структур, прикрепленных к нативному белку, часто является сложным, поскольку он требует чувствительных, количественных и надежных технологий для определения моносахаридного состава, связей и ветвящихся последовательностей2.

В этом контексте масс-спектрометрия (МС) является наиболее широко используемым методом в экспериментах по гликомике и гликопротеомике. Со временем они выполняются в более высоких настройках пропускной способности, и данные теперь накапливаются в базах данных. Гликанские структуры в различных форматах3 заполняют GlyTouCan4, универсальное хранилище данных гликана, где каждая структура связана со стабильным идентификатором независимо от уровня точности, с которой определен гликан (например, возможно, отсутствующий тип связи или неоднозначный состав). Собраны очень похожие структуры, но четко указаны их незначительные различия. Гликопротеины описаны и курируются в GlyConnect5 и GlyGen6, двух базах данных, перекрестно ссылающихся друг на друга. Данные о РС, подтверждающие структурные доказательства, все чаще хранятся в GlycoPOST7. Для более широкого охвата онлайн-ресурсов глава 52 справочного пособия «Основы гликобиологии» посвящена гликоинформатике8. Интересно, что программное обеспечение для идентификации гликопептидов распространилось в последние годы9,10, хотя и не в пользу воспроизводимости. Последняя проблема побудила лидеров HUPO GlycoProteomics Initiative (HGI) поставить перед собой задачу программного обеспечения в 2019 году. Данные MS, полученные при обработке сложных смесей N- и O-гликозилированных белков сыворотки крови человека в режимах фрагментации CID, ETD и EThcD, были доступны конкурентам, будь то пользователи программного обеспечения или разработчики. Полный отчет о результатах этой задачи11 изложен только здесь. Начнем с того, что наблюдалось распространение идентификаций. Это в основном интерпретировалось как вызванное разнообразием методов, реализованных в поисковых системах, их настроек и того, как выводы были отфильтрованы, а пептиды «подсчитаны». Экспериментальный дизайн, возможно, также поставил некоторое программное обеспечение и подходы в (не)преимущество. Важно отметить, что участники, использующие одно и то же программное обеспечение, сообщили о противоречивых результатах, тем самым подчеркнув серьезные проблемы с воспроизводимостью. Путем сравнения различных представлений был сделан вывод о том, что некоторые программные решения работают лучше, чем другие, а некоторые стратегии поиска дают лучшие результаты. Эта обратная связь, вероятно, будет способствовать совершенствованию автоматизированных методов анализа данных о гликопептидах и, в свою очередь, повлияет на содержание базы данных.

Расширение гликоинформатики привело к созданию веб-порталов, которые предоставляют информацию и доступ к множеству аналогичных или дополняющих ресурсов. Самые последние и актуальные из них описаны в главе серии книг Comprehensive Glycoscience12, и благодаря сотрудничеству предлагается решение для обмена данными и информацией в режиме открытого доступа. Был разработан один из таких порталов, который первоначально назывался Glycomics@ExPASy 13 и переименован Glyco@Expasy, после капитального ремонта платформы Expasy14, в которой в течение десятилетий размещалась большая коллекция инструментов и баз данных, используемых в нескольких -omics, самым популярным элементом является UniProt15 - универсальная база знаний о белках. Glyco@Expasy предлагает дидактическое обнаружение назначения и использования баз данных и инструментов на основе визуальной категоризации и отображения их взаимозависимостей. Следующий протокол иллюстрирует процедуры для изучения данных гликомики и гликопротеомики с выбором ресурсов из этого портала, который делает связь между гликопротеомикой и гликкан-интерактомикой явной через гликомику. Эксперименты с гликомикой создают структуры, в которых моносахариды полностью определены и связи частично или полностью определены, но их прикрепление к белковому участку плохо, если вообще характеризуется. Напротив, эксперименты по гликопротеомике генерируют точную информацию о прикреплении сайта, но с плохим разрешением гликановых структур, часто ограниченных моносахаридными композициями. Эта информация собрана в базу данных GlyConnect. Кроме того, инструменты поиска в GlyConnect могут быть использованы для обнаружения потенциальных гликановых лигандов, которые описаны вместе с белками, распознающими их в UniLectin16, связанными с GlyConnect через гликаны. Протокол, представленный здесь, разделен на два раздела, чтобы охватить вопросы, специфичные для N-связанных и O-связанных гликанов и гликопротеинов.

протокол

ПРИМЕЧАНИЕ: Требуется устройство с подключением к Интернету (предпочтительно большой экран) и современным веб-браузером, таким как Chrome или Firefox. Использование Safari или Edge может быть не таким надежным.

1. От белка N-гликома в GlyConnect до лектина UniLectin

  1. Доступ к ресурсам из Glyco@Expasy
    ПРИМЕЧАНИЕ: Процедура, описанная здесь, предназначена для доступа к GlyConnect, но может быть применена к доступу к любому ресурсу, записанному на платформе.
    1. Перейдите в https://glycoproteome.expasy.org/glycomics-expasy и рассмотрите пузырьковую диаграмму справа, показывающую различные категории, такие как гликоконъюгаты или связывание гликанов. В крайнем левом меню, отражающем категории в пузырьках, установите флажок Гликопротеины , чтобы пузырьковая диаграмма справа сразу же увеличила пузырь, соответствующий этой категории.
      ПРИМЕЧАНИЕ: Зеленые пузырьки - это инструменты, а желтые пузыри - это базы данных. Нажатие на любой из них снова увеличивает масштаб, чтобы предоставить подробную информацию о ресурсе. Прежде чем сделать это, пользователь может захотеть понять зависимости этого ресурса от других.
    2. Чтобы получить сведения о зависимостях, перейдите с вкладки Тематическая классификация ресурсов на вкладку Колесо зависимостей ресурсов . Поместите мышь на GlyConnect в колесо, чтобы проверить уровень его интеграции с другими источниками (рисунок 1).
    3. Вернитесь на вкладку Тематическая классификация ресурсов , чтобы открыть пузырь GlyConnect , как на шаге 1.1.1, и нажмите на него (дополнительный рисунок 1), чтобы отобразить домашнюю страницу GlyConnect в новой вкладке, которая показывает статистику содержимого в последнем выпуске базы данных.
      ПРИМЕЧАНИЕ: Цветовая схема, описанная в таблице 1 , соответствует различным типам информации, хранящейся в базе данных. Этот цветовой код действителен на всех страницах сущностей в GlyConnect и согласован во всем. На домашней странице также отображаются четыре раздела, посвященные сфокусированным наборам данных, таким как те, которые описывают гликозилирование спайкового белка Sars-Cov-2 (COVID-19) или подробно описывают олигосахариды грудного молока (HMO). Они не будут изучаться в настоящем протоколе.
  2. Изучение контекстуальной информации белка N-гликома
    ПРИМЕЧАНИЕ: Все структуры гликана в GlyConnect отображаются в трех альтернативных и часто используемых форматах: (1) Номенклатура символов для гликанов (SNFG)17 (2) ИЮПАК конденсированный18и (3) Оксфорд19. Напротив, не существует стандартной нотации для выражения гликанового состава. В GlyConnect используется следующий код: Hex для гексозы, HexNAc для N-ацетилгексозамина, dHex для фукозы и NeuAc для сиаловых кислот. Для простоты инструменты визуализации полагаются на конденсированную нотацию: H для гексозы, N для N-ацетилгексозамина, F для фукозы и S для сиаловых кислот. Кроме того, маленькие буквы обозначают модификации, такие как «a» для ацетилирования, «p» для фосфорилирования и «s» для сульфатации, для наиболее частых из этих так называемых заместителей.
    1. Чтобы просмотреть и исследовать N-гликом человеческого простат-специфического антигена (ПСА) с домашней страницы GlyConnect, выполните следующие действия.
      ПРИМЕЧАНИЕ: Гликозилирование ПСА человека изучалось на протяжении многих лет, особенно в контексте рака предстательной железы. База данных GlyConnect хранит три ссылки20,21,22, которые объединяют данные о гликомике и гликопротеомике. Обратите внимание, что результаты, представленные здесь, были получены с выпуском GlyConnect за сентябрь 2021 года. Скрытое использование базы данных может привести к несколько иной статистике из-за частого обновления данных.
    2. Нажмите кнопку PROTEIN , чтобы открыть представление белка базы данных. На странице просмотра белка введите простату в окне поиска. Найдите две записи, перечисленные в выходных данных, различающие две изоформы PSA с различными значениями pI. Нажмите на 790 (столбец Id), соответствующий общей изоформе PSA.
      ПРИМЕЧАНИЕ: Найдите верхнюю разноцветную панель, которая показывает сводную информацию, извлеченную из опубликованной работы, в схеме, подробно описанной выше. Возможны несколько вариантов навигации, как описано ниже.
    3. На верхней разноцветной панели нажмите на кнопку SOURCE зеленым цветом , чтобы отобразить типы образцов, из которых были обработаны опубликованные данные: Моча и Семенная жидкость. Чтобы просмотреть эту информацию, щелкните любой из этих типов образцов. То же самое относится к любому элементу, который появляется при нажатии на цветную кнопку.
    4. Чтобы проверить связанное со здоровьем содержимое базы данных, нажмите кнопку DISEASE , которая содержит два элемента, один из которых рак предстательной железы , который ссылается на соответствующую специальную страницу болезней в GlyConnect. Резюме для этой страницы показывает, что три крупномасштабных исследования сообщили о 319 композициях на 1087 участках, обнаруженных в 308 белках человека.
    5. Нажмите на кнопку СТРУКТУРА , чтобы просмотреть полный список из 135 структур, связанных с ПСА, из данных о гликомике. Нажмите на кнопку СОСТАВ для соответствующих 78 композиций, определенных экспериментами по гликопротеомике. Нажмите на любую структуру или композицию, чтобы получить дополнительную информацию.
      ПРИМЕЧАНИЕ: Можно получить такие детали, как список альтернативных белков, несущих конкретную структуру, или список структур, соответствующих композиции. Известно, что ПСА имеет только один участок N-гликозилирования в Asn-69 (только один элемент учитывается для коричневой кнопки SITE ).
    6. Чтобы уменьшить неоднозначность композиций, нажмите на ПРЕДЛОЖЕННЫЙ STRUCT под выбранной композицией (например, Hex:6 HexNAc:3 NeuAc:1). Предложение делается каждый раз, когда количество моносахаридов совпадает с количеством структуры, перечисленной выше (рисунок 2).
      ПРИМЕЧАНИЕ: Композиция Hex:6 HexNAc:3 NeuAc:1, полученная в результате эксперимента по гликопротеомике, соответствует четырем структурам с более высоким разрешением из данных гликомики. В случае ПСА нет никакой неопределенности сайта, которую необходимо устранить, поскольку только Asn-69 является гликозилированным.
    7. Чтобы полностью изучить страницу белка, просмотрите более подробную информацию в правой части страницы (рисунок 3).
      1. Просмотрите запись 3QUM PDB (Protein Data Bank23) по умолчанию для PSA, которая показана с двумя сложными гликанами, прикрепленными к каждому мономеру (рисунок 3), или альтернативную запись 2ZCK , которая также доступна из-за присоединенного углевода. Вторая запись показывает одну цепочку.
        ПРИМЕЧАНИЕ: Обе записи визуализируются с помощью плагина 3D LiteMol24 , который отображает гликаны в нотации SNFG-3D, принятой в PDB-RCSB.
      2. Нажмите на соответствующие ссылки других перекрестных ссылок, чтобы изучить соответствующую функциональную информацию из основных баз данных протеомики, таких как UniProt (рисунок 3).
  3. Визуализация и корреляция контекстуальной информации белка N-гликомы
    ПРИМЕЧАНИЕ: Как видно из предыдущего раздела, длинные списки структур или композиций может быть трудно воспринимать в целом, и GlyConnect полагается на два разных инструмента для визуализации ключевой информации, а именно, GlyConnect Octopus и GlyConnect Compozitor (первый расширяет сводную информацию, собранную в цветных кнопках, а второй выявляет структурные зависимости с точки зрения структуры / композиции, содержащейся в другом). Как показано ниже, GlyConnect Octopus исследует связи между различными сущностями, хранящимися в базе данных, выделяя несколько или одиночные соединения в качестве отражения содержимого базы данных.
    1. Выполните поиск GlyConnect Octopus, чтобы подтвердить наличие общих структурных признаков, таких как гибридные структуры ядра и очень частые структуры, содержащие сиаловую кислоту, в разнообразии гликанов, прикрепленных к ПСА, как описано ниже.
    2. Перейдите на домашнюю страницу Octopus https://glyconnect.expasy.org/octopus/. Оставьте вкладку N-linked выбранной по умолчанию. Перейдите на вложенную вкладку Ядра и щелкните значок Гибрид . Перейдите на подвкладку Свойства и щелкните значок Sialylated . Нажмите на зеленую кнопку Поиск ниже.
      ПРИМЕЧАНИЕ: Результаты поиска графически отображаются в виде связей между тремя категориями элементов. По умолчанию центральный список соответствует запросу композиций, левая коллекция охватывает связанные белки, а правая — связанные гликаны.
    3. На отображаемом графике отношений наведите курсор на H6N4F1S1 , чтобы выделить связи с шестью белками и тремя структурами. Сравните это, наведя курсор на H6N4F2S1 , который выделяет две изоформы PSA (обе называются UniProt ID: KLK3_HUMAN) и одну структуру (ID: 10996). Наведите указатель мыши на идентификатор структуры, чтобы отобразить ее представление SNFG, и нажмите на нее, чтобы открыть соответствующую страницу (дополнительный рисунок 2).
    4. Измените узлы Octopus на любую другую тему, описывающую контекст гликозилирования. Цветовой код остается таким же, как и описанный ранее (см. таблицу 1).
      1. Измените Центральные узлы на Ткани, чтобы отобразить 15 вариантов в середине графика, многие из которых являются жидкостями организма. Ищите все ассоциации между белками и гликанами, соответствующие запросу в зависимости от информации о тканях. Поместите курсор на Моча или Семенная жидкость в середине графика, чтобы просмотреть различные ассоциации (рисунок 4A,B).
      2. Измените Центральные узлы на Болезнь , чтобы отобразить 13 вариантов, одним из которых является Рак предстательной железы. Единственным ассоциированным белком является ПСА (KLK3_HUMAN) (дополнительный рисунок 3).
        ПРИМЕЧАНИЕ: Более пристальный взгляд на N-гликом ПСА, показанный на странице белка, выделяет очень высокую частоту терминального NeuAc(a?-?) Гал(б?-?) Подструктура GlcNAc во многих случаях на структурах с двумя или тремя антеннами. Другой осьминог может быть сгенерирован на этой основе, как описано ниже.
    5. Нажмите кнопку Очистить , чтобы обновить поиск. Перейдите на подвкладку Свойства и щелкните значок Би-антенны . Перейдите на подвкладку Определители и щелкните значок 3-Sialyl-LN (тип 2 ). Нажмите на зеленую кнопку Поиск ниже.
    6. Проверьте ассоциации, полученные осьминогом, с биантенными гликанами, содержащими терминальный мотив 3-Sialyl-LN (тип 2), т.е. NeuAc(a1-3)Gal(b1-4)GlcNAc. Измените центральные узлы на ткани для облегчения чтения и наведите курсор на KLK3_HUMAN , чтобы напрямую соединить семенную жидкость с общей изоформой ПСА и семью структурами (дополнительный рисунок 4).
      ПРИМЕЧАНИЕ: Второй инструмент визуализации, GlyConnect Compozitor, выполняет сканирование потенциальных отношений между каждой композицией в их списке (см. Ниже). Связь определяется как отличающаяся только от одного моносахарида между двумя композициями. Эти идентифицированные отношения, построенные на графике, обнажают (дис)непрерывность гликома.
    7. Используйте GlyConnect Compozitor для сканирования потенциальных связей между каждой композицией в их списке, как показано ниже для случая PSA.
      ПРИМЕЧАНИЕ: GlyConnect Compozitor обрабатывает композиции в сочетании с контекстом. Он предлагает отдельные вкладки для запроса GlyConnect, например, Белки, Источники, Клеточные линии, Заболевания, которые говорят сами за себя, чтобы квалифицировать контекст. Это проиллюстрировано здесь с помощью PSA следующим образом.
    8. Вернитесь на страницу белка ПСА: https://glyconnect.expasy.org/browser/proteins/790. В правой части страницы ввода PSA нажмите на ссылку Compozitor. Убедитесь, что поля поиска Compozitor предварительно заполнены сведениями о записи Id 790 на вкладке «Белок» (Белок: простат-специфический антиген, Вид: Homo sapiens и Glycan Type: N-linked).
    9. Нажмите кнопку Добавить в выбор , чтобы получить данные из базы данных и отобразить график связанных композиций. Снимите флажок Включить виртуальные узлы . Нажмите кнопку Compute Graph , чтобы отобразить график, показывающий хорошо связанный набор из 78 композиций, представляющих N-гликом PSA, и гистограмму, показывающую основные характеристики гликанов.
    10. Наведите курсор на фиолетовую полосу на штриховом графике, которая находит все сиалилированные структуры на графике, чтобы выявить наблюдаемое смещение в сторону сиалилированных структур.
    11. Оставайтесь в главной вкладке «Белок» и выберите простат-специфический антиген - высокую изоформу Pi (psah) в поле «Белок » (имя).
      ПРИМЕЧАНИЕ: Поля Glycan Type и Glycan Site заполняются автоматически.
    12. Нажмите кнопку Добавить в выбор , чтобы получить данные из базы данных, которая составляет 57 композиций. Нажмите кнопку Compute Graph , чтобы сгенерировать наложенные графики обеих изоформ и оценить различия в гликомах двух изоформ PSA. Наведите указатель мыши на метки узлов, чтобы отобразить количество структур, соответствующих композициям/меткам (рисунок 5).
  4. Информация о привязке гликана в UniLectin
    ПРИМЕЧАНИЕ: Вспомним определитель, протестированный в Octopus, описанный как NeuAc(a2-3)Gal(b1-4). По определению, он является установленной связующей частью структуры гликана и, как таковой, может быть найден в базе данных UniLectin3D25.
    1. Перейдите в https://www.unilectin.eu/ и нажмите кнопку UniLectin3D . Кроме того, непосредственно перейдите на страницу: https://www.unilectin.eu/unilectin3D/.Click на кнопку Glycan Search , чтобы открыть эту страницу: https://www.unilectin.eu/unilectin3D/glycan_search (дополнительный рисунок 6).
    2. Нажмите на фиолетовый бриллиант, представляющий сиаловую кислоту, который побуждает отображать все мотивы связывания гликана, заканчивающиеся сиаловой кислотой, хранящейся в базе данных. Верхняя часть этой коллекции мотивов содержит мотив NeuAc(a2-3)Gal(b1-4)GlcNAc, исследованный ранее (дополнительный рисунок 7).
    3. Нажмите на мотив NeuAc(a2-3)Gal(b1-4)GlcNAc , чтобы вызвать отображение всех лектинов, для которых известна 3D-структура, подтверждающая взаимодействие с NeuAc(a2-3)Gal(b1-4)GlcNAc. Результат по умолчанию показывает лектины у всех видов. Используйте параметр Поиск по полю , чтобы ограничить представление информацией, ориентированной на человека.
    4. Нажмите на опцию Поиск по полю . В видовом поле тип Homo sapiens. Нажмите кнопку «Исследовать рентгеновские структуры», чтобы отфильтровать исходный список. Остается только одна запись, т.е. человеческий галектин-8. Нажмите кнопку «Просмотреть 3D-структуру и информацию» в правом верхнем углу перечисленного элемента, чтобы отобразить подробную информацию о человеческом галектине-8, взаимодействующем с NeuAc(a2-3)Gal(b1-4)GlcNAc.
    5. Получите доступ к структурной информации о человеческом галектине-8, отображаемой на странице с двумя разными зрителями.
      1. Удерживайте мышь, чтобы развернуть молекулу и вывести лиганд на передний план с помощью встроенного программного обеспечения Litemol26, чтобы показать структуру лектина 3D. Наведите указатель мыши на одно из перечисленных взаимодействий слева, чтобы обновить представление справа и определить, где это конкретное взаимодействие действует в структуре с программным обеспечением PLIP27, интегрированным для детализации атомных взаимодействий между лектином и лигандом (рисунок 6).
    6. Нажмите на любую зеленую кнопку, которая ссылается на соответствующие записи в UniProt, PDB (европейские или американские сайты) и GlyConnect, чтобы изучить эти перекрестные ссылки.

2. Изучение и сравнение O-гликом в GlyConnect

  1. Просмотр набора данных HGI Challenge с высокой степенью достоверности
    ПРИМЕЧАНИЕ: Набор данных HGI, упомянутый во введении, хранится в базе данных GlyConnect. Он содержит 163 N- и 23 O-гликопептидов, обнаруженных в 37 гликопротеинах, рассматриваемых как список с высокой степенью достоверности. GlyConnect Compozitor28 является ключом к оценке согласованности данных о гликоме. Важно отметить, что Compozitor допускает виртуальные узлы (показаны серым цветом), когда для подключения изолированных узлов требуется только один промежуточный шаг. Таким образом, виртуальные узлы затягивают граф и могут быть интерпретированы как структуры, потенциально пропущенные в экспериментальных результатах.
    1. Просмотрите набор данных HGI с домашней страницы GlyConnect, перейдя непосредственно на справочную страницу статьи: https://glyconnect.expasy.org/browser/references/2943.
      ПРИМЕЧАНИЕ: Резюме в цветных кнопках частично отражает цифры, приведенные в статье. Тем не менее, если перечислены только 69 уникальных пептидов, это отражает множественные связи между пептидами и сайтами или структурами. В статье гликопептид определяется как уникальное сочетание пептида и композиции. В GlyConnect сначала рассматриваются гликозиты, и они описываются как комбинация пептида со структурами. Это объясняет расхождение в цифрах между GlyConnect и приведенной выше цитатой.
    2. Проверить высокую частоту встречаемости N-связанных композиций, таких как Hex:5 HexNAc:4 NeuAc:2, идентифицированных на 42 участках в 43 пептидах, в отличие от частой уникальности большинства O-связанных композиций, идентифицированных на 1 участке в 1 пептиде.
    3. Щелкните ссылку Compozitor в правой части страницы справочной записи, чтобы оценить согласованность набора данных. Убедитесь, что инструмент Compozitor напрямую обрабатывает DOI ссылки и заполняет поле поиска ссылкой =10.1101/2021.03.14.435332 на вкладке Дополнительно инструмента. Тип &glycan_type=O-linked после номера DOI, чтобы сузить поиск до O-связанных гликанов, чтобы запрос стал следующим: ссылка=10.1101/2021.03.14.435332&glycan_
      type=O-linked
    4. Нажмите кнопку Добавить в выбор , чтобы получить данные из базы данных (есть 20 O-связанных композиций). Оставьте выбранным параметр Включить виртуальные узлы . Нажмите кнопку Compute Graph , чтобы отобразить график связанных композиций. Этот результат подчеркивает несколько пробелов в ожидаемой непрерывности биосинтеза гликана с девятью виртуальными узлами, необходимыми для завершения графика (рисунок 7).
  2. Сравнение с О-гликомом выбранного сывороточного белка в GlyConnect
    ПРИМЕЧАНИЕ: Чтобы оценить, могут ли пробелы быть заполнены данными, хранящимися в GlyConnect, был выбран один O-гликозилированный белок из 37 перечисленных со ссылкой. В наборе данных ингибитор интер-альфа-трипсина тяжелой цепи H4 (Q14624), как сообщается, является O-гликозилированным на Thr-725.
    1. Перейдите на вкладку Белок в GlyConnect Compozitor (см. шаг 2.1.3). Из списка белков выберите ингибитор интер-альфа-трипсина с тяжелой цепью H4. Убедитесь, что по умолчанию выбрано значение Homo sapiens. Снимите флажок N-linked в типе Glycan. Выберите только Thr-725 в списке Сайт, сначала щелкнув знак минус слева от Сайта, чтобы отменить выбор всех сайтов, а затем выбрав только Thr-725 из списка.
    2. Нажмите кнопку «Добавить в выбор» (обратите внимание, что шесть композиций связаны с Thr-725). Нажмите кнопку Compute Graph , чтобы отобразить график связанных композиций (дополнительный рисунок 8).
    3. Обратите внимание на отображаемый график, который показывает 17 уникальных композиций из 20 O-связанных композиций набора данных статьи синим цветом и три уникальные из шести в базе данных красным цветом. Другими словами, перекрытие между двумя источниками присутствует в трех композициях, которые представлены в пурпурном цвете. Обратите внимание, что поворот графика на 45° генерируется автоматически.
      ПРИМЕЧАНИЕ: Количество виртуальных узлов уменьшается на один. Как выясняется, H2N2S1, отсутствующий в 20 O-связанных композициях набора данных статьи и представленный в виде виртуального узла, теперь заполнен дополнительной композицией, связанной с Thr-725 ингибитора интер-альфа-трипсина тяжелой цепи H4 в базе данных. Это упрощает топологию графа, поскольку два других виртуальных узла становятся бесполезными, поскольку они были альтернативными вариантами заполнения разрыва между H1N2S1 и H2N2S2. Тем не менее, вторая композиция, импортированная из базы данных, была бы изолирована, если бы не создание двух новых альтернативных виртуальных узлов H2N2F1S1 и H1N2F2S1.
    4. Чтобы разобраться в виртуальных узлах, проверьте, присутствуют ли соответствующие композиции в GlyConnect. Для этого нажмите на кнопку Экспорт под графиком. Выберите Только виртуальный , отменив выбор всех остальных параметров. Нажмите на значок буфера обмена, чтобы скопировать подборку из 8 композиций.
    5. Вставьте выделенную область в окно запроса вкладки Compozitor Пользовательский . Выберите O-linked в поле Тип Гликана . Задайте для параметра «Метка выделения» в поле «Композиции » значение, например, VN, чтобы присвоить списку из 8 композиций. Нажмите кнопку Добавить в выбор , а затем кнопку Compute Graph . Все виртуальные узлы теперь отображаются в виде зеленых узлов (рисунок 8).

Результаты

Первая часть протокола (раздел 1) показала, как исследовать специфичность или общность N-гликанов, прикрепленных к Asn-69 человеческого простат-специфического антигена (ПСА) с помощью платформы GlyConnect. Тканезависимые (моча и семенная жидкость), а также изоформ-зависимые (нормальные и высоки?...

Обсуждение

GlyConnect Octopus как инструмент для выявления неожиданных корреляций
GlyConnect Octopus изначально был разработан для запроса базы данных со свободным определением гликанов. Действительно, в литературе часто сообщается об основных характеристиках гликанов в гликоме, таких как фукозилир?...

Раскрытие информации

Авторы заявляют об отсутствии конфликта интересов.

Благодарности

Автор тепло приветствует прошлых и нынешних членов Proteome Informatics Group, участвующих в разработке ресурсов, используемых в этом учебнике, в частности, Жюльена Мариетоза и Кэтрин Хейс для GlyConnect, Франсуа Боннарделя для UniLectin, Давиде Алокчи и Фредерика Никитина для Octopus и Тибо Робина для Compozitor и последнего штриха к Octopus.

Разработка проекта glyco@Expasy поддерживается федеральным правительством Швейцарии через Государственный секретариат по вопросам образования, исследований и инноваций (SERI) и в настоящее время дополняется Швейцарским национальным научным фондом (SNSF: 31003A_179249). ExPASy поддерживается Швейцарским институтом биоинформатики и размещается в Центре компетенций Vital-IT. Автор также выражает признательность Энн Имберти за выдающееся сотрудничество на платформе UniLectin, совместно поддерживаемой ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Материалы

NameCompanyCatalog NumberComments
internet connectionuser's choice
recent version of web browseruser's choice

Ссылки

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Перепечатки и разрешения

Запросить разрешение на использование текста или рисунков этого JoVE статьи

Запросить разрешение

Смотреть дополнительные статьи

179

This article has been published

Video Coming Soon

JoVE Logo

Исследования

Образование

О JoVE

Авторские права © 2025 MyJoVE Corporation. Все права защищены