Биоформатика — это использование компьютеров для решения вопросов биологии. Гликоинформатика — это использование компьютеров для решения вопросов в биологии глико. С помощью гликоинформатики мы разрабатываем базы данных, которые хранят данные о гликомике или гликопротеомике, которые можно просматривать или искать, а также разрабатываем инструменты для визуализации и сравнения этих данных.
Роль гликанов все чаще признается как важная в здоровье и болезнях, и гликоинформатика пытается продвинуть это вперед. Кэтрин Хейс обучается биологии глико и работает специалистом по данным. Жюльен Мариетоз обучается информатике и координирует разработку баз данных и инструментов.
Зайдите на сайт glycoproteome.expasy. org/glycomics-expasy и в крайнем левом меню отметьте гликопротеины. Пузырьковая диаграмма справа увеличит масштаб пузырька, соответствующего этой категории, затем нажмите на пузырь GlyConnect, чтобы открыть домашнюю страницу GlyConnect в новой вкладке.
Выберите кнопку белка и на странице просмотра белка введите простату в окне поиска. Нажмите на 790, соответствующий общей изоформе простатспецифического антигена или ПСА. Затем на верхней разноцветной панели нажмите на кнопку источника зеленым цветом, чтобы отобразить типы образцов, из которых были обработаны опубликованные данные.
Нажмите на кнопку болезни, чтобы проверить содержимое базы данных, связанное со здоровьем. Затем нажмите на кнопку структуры, чтобы просмотреть полный список из 135 структур, связанных с ПСА, из данных о гликомике. Нажмите на кнопку композиции для соответствующих 78 композиций, определенных экспериментами по гликопротеомике.
Нажмите на любую структуру или композицию, чтобы получить дополнительную информацию. Чтобы уменьшить неоднозначность композиций, нажмите на предложенную структуру под выбранной композицией. Предложение делается каждый раз, когда количество моносахаридов совпадает с количеством перечисленных структур.
Чтобы полностью изучить страницу белка, просмотрите дополнительные сведения в правой части страницы. Перейдите на домашнюю страницу Octopus, чтобы подтвердить наличие общих структурных признаков в разнообразии гликанов, прикрепленных к PSA, сохраните вкладку N-Linked выбранной по умолчанию, перейдите на подвкладку ядра и нажмите на значок гибрида. Затем перейдите на подвкладку свойств, выберите сиалированный значок и нажмите на зеленую кнопку поиска.
На отображаемом графике отношений наведите курсор на H6N4F1S1, чтобы выделить связи с семью белками в трех структурах. Сравните это, наведя курсор на H6N4F2S1, который выделяет две изоформы ПСА. Наведите курсор на идентификатор структуры, чтобы отобразить ее представление SNFG, и нажмите на нее, чтобы открыть соответствующую страницу.
Измените центральные узлы на ткани, а затем поместите курсор на мочу или семенную жидкость в середине графика, чтобы просмотреть различные ассоциации. Измените центральные узлы на болезнь, чтобы отобразить 13 вариантов, одним из которых является рак предстательной железы. Единственным ассоциированным белком является ПСА.
Затем нажмите на кнопку очистки, чтобы обновить поиск. Перейдите на подвкладку свойств и нажмите на значок двух антенн. Затем перейдите к подвкладке определители, выберите значок 3-sialyl-LN, введите два и нажмите на зеленую кнопку поиска.
Проверьте ассоциации, полученные осьминогом, с биантенными гликанами, содержащими терминальный мотив 3-сиалил-LN типа два. Измените центральные узлы на ткани для более легкого считывания и наведите курсор на KLK3_human, чтобы напрямую соединить семенную жидкость с общей изоформой ПСА и семью структурами. Вернитесь на страницу белка, в данном случае ПСА, чтобы выполнить сканирование потенциальных отношений между каждой композицией в их списке.
В правой части страницы ввода PSA нажмите на ссылку Compozitor. Убедитесь, что поля поиска Compozitor предварительно заполнены сведениями о записи ID 790 на вкладке белка. Нажмите кнопку добавить в выбор, чтобы получить данные из базы данных.
Снимите флажок включить виртуальные узлы, а затем нажмите кнопку вычислительного графика, чтобы отобразить график, показывающий хорошо связанный набор из 78 композиций, представляющих N-гликом PSA, и гистограмму, показывающую основные характеристики гликанов. Оставайтесь в основной белковой вкладке и выбирайте простатспецифический антиген с высоким пи-изоформой в белковом поле. Нажмите кнопку добавить в выбор, чтобы получить данные из базы данных, которая составляет 57 композиций.
Нажмите кнопку вычисления графа, чтобы сгенерировать наложенные графики обеих изоформ и оценить различия в гликомах двух изоформ ПСА. Перейдите на сайт www.unilectin. eu и нажмите на кнопку UniLectin3D.
Нажмите на кнопку поиска гликана, затем нажмите на фиолетовый бриллиант, представляющий собой сиаловую кислоту, которая побуждает отображать все мотивы связывания гликана, заканчивающиеся сиаловой кислотой, хранящейся в базе данных. Нажмите на мотив 3-sialyl-LN типа два, чтобы предложить отображение всех лектинов, для которых известна 3D-структура, подтверждающая взаимодействие с 3-сиалил-LN типа два. Параметр поиска по полю.
В видовом поле тип Homo sapiens. Нажмите кнопку исследовать рентгеновские структуры, чтобы отфильтровать исходный список. Остается только одна запись, то есть человеческий галектин-8.
Нажмите на кнопку просмотра 3D-структуры и информации, чтобы отобразить подробную информацию о галектине-8 человека, взаимодействующем с 3-сиалил-LN типа два. Получите доступ к структурной информации о человеческом галектине-8, отображаемой на странице с двумя разными зрителями. Удерживайте мышь, чтобы развернуть молекулу и вывести лиганд на передний план с помощью программного обеспечения LiteMol.
Наведите указатель мыши на перечисленные взаимодействия слева, чтобы обновить представление справа и определить, где это конкретное взаимодействие действует в структуре с программным обеспечением PLIP. Просмотрите набор данных HGI с домашней страницы GlyConnect, перейдя непосредственно к указанной статье на этой странице. Щелкните ссылку Compozitor в правой части страницы справочной записи, чтобы оценить согласованность набора данных.
Поле поиска уже будет заполнено ссылкой, равной номеру DOI в расширенной вкладке инструмента. Введите glycan_type=O-linked после номера DOI, чтобы сузить поиск до O-связанных гликанов. Затем нажмите кнопку добавить в выбор, чтобы получить данные из базы данных.
Оставьте выбранным параметр включить виртуальные узлы и нажмите кнопку вычислительного графа, чтобы отобразить график связанных композиций. Перейдите на белковую вкладку GlyConnect Compozitor и из списка белков выберите ингибитор интер-альфа-трипсина с тяжелой цепью H4. Убедитесь, что выбор вида по умолчанию является Homo sapiens. Снимите флажок N-Linked в типе гликана.
Выберите только THR 725 в списке сайтов и нажмите на кнопку добавить в выбор. Затем нажмите кнопку вычисляемого графа, чтобы отобразить график связанных композиций. Чтобы разобраться в виртуальных узлах, нажмите на кнопку экспорта под графиком.
Выберите только виртуальный и нажмите на иконку буфера обмена, чтобы скопировать подборку из восьми композиций. Вставьте выделенную область в окно запроса пользовательской вкладки Compozitor. Установите метку выделения в поле композиций, выберите O-Linked в поле типа гликана и нажмите кнопку добавить в выбор.
Наконец, нажмите кнопку вычислительного графа. Тканезависимые ассоциации между белками и гликанами показаны в этом выходе GlyConnect Octopus. Все человеческие белки, несущие гибридные и сиалилированные гликановые структуры с тканями, в которых они экспрессируются, отображаются в этом выходе.
Ассоциации с мочой выделены, показывая два белка, хориогонадотропин или GLHA человека и PSA common isoform или KLK3 человека, связанные с рассеянными гликанными структурами. Аналогичным образом, выделены ассоциации с семенной жидкостью, показывающие две белковые изоформы ПСА, связанные с сгруппированными гликанными структурами. Наложенные N-гликомы двух изоформ ПСА показаны на выходе GlyConnect Compozitor.
Синие узлы представляют гликаны, связанные с общей изоформой, а узлы изоформы с высоким Пи представлены в виде красных узлов. Перекрытие между гликомами показано в виде пурпурных узлов. Числа внутри узлов представляют собой количество гликанских структур, соответствующих маркированной композиции в соответствии с содержимым базы данных GlyConnect относительно PSA.
Было показано, что гликом ПСА, отображаемый в GlyConnect, коррелирует с галектином-8, отображаемым в UniLectin3D через концевой эпитоп 3-сиалил-LN типа два. Это обеспечивает вероятный, но не гарантированный сценарий белково-белковых взаимодействий, опосредованных гликанами. Высококачественный набор композиций O-гликана, связанных с сывороткой крови человека, был изучен и сопоставлен с содержимым базы данных GlyConnect, тем самым предлагая возможность настройки файла композиции гликана для уточненной идентификации гликопептидов.
Он может опираться на минимальный набор из 20 композиций, доступных из одного набора данных, или быть дополнен 23-26 элементами, рационально собранными в GlyConnect для повышения согласованности набора. Из этого протокола важно помнить, что гликом не может ограничиваться списком предметов. И что именно с помощью инструментов гликоинформатики вы можете показать зависимости между этими элементами, которые в конечном итоге объяснят их функцию.