Анализ сигнала к шуму на уровне аминокислот, обеспечивает меру вероятности того, что генетический вариант связан с состоянием заболевания, или является частью естественных генетических изменений в популяции. Этот метод использует два больших генетических ресурсов, связанных с болезнями мутаций, доступных в литературе, или в общественном достоянии с населением на основе exsome и генома исследований, которые определяют редкие генетические дисперсии. Чтобы определить конкретный ген и сращивание isoform интереса, откройте домашнюю страницу Ensembl и выберите вид из меню высадки.
Введите аббревиатуру для гена интереса, и нажмите кнопку идти. Выберите ссылки, соответствующие гену интереса и транскрипционные интересы, и идентификатор интереса из таблицы Стенограмма. Обратите внимание на стенограмму конкретной рнк стенограммы и белковый продукт РНК стенограммы идентификационных номеров в колонке эталонной последовательности таблицы стенограммы для будущей ссылки.
Выберите ссылку, связанную с белковый продукт РНК стенограмма ID номер, чтобы открыть новую веб-страницу из Национального центра биотехнологической информации, или NCBI Белковая база данных, и прокрутите вниз в раздел происхождения, чтобы получить первичную последовательность белка для гена стенограммы интереса. Затем прокрутите до раздела Особенности, чтобы получить список белковых функций. Чтобы вычислить незначительную частоту аллелей для каждого аминокислотного положения с вариантом управления, откройте таблицу, способную к графику, и создайте столбец позиций всех экспериментальных вариантов.
Удалите тексты вариантов, чтобы оставить только вариант позиции и сортировать варианты в восходящем значении, чтобы определить, какие позиции имеют более одного связанного варианта. Получить сумму всех незначительных частот аллелей для данной позиции, объединив незначительную частоту аллелей для каждого варианта, связанного с данной позицией, и рассчитать незначительную частоту аллелей для каждой аминокислотной позиции с экспериментальным вариантом. Далее создайте столбец аминокислотных позиций, которые имеют экспериментальные варианты, и вычислить незначительную частоту аллелей всех вариантов, связанных с этой позицией для всех вариантов позиций.
Чтобы создать скользящее среднее значение незначительных частот аллелей как для экспериментальных, так и для контрольных вариантов, создайте столбец, содержащий все аминокислотные позиции в гене интереса, и добавьте незначительную частоту аллелей ноль для всех позиций, которые не имеют вариантов как для управления, так и для экспериментальных наборов данных. Чтобы создать скользящее среднее значение для каждого экспериментального и контрольного столбца распространенности, создайте столбец, представляющий скользящую среднюю частоту незначительного аллеля как для элементов управления, так и для экспериментальных наборов данных, а в скользящем среднем столбце поместите среднюю частоту соответствующего незначительного аллеля для пяти вариантов позиций N-терминала и терминала C в каждой позиции. Чтобы рассчитать минимальную частоту когорты, разделите самый низкий незначительный аллель, идентифицированный на два, и введите это значение в любой ячейке с контрольной незначительной частотой аллелей ноль.
Это позволит избежать деления на ноль при расчете соотношения сигнала к шуму. Для расчета соотношения сигнала к шуму на уровне аминокислот разделите каждую аминокислотную позицию экспериментального скользящего среднего на соответствующий контрольный скользящий средний показатель и на графике это соотношение по сравнению с аминокислотным положением. Для определения консенсуса аминокислотных местоположений функциональных доменов и функций, или областей пост-трансляционной модификации белка интереса, определить аминокислотные позиции, связанные с белковыми доменами и функциями, и открыть веб-страницу NCBI.
Введите белковый продукт РНК стенограммы белка интереса в поле поиска, и определить известные области белка и особенности, в соответствии с особенностями. Определите и обратите внимание на доменное имя и тип и аминокислотные позиции и выберите ссылку, соответствующую функции, чтобы визуализировать область на протеине первичной последовательности интересов. Создайте столбец рядом с столбецом сигнала к шуму, чтобы можно было ссылаться на столбец положения аминокислоты и идентифицировать ячейки, соответствующие аспекту терминала N или C каждого домена и функции.
Затем поместите по одному в каждую ячейку, создайте график с этими границами на оси и аминокислотном положении на х-оси и наложить этот график с графиком сигнала к шуму. Чтобы сопоставить отдельные варианты позиций для наложения соотношения сигнала к шуму и топологии белковых доменов, создайте столбец рядом с столбецом функции домена таким образом, чтобы строки в столбце соответствовали аминокислотным позициям, и поместите по одному в каждую ячейку в добавленную строку, соответствующую позиции, содержащей соответствующий вариант. Затем создайте график с этой колонкой в качестве оси и аминокислотных позиций на х-оси, и наложить этот график с сигналом к шуму и белковой области топологии графиков.
Здесь показан репрезентативный результат анализа сигнала к шуму на уровне аминокислот для подсемейство закрытого канала калия. Показаны редкие отклонения, выявленные в когорте контроля, и экспериментальные случайно выявленные целые экссом секвенирования, и длинный синдром ЗТ связанных вариантов считается, вероятно, связанных с болезнью. Также представлены анализы сигнала к шуму, сравнивающие все exsome секвенирование, и длинная частота когортного варианта синдрома ЗТ, нормализованная по сравнению с частотой варианта когорты контроля.
В этом эксперименте, длинные связанные с синдромом ЗТ варианты продемонстрировали высокие соотношения сигнала к шуму в доменах, соответствующих каналу заливки, фильтру селективности и закрытому подсемейому каналу калия E-члену одного связывающего домена. Для сравнения, случайно выявленные варианты во всей экссометной когорте секвенирования не продемонстрировали четко конкретные области высоты высокого сигнала к шуму, предполагая, что эти варианты отражают фоновые генетические вариации. Эта методология может быть применена для оценки диагностического веса вариантов неизвестного значения, которые возникают в ходе клинических генетических испытаний.