아미노산 수준 신호-잡음 분석, 유전 변이체가 질병 상태와 연관되거나 인구 내의 자연 유전 적 변이의 일부일 가능성을 측정합니다. 이 기술은 2개의 큰 유전 자원, 질병 관련 돌연변이, 문헌에서 유효합니다, 또는 희소한 유전 적 분산을 확인하는 인구 기지를 둔 exsome 및 게놈 연구 결과 와 공공 도메인에서 이용합니다. 관심있는 특정 유전자와 스플라이스 이소형태를 식별하려면 Ensembl 홈페이지를 열고 드롭다운 메뉴에서 종을 선택합니다.
관심 유전자의 약어를 입력하고 이동을 클릭합니다. 관심 유전자및 전사적 관심에 해당하는 링크와 성적증명서 테이블에서 관심 있는 ID를 선택합니다. 향후 기준을 위해 성적증명서 테이블의 기준 서열 컬럼에서 RNA 전사체 식별 번호의 성적증명서 특이적 RNA 전사 및 단백질 생성물을 유의한다.
RNA 전사자 ID 번호의 단백질 생성물과 관련된 링크를 선택하여 국립생명공학정보센터 또는 NCBI 단백질 데이터베이스로부터 새로운 웹페이지를 열고, 원산지 섹션으로 스크롤하여 관심 있는 유전자 성적증명서에 대한 1차 단백질 서열을 얻습니다. 그런 다음 기능 섹션으로 스크롤하여 단백질 특징 목록을 가져옵니다. 제어 변형으로 각 아미노산 위치에 대한 사소한 송내 주파수를 계산하려면 그래프 링 가능한 스프레드시트를 열고 모든 실험 변형의 위치의 열을 만듭니다.
변형 텍스트를 제거하여 변형 위치만 남기고 변형을 오름차순 값에 정렬하여 둘 이상의 관련 변형이 있는 위치를 식별합니다. 주어진 위치에 대한 모든 사소한 진상주 주파수의 합을 획득하고, 주어진 위치와 관련된 각 변이체에 대한 사소한 진상분석 주파수를 결합하고, 각 아미노산 위치에 대한 경미한 진열 주파수를 실험이체와 계산한다. 다음으로, 실험적인 변이체가 있는 아미노산 위치의 컬럼을 만들고, 모든 변종 위치에 대해 해당 위치와 관련된 모든 변이체의 사소한 알레일 주파수를 계산한다.
실험 및 제어 변이체 모두에 대한 사소한 알레일 주파수의 롤링 평균을 생성하려면 관심 유전자에서 모든 아미노산 위치를 포함하는 컬럼을 만들고, 제어 및 실험 데이터 세트 모두에 대한 변이체가 없는 모든 위치에 대해 0의 사소한 알레일 주파수를 추가한다. 각 실험 및 제어 보급 열에 대한 롤링 평균을 만들려면 제어 및 실험 데이터 세트 모두에 대한 사소한 송계 주파수의 롤링 평균을 나타내는 열을 만들고, 롤링 평균 컬럼에서 각 위치에 대한 5개의 변형 위치 N 단말 및 C 단자에 대한 각각의 사소한 송내 주파수의 평균을 배치한다. 코호트 최소 주파수를 계산하려면 식별된 가장 낮은 사소한 본인을 2개로 나누고 컨트롤 의 사소한 알렐 주파수가 0인 모든 셀에 이 값을 입력합니다.
신호 대 잡음 비율을 계산할 때 0으로 구분되지 않습니다. 아미노산 수준 신호 대 잡음 비율을 계산하려면, 각 아미노산 위치 실험 압연 평균을 각각의 제어 압연 평균으로 나누고, 아미노산 위치에 비해 이 비율을 그래프로 분석한다. 기능적 영역 및 기능의 컨센서스 아미노산 위치, 또는 관심 있는 단백질의 번역 후 변형 영역을 식별하려면 단백질 영역 및 기능과 관련된 아미노산 위치를 식별하고 NCBI 웹 페이지를 엽니다.
관심 있는 단백질의 RNA 성적증명서의 단백질 생성물을 검색장으로 입력하고, 기능 하에서 알려진 단백질 도메인 및 특징을 식별한다. 도메인 이름 및 유형 및 아미노산 위치를 식별하고 기록하고 관심 있는 1차 서열의 단백질에 영역을 시각화하기 위해 기능에 해당하는 링크를 선택한다. 신호-잡음 열 옆에 컬럼을 만들어 아미노산 위치 열을 참조할 수 있도록 하고 각 도메인 및 피처의 N 또는 C 단말 측면에 대응하는 셀을 식별합니다.
그런 다음 각 셀에 하나를 배치하고, y축에 이러한 경계와 x축의 아미노산 위치를 가진 그래프를 만들고 이 그래프를 신호-잡음 그래프로 오버레이한다. 신호 대 잡음 비율 및 단백질 도메인 토폴로지 그래프의 오버레이에 대한 개별 변형 위치를 매핑하려면 열의 행이 열의 행에 해당하고, 아미노산 위치에 해당하며, 각 셀에 각각의 변종을 포함하는 위치에 대응하는 도메인 피처 컬 옆에 컬럼을 생성합니다. 그런 다음 이 열을 x축의 y축 및 아미노산 위치로 그래프를 만들고 이 그래프를 신호-잡음 및 단백질 도메인 토폴로지 그래프와 오버레이합니다.
여기서, 칼륨 전압 게이트 채널 서브패밀리 Q 부재에 대한 아미노산 수준의 신호-잡음 분석을 위한 대표적인 결과가 1개의 유전자를 묘사한다. 대조군에서 확인된 희귀 한 분산, 실험 부수적으로 확인된 전체 exsome 시퀀싱, 및 긴 QT 증후군 케이스 관련 된 이체관련 질병 관련 될 가능성이 있는 것으로 간주 된다. 전체 외음 시퀀싱및 긴 QT 증후군 코호트 이체 주파수를 비교하는 신호 대 잡음 분석도 대조군 변이체 주파수에 대해 정규화되어 표현된다.
본 실험에서, 긴 QT 증후군 관련 변이체는 채널 부어, 선택성 필터 및 칼륨 전압 게이트 채널 서브패밀리 E 부재 1개의 결합 도메인에 대응하는 도메인에서 높은 신호 대 잡음 비율을 입증하였다. 이에 비해, 전체 exsome 시퀀싱 코호트에서 부수적으로 확인된 변이체는 높은 신호 대 잡음 고도의 특정 영역을 명확하게 보여주지 않았으며, 이러한 변이체가 배경 유전 적 변이를 반영한다는 것을 시사합니다. 이 방법론은 임상 유전 시험 도중 생기는 알려지지 않은 중요성의 이체의 진단 무게를 측정하기 위하여 적용될 수 있었습니다.