여기에 설명된 프로토콜은 사용자 친화적인 UCSC 게놈 브라우저에서 phyloCSF를 사용하여 단백질 코딩 잠재력에 대한 관심 게놈 영역을 분석하는 방법에 대한 자세한 지침을 제공합니다. PhloCSF는 현재 비코딩으로 주석이 달린 게놈 영역에서 마이크로단백질 코딩 잠재력을 갖는 보존된 짧은 개방 판독 프레임을 효과적으로 식별할 수 있다. 여기에 설명 된 방법은 쉽게 사용되며 생물 형성학 또는 비교 유전체학에 대한 사전 교육이나 전문 지식없이 모든 배경의 연구자가 구현할 수 있습니다.
시작하려면 인터넷 브라우저 창을 열고 University of California Santa Cruz 또는 UCSC 게놈 브라우저로 이동하십시오. 도구 제목 아래에서 트랙 허브 옵션을 선택합니다. 공용 허브 탭에서 검색어 상자에 phyloCSF를 입력합니다.
그런 다음 공개 허브 검색 버튼을 클릭하십시오. 허브 이름 phyloCSF에 대한 연결 버튼을 클릭하여 phyloCSF에 연결합니다. 연결을 클릭 한 후 UCSC 게놈 브라우저 게이트웨이 페이지로 리디렉션 될 때까지 기다립니다.
다른 종을 쿼리하려면 찾아보기 아래에서 원하는 종을 선택하거나 해당 아이콘을 클릭하여 종 제목을 선택하거나 텍스트 상자에 종을 입력하고 종 공통 이름 또는 어셈블리 ID를 입력합니다.드롭다운 메뉴를 사용하여 정의된 위치 제목 아래에서 검색할 어셈블리를 선택한 다음 위치 또는 검색어 상자에 위치 유전자 기호 또는 검색어를 입력하고 이동을 클릭하여 탐색합니다. 게놈 브라우저에 관심있는 유전자에. 검색 결과 여러 일치 항목이 관심 위치를 선택해야하는 페이지로 리디렉션되기를 기다렸다면 관심있는 적절한 유전자를 클릭하십시오. UCSC 게놈 브라우저로 이동 한 후 특정 DNA 또는 단백질 서열을 쿼리하기 위해 도구 제목 아래에서 폭발과 같은 정렬 도구 또는 블랫을 선택하십시오.
또는 도구 탭 위에 커서를 올려 놓고 blat 옵션을 선택하거나 주어진 링크를 따르십시오. 드롭 다운 메뉴를 사용하여 관심있는 종, 게놈 및 어셈블리를 선택하십시오. 그런 다음 쿼리 유형을 정의하고 관심있는 시퀀스를 blat 검색 게놈 텍스트 상자에 붙여 넣은 다음 제출을 클릭하십시오.
그런 다음 작업 제목 아래의 브라우저 링크를 클릭하여 관심있는 게놈 영역으로 이동하십시오. 관심 게놈 영역을 시각적으로 스캔하여 필로CSF 영역을 긍정적으로 스코어링한다. 확대/축소 기능을 사용하여 관심 영역을 확대하여 시퀀스 특성을 검사하고 시작 및 정지 코돈을 검색합니다.
수동으로 확대하려면 Shift 키를 누른 채 마우스 버튼을 누른 채 관심 영역을 따라 드래그합니다. 또는 페이지 위쪽에 있는 확대 및 축소 단추를 사용하여 탐색합니다. 뉴클레오티드 또는 염기서열이 보일 때까지 확대한다.
양성 스코어링된 phyloCSF 영역의 시작과 끝 근처의 핵 조류 서열을 시각적으로 스캔하여 징벌적 시작 및 정지 코돈을 동정한다. 페이지 상단의 보기 제목 위에 마우스 커서를 놓고 다른 게놈 변환 옵션을 클릭한 다음 새 게놈 제목 아래의 드롭다운 메뉴를 사용하여 관심 있는 게놈을 정의합니다. 새 어셈블리 제목 아래에서 원하는 게놈 어셈블리를 선택하고 제출 버튼을 클릭합니다.
브라우저가 유사성이있는 새 어셈블리의 지역 목록을 반환하면. 염색체 위치 링크를 클릭하여 관심 있는 상동 영역으로 이동합니다. 앞에서 설명한 탐색 전략에 따라 시퀀스를 분석합니다.
유전자 설명 페이지로 이동하려면 UCSC 게놈 브라우저에서 gen 코드 트랙에서 관심있는 유전자를 클릭하십시오. 순서와 도구 및 데이터베이스 제목 링크에서 다른 종을 더 빨리 읽는 테이블의 링크를 클릭하십시오. 관심있는 종과 관련된 상자를 클릭하여 선택하십시오.
그런 다음 제출을 클릭하십시오. 페이지 아래쪽에 나타나는 시퀀스를 복사하여 더 빠른 형식으로 워드 프로세싱 문서에 붙여넣습니다. 그런 다음 두 번째 브라우저 창을 열고 유럽 생물 정보학 연구소 웹 사이트에서 clustal omega 다중 시퀀스 정렬 도구로 이동하십시오.
클립보드의 시퀀스 파일을 지원되는 형식으로 시퀀스를 읽는 단계 중 하나의 상자에 붙여넣습니다. 페이지 하단으로 스크롤하여 제출을 클릭하십시오. 각 아미노산의 보존 정도를 나타내는 기호에 대해 정렬 된 결과를 아래에서 관찰하십시오.
아미노산 특성과 색상을 보려면 서열 바로 위에 표시된 색상 링크를 클릭하여 아미노산의 특성에 따라 색상을 지정합니다. 그런 다음 시퀀스 정렬을 복사하여 워드 프로세싱 또는 슬라이드 쇼 프로그램에 붙여 넣어 그림 또는 그림 파일을 생성합니다. clustal 오메가 결과 페이지에서 다른 출력을 보려면 탭 가이드 트리 또는 계통 유전 나무를 클릭하십시오.
마지막으로 결과 뷰어의 탭을 클릭하여 jalview를 사용하여 시퀀스 정보를 보거나 mview 및 간단한 계통에 대한 직접 링크에 액세스 할 수있는 옵션을 확인하십시오. 미토레귤린 유전자의 대표적인 필로CSF 분석은 검증된 마이크로단백질에 상응하는 고서열 보존의 영역을 나타낸다. 완전한 미토레귤린 코딩 서열은 엑손 하나 내에 포함되어 있으며 필로CSF에서 하나의 트랙을 뺀 점수가 매우 높습니다.
보존된 시작 코돈은 phyloCSF에서 하나의 트랙을 뺀 양의 스코어링 영역의 시작에서 관찰될 수 있다. 미토레귤린의 첫 번째 엑손에서 양성 점수 영역은 시작 코돈에 걸쳐 직접 시작되고 정지 코돈에서 종료된다. 여덟 개의 상이한 종에 대한 마이크로단백질 미토레귤린의 다중 서열 정렬이 여기에 제시되어 있다.
긴 비코딩 RNA의 열풍 분석은 여섯 트랙 모두에 걸쳐 전체 유전자에 걸쳐 음성 스코어를 나타냈으며, 이는 서열 보존의 결여를 나타내고 열풍이 비코딩 RNA로서 정확하게 주석이 달린다는 것을 뒷받침한다. 마우스 하나, 여덟, 하나, 제로, 제로, 다섯, 여덟, I 24 리케 유전자의 PhyloCSF 분석은 보존된 개방 판독 프레임이 세 엑손에 걸쳐 있고 양성 필loCSF 스코어가 엑손 하나의 플러스 두 트랙에서 엑손 2의 플러스 세 트랙으로 점프한 다음, 엑손 셋에서 플러스 두 트랙으로 다시 점프한다는 것을 보여주었다. 하나의 유전자 유전자좌를 만나는 PhyloCSF 분석은 또한 단일 RNA 분자 내의 다수의 별개의 코딩 개방 판독 프레임을 확인하기 위해 효과적으로 사용되었다.
긍정적 인 phyloCSF 점수는 마이크로 단백질 코딩 능력을 매우 암시하지만이 증거 라인은 단독으로 설 수 없으며 실험적으로 검증되어야한다는 점에 유의해야합니다. 일단 마이크로단백질의 기간이 확인되면, 아미노산 서열은 그의 기능에 대한 통찰력을 제공하기 위해 보존된 도메인 또는 서열 특성에 대해 분석될 수 있다. PhyloCSF는 이전에 비코딩으로 생각되었던 게놈 영역에서 새로운 마이크로 단백질을 확인하는데 효과적으로 사용되어 왔으며 앞으로의 마이크로 단백질 동정 연구에 계속 유용한 도구가 될 것입니다.