Method Article
우리는 게놈 시퀀스의 분석을 위해 공용 전산 웹 사이트를 제시한다. 그것은 여러 가지가 아닌 임의의 염기 조성과 함께 DNA 시퀀스 패턴을 감지합니다. 이 리소스는 복잡 다양한 수준 무작위 시퀀스를 생성합니다.
비 코딩 intergenic 지역 introns, 그리고 exons의 번역되지 않은 세그먼트를 포함하여 복잡한 eukaryotes,의 게놈 영역 것은 깊이가 아닌 임의의 자신의 염기 조성에 및 시퀀스 패턴의 복잡한 모자이크로 이루어져 있습니다. 시퀀스 (예 : (G + T) - 풍부하고 purine이 풍부한 등 기지의 특정 기본 또는 조합하여 풍부한 아르 길이 30-10000 세포핵 - 이러한 패턴은 소위 미드 레인지 Inhomogeneity (MRI) 지역을 포함 ). MRI 지역은 종종 유전자 발현, 재조합 및 기타 유전 프로세스 (Fedorova & Fedorov 2010)의 규제에 관련된 비정상적인 (비 - B - 양식) DNA 구조와 관련된 있습니다. 자신의 순서 inhomogeneity는 또한 이러한 게놈 시퀀스의 기능과 중요성 (프라카쉬 외. 2009) 지원 감소하는 경향이 돌연변이에 대한 MRI 지역 내에서 강력한 고정 바이어스의 존재.
우리가 자유롭게 사용할 인터넷 자원을 증명 - 게놈 MRI 프로그램 패키지 - (. 벡텔 외를 2008) 그들 내에서 다양한 MRI 패턴을 발견하고 특성화하기 위해 게놈 시퀀스의 전산 분석을 위해 설계합니다. 이 패키지는 또한 천연 입력 DNA 시퀀스에 다양한 특성과 대응의 수준 무작위 시퀀스의 생성을 허용합니다. 이 리소스의 주요 목표는 여전히 기뻐서 조사하지 않고 철저한 탐구와 인식을 기다리고 아르 비 코딩 DNA의 광대한 지역의 시험을 촉진하는 것입니다.
신문에서 모두 사용되는 프로그램은 Perl을 사용하여 작성되었으며, 모든 웹 페이지는 PHP를 사용하여 개발되었습니다.
1. 출발점 :
http://mco321125.meduohio.edu/ ~ jbechtel / gmri /에서 온라인 게놈 MRI 패키지의 홈 페이지를 엽니다. 웹 자원은 또한 "도움말 (How-to/README)"링크를 게놈 MRI 및 이와 유사한 알고리즘에 게시된 모든 자료는 "관련 리소스에 대한 링크"에 나와있는 동안 링크 프로그램에 대한 지침 / 설명을 제공합니다.
2. 준비 및 입력 시퀀스 (들)의 업로드.
GMRI 분석 세션을 시작하는 FASTA 형식의 시퀀스 (S)와 파일을 만듭니다. 이 형식의 각 염기 서열이 순서에 대한 간단한 설명하여 동일한 라인에 다음 식별자를 나타내는 ">"문자와 함께 시작하는 하나의 라인과 함께 선행되어야합니다. GMRI 분석을위한 뉴클레오 티드 시퀀스도 R, Y, N, X, 등 Hwever, 비 - A, T, C와 같은 문자를 허용, G 문자는 프로그램에 의해 처리되지 않고 생략됩니다. 반복 요소 ( "N"S로 대체) "마스크"했습니다되는 시퀀스는 입력으로 사용할 수 있습니다. 시퀀스 문자 대소문자를 구분됩니다.
참고 : 이제부터의 입력 시퀀스는 "userfile"라고합니다.
3. 입력 시퀀스 (옵션)의 Oligonucleotide 주파수 분포를하십시오.
입력 시퀀스의 집합 전체에 대한 oligonucleotide 주파수의 분배를 위해서는 "SRI 분석기"탭 (상단 행)를 클릭하십시오. 약어 SRI는 단거리 inhomogeneity을 의미합니다. 이 시점에서, 사용자는 주파수가 계산됩니다되는 oligonucleotides 최상의 길이를 (9 세포핵 2까지, 기본 6 국세청에서) 지정할 수 있습니다. 이 선택은 "최대 올리고머의 크기"목록 상자 내에서 원하는 옵션을 클릭하여 이루어집니다. 그럼 계산을 시작하려면 '파일을 분석 "버튼을 누르십시오. 입력 시퀀스 구성의 거친 표현은 바로이 웹 페이지의 중간에 짧은 테이블로 나타납니다와 "userfile.comp.tbl"로 다운로드합니다. 이 테이블은 입력 시퀀스에서만 가장 및 가장 풍부한 oligonucleotides를 나타냅니다.
가능한 모든 oligonucleotides에 대한 전체 주파수 테이블은 "다운로드 구성 파일"링크를 통해 얻을 수있다 "userfile.comp"라는 파일로서 생성됩니다.
참고 : SRI 분석기는 모든 중복 oligonucleotides의 집합 전체로 계산됩니다.
4. 입력 시퀀스 (옵션)에서와 같은 Oligonucleotide 작곡과 랜덤 시퀀스를 생성합니다.
(프로토콜의 3 단계의 완공이 작업이 필요합니다.)
5. 입력 및 랜덤 시퀀스의 미드 레인지 Inhomogeneity (MRI)의 분석.
6. 게놈 MRI 패키지 (옵션) 내에서 추가 프로그램.
게놈 MRI 자원도 매우 구체적인 무작위 시퀀스의 생성을위한 두 가지 고급 옵션이 있습니다. 그들은 "MRI 생성기"와 맨 윗줄에서 "CDS 생성기 '탭을 통해 사용할 수 있습니다.
7. 대표 결과
이 프로토콜은 사용자가 뉴클레오 티드 시퀀스의 작곡 inhomogeneity을 공부하실 수 있습니다. 중요한 것은 또한 입력 시퀀스의를 approximating oligonucleotide 합성과 무작위 시퀀스의 다양한 생성을 지원합니다. , 보통, 복잡 eukaryotes의 게놈 시퀀스 구성에 단일 아니지만, 오히려 특정 세포핵의 농축 순서 세그먼트의 복잡한 모자이크 (예 : purine이 풍부한, (G + T) 풍부한, (A + T) 풍부한를 나타냅니다 등). 중형 규모 (30-1000 BP)에서 이러한 패턴 어퍼 블루 스파이크와 스파이크로 낮은 붉은 컨텐츠 가난한 세그먼트 (그림 1 및 2 참조)와 같은 콘텐츠가 풍부한 세그먼트를 선택한 보여주는 MRI 분석기의 그래픽 출력에 의해 시각입니다. 일반적으로 자연적인 순서 (그림 1)에 콘텐츠 풍부하고 컨텐츠 가난한 지역의 번호가 동일한 oligonucleotide를 가지고 해당 무작위 시퀀스에있는 지역의 동일한 유형 (그림 2)의 개수 이상 시대의 순서에 작곡. 염기 조성에 중형 inhomogeneity 이러한 시퀀스 세그먼트는 사용자에게 관심이있을 것으로 생각됩니다. 그들은 자세한 조사를 위해 게놈 MRI 출력 파일에서 사용할 수 있습니다.
그림 1. 단계 5.7에서 MRI 분석기 그래픽 출력 예입니다. 결과는 44 introns 인간의 샘플을 획득하였습니다. 블루 바는 이러한 introns 함께 GC 풍부한 영역의 위치를 나타냅니다. 레드 바 GC - 가난한 (또는 AT - 풍부한) MRI 영역을 나타냅니다. y 축은 주어진 콘텐츠 유형에 대한 상위 및 하위 임계값을 포함하고 있습니다.
임의의 순서 "userfile.rand1_4"에 대한 그림 2. MRI 분석기 출력.
graphiSRI 생성기 프로그램을 사용하여 무작위로 생성 순서 이내에 MRI의 칼 표현.
그림 3. MRI 분석기에서 텍스트 출력 파일의 시작 부분의 예제.
프로그램에 의해 감지 모든 콘텐츠 풍부한 및 콘텐츠 가난한 시퀀스는 마지막 (네번째) 열에 표시됩니다. 창문의 개수로 측정 그들의 상대적인 위치는, 첫 번째 열에 표시됩니다. 두 번째 및 세 번째 열이 각각 콘텐츠 풍부하고 컨텐츠 - 가난한 지역에 대한 지표입니다.
중형 비늘에서 inhomogeneous 염기 조성 (30-1000 세포핵)와 지역별 복잡한 eukaryotes의 genomes에 과잉의하고 (intergenic 지역 introns, exons의 번역되지 않은 지역, 반복 요소) 어디서나 찾을 수 있습니다. 이 지역은 자주 비정상적인 DNA의 conformations와 관련된 있습니다. 예를 들어, purine-/pyrimidine-rich 시퀀스가 DNA의 triplexes (H - DNA)를 형성하는 경향이; purine / pyrimidine 기지를 교대로 순서는 Z - DNA의 conformations와 관련된, (G + C) - 풍부한 지역에 구조적 이상을 전시 B - 등 (Fedorov & Fedorova 2010 년까지 검토) -, DNA와 백본 절단하는 경향이 될 수 요소 긴장을 풀기 DNA (A + T)이 풍부한 지역은 비정상적인 구조를 형성 수도 있습니다. 이러한 미드 레인지 패턴의 일부 (예 : (G + T)이 풍부한 지역) 기뻐서 조사하지 않고 여전히 철저한 탐구와 인식을 기다리고 있습니다. 우리의 게놈 MRI 웹 리소스의 주요 목표는 더 실험적인 분석을위한 그들의 가능한 기능의 탐험에 대해 이러한 MRI 영역의 식별에 사용자를 돕는 것입니다. MRI 지역의 지식에 통합과 유전자 예측 프로그램의 새로운 세대 (셰퍼드 2010) 향상과 게놈 기능과 특성에 대한 우리의 이해를 미리 수 있습니다.
우리는 사무엘 셰퍼드, 피터 베이 즐리, 그리고 게놈 MRI 웹 페이지의 관리를위한 욘 다비드 벨 감사합니다. 이 작품은 국립 과학 재단 (National Science Foundation) 경력 보너스 "인트론 세포의 역할을 조사"에 의해 지원되었다 [부여 번호 MCB - 0643542].
JoVE'article의 텍스트 или 그림을 다시 사용하시려면 허가 살펴보기
허가 살펴보기This article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. 판권 소유