7.2K Views
•
08:00 min
•
October 11th, 2019
DOI :
October 11th, 2019
•0:04
Title
0:41
Exploring Factors Containing a Gene of Interest
3:06
Filtering and Interpreting CorEx Factors and Finding Commonalities and Differences of Gene Expression Variation Across Tumor Types
5:49
Results: Representative Tumor Gene Expression Factor Analysis
7:31
Conclusion
Transcript
CorExplorer finder tumor-associerede genekspressionsfaktorer på en måde, der er matematisk principfast ved hjælp af interaktive visualiseringer, samt kliniske og database oplysninger til biologisk opdagelse. CorEx udfører maksimering af oplysninger på en måde, der kræver relativt få eksempler for at finde klynger i højdimensionale data. Hierarkiet af latente faktorer, som det producerer letter den biologiske forståelse.
Denne metode har allerede vist sig interessant, når de anvendes til kræft biologi. Dens oplysninger teoretiktiske fundamenter gør det gældende for ethvert system med mange variabler og lidt forudgående viden om deres relationer. Begynd med at navigere til CorExplorers hjemmeside.
Under Hurtige links skal du klikke på plusudvid-knappen for at se en oversigt over CorEx-faktorgrafen, der blev trænet på kræftdata af interesse. For eksempel, her, faktor grafer for TCGA kræft i æggestokkene data er vist. Efter inspektion af faktorgrafer, klik lunge TCGA-LUAD at få adgang til CorExplorer side for lungekræft RNA sekventering og bruge CorExplorer Factor Graph vindue til at udforske CorEx faktor grafen for et gen af interesse.
Mens du flytter musemarkøren hen over faktorgrafens visningsvindue, skal du zoome ind på faktorgrafen ved hjælp af musediagrammet for at få vist detaljerne i grafen, f.eks. Hvis du vil finde et målgen, skal du klikke på menuen Gen og skrive gennavnet for at vælge det på rullelisten. Tryk på Retur på tastaturet for at få visningen til at zoome ind på den faktor, som det pågældende gen er stærkest korreleret med.
Flyt musen hen over grafvisningen, og rul for at zoome ud for at se niveauet for noden og dens tilknyttede faktorer, der er naboer til den tættest tilknyttede genfaktor. Bemærk, at kun gener med en vægt, der er større end den tærskel, der er angivet på min Link Weight-skyderen, vises. Hvis du vil se alle de gener, der er forbundet med faktoren, skal du klikke på den relevante node og vælge Indlæs yderligere gener i pop op-vinduet.
Når Udført vises, skal du lukke pop op-vinduet. I sidehovedsektionen skal du klikke på og trække min Link Weight-modifikatoren til 0,05 for at tillade, at generne vises i vægtrækkefølge. Hvis du vil identificere tilknytninger med en biologisk funktion, skal du fjerne markeringen i falsk registreringshastigheds sortere for at sortere rullemenuen Faktor efter faktornummer i stedet for falsk registreringshastighed.
Rul, og klik for at vælge interessefaktoren i rullemenuen Anmærkningsvindue for at få vist tilsætningsanmærkningerne for faktoren. Klik derefter på en berigelsesfaktor for straks at få vist de tilknyttede gener som fremhævet med gult på grafvisningen. Bemærk, at faktorer, der forsvinder eller vises som forskellige GO-udtryk, vælges i henhold til, om de er beriget for gener med den valgte anmærkning.
For filterfaktorer af interesse, ved hjælp af overlevelse og klynge kvalitet, fra Dataset rullemenuen vælge TCGA_OVCA for at gå til CorExplorer side for TCGA kræft i æggestokkene RNA sekventering. Bemærk fra vinduet Overlevelse den faktor, der har den største overlevelsesdifferentiale, og vælg denne faktor i vinduet Faktorgraf i rullemenuen Faktor. Klik og træk skyderen Link Vægt til 0,5, og noter antallet af gener i faktoren.
Udvid listen over faktorer i overlevelsesvinduet, og klik på den næstbedste faktor i rullemenuen Survival for at se de tilknyttede overlevelseskurver. De signifikante GO- og Kegg-anmærkninger vises. For at få en bedre forståelse af genernes biologiske rolle i denne faktor skal du vælge faktorlaget øverst i vinduet Faktorgraf og flytte musen hen over vinduet, mens du zoomer ud for at afsløre hele klyngen og tilknyttede faktorer.
For at forstå den relative betydning af de faktorer, der er knyttet til klyngenoden, skal du fjerne markeringen af Sortér efter p-val i vinduet Overlevelse og klikke på hvert af faktornumrene efter hinanden for at få dem vist, og det skal være en meddelelse om de faktorer, der viser en overlevelsestilknytning. Vælg PPI i menuen Tilføj vindue, og klik på Tilføj for at føje et PPI-diagramvindue til visningsområdet. I PPI grafvinduet skal du vælge et faktorlag af interesse for at vise de proteinproteininteraktioner, der er signifikante.
Klik på linket Vis på StringDB for at oprette forbindelse til STRINGdb-onlinedatabasen, og klik på Fortsæt. Åbn derefter fanen Anaylsis for at få en online GO-analyse for PPI-netværksgener. Den øverste cellekomponent vises.
Gå tilbage til fanen CorExplorer og PPI, og vælg en anden faktor. Klik på linket Vis på StringDB igen. Der vises en anden topcellekomponent.
Vælg derefter en anden faktor for en STRING-databaseanalyse i PPI-vinduet. For at finde fællestræk og forskelle i genekspressionsvariation på tværs af tumortyper skal du klikke på CorExplorer-overskriften for at vende tilbage til forsiden og klikke på Søg for at få adgang til en side, der gør det muligt at søge efter alle datasæt på CorExplorer-webstedet. Angiv et gennavn af interesse i feltet Gensøgning, og klik på Søg.
For eksempel, som påvist FLT1 findes med en relativt høj vægt og flere forskellige faktorer. Søgning efter BRCA1 genet i lungekræft datasæt afslører genet at være den mest stærkt forbundet med CorEx faktor 26. GO sigt berigelse for denne faktor er ekstremt høj, med DNA reparation udviser en falsk opdagelse sats på kun én gange 10 til den negative 19.
Udvælgelsen henleder også opmærksomheden på klyngen på andet niveau L2_8 har seks nært beslægtede faktorer som børn. DNA reparation protein-protein interaktion netværk er stærkt forbundet, yderligere støtte den tæt forbundne funktionalitet af generne i faktor 26. De tilknyttede overlevelsesgrafer tyder på en mulig sammenhæng med patientens overlevelse, som skulle bekræftes i et større datasæt.
Begyndende med overlevelsesvurderingen kan tillade dissektion af de faktorer, der korrelerer med en forbedret overlevelse som forbundet med bestemte genekspressionsgrupper. Tilføjelse af et proteinproteininteraktionsvindue for hver faktor letter til gengæld bestemmelsen af mulige forklaringer på deres associationer til overlevelse. Det er vigtigt at kontrollere varmekortene for hver faktor for at bekræfte, at genekspressionsmønstret er af tilstrækkelig kvalitet til at understøtte biologiske fortolkninger.
Varmekort, der viser stærke, klare variationer i genekspressionsmønstre, kan udvise enten koordineret udtryk for faktorgener, der spænder fra høj til lav, eller mere komplekse mønstre, med nogle gener med lavt udtryk korreleret med andre gener med et højt udtryk. Det overordnede mål med denne procedure er at sætte en personlig terapi ved at kortlægge en ud af prøve tumor på CorExplorer faktorer til at identificere potentielle tumor-specifikke behandlinger.
Vi introducerer CorExplorer web portal, en ressource til udforskning af tumor RNA sekvensering faktorer, der findes ved maskinel indlæring algoritme CorEx (korrelations forklaring), og vise, hvordan faktorer kan analyseres i forhold til overlevelse, database anmærkninger, protein-protein interaktioner, og hinanden for at få indsigt i tumor biologi og terapeutiske interventioner.
ABOUT JoVE
Copyright © 2024 MyJoVE Corporation. All rights reserved