Wir danken Dr. Guido Scarabelli und Hongyang Li für umfangreiche Tests während der gesamten Entwicklung sowie die Bio3D User Community und die University of Bergen strukturellen Bioinformatik Workshop Teilnehmer für Feedback und Kommentare, die diese Anwendung verbessert haben.

HINWEIS: Eine typische Bio3D-Web-Sitzung verläuft durch fünf aufeinanderfolgende und abhängige Schritte (siehe Abbildung 1 für eine schematische Darstellung). Jeder Schritt wird als aufeinanderfolgende Navigationsregisterkarte der Webapplikation SEARCH, ALIGN, FIT, PCA und eNMA implementiert. 1. Struktursuche und Auswahl (SEARCH) <ol><li> Eingangsstruktur <ol><li> Erhalten Sie die PDB-ID der Adenylat-Kinase (Adk), zB durch die Suche nach dem PDB [http://www.rcsb.org/pdb]. Alternativ erhalten Sie die Protein-Aminosäuresequenz von Interesse, zB von UniProt [http://uniprot.org]. </li><li> Geben Sie die vier Zeichen lange PDB-ID für Adk ( zB 1AKE) ein, oder fügen Sie eine Proteinsequenz in das Textfeld im Feld &quot;Input-Struktur oder Sequenz&quot; ein. </li></ol></li><li> Hit Auswahl <ol><li> Klicken Sie auf die blaue Schaltfläche &quot;Weiter&quot; (Hit Auswahl) im ersten Bedienfeld oder blättern Sie einfach nach unten. B) &quot;Auswahl treffen&quot;Zur weiteren analyse </li><li> Vergewissern Sie sich, dass der Schieberegler &quot;Gesamtzahl der enthaltenen Strukturen beschränken&quot; auf seinen maximalen Wert gesetzt ist, um alle Strukturen über dem Cutoff zu enthalten. </li><li> Senken Sie die &quot;Anpassen der Einschluss BitScore Cutoff&quot;, um mehr entfernte Hits einzuschließen, oder erhöhen Sie es auszuschließen. </li></ol></li><li> Optionale Trefferfilterung <ol><li> Klicken Sie auf die blaue Schaltfläche &quot;Weiter&quot; (Hit Auswahl) im ersten Panel oder blättern Sie einfach nach unten C) &quot;Optionale Filterung der zugehörigen Strukturen für die weitere Analyse&quot;. </li><li> Vergewissern Sie sich, dass die ausgewählten Treffer relevante Strukturen darstellen, indem Sie Details der Tabelle, zB PDB-Namen, Spezies und gebundene Liganden, untersuchen. </li><li> Manuelles Verfassen der ausgewählten Teilmenge von Strukturen, wenn nötig, indem man auf die Zeilen der Tabelle klickt. HINWEIS: Zeilen, die mit einer blauen Farbe hervorgehoben werden, zeigen PDB-IDs, die für weitere Analysen in nachfolgenden Registerkarten ausgewählt wurden. </li></ol></li></ol> 2. Multiple Sequence Alignment Analysis (ALIGN) <ol><li> Klicken Sie auf die Registerkarte ALIGN, um die Sequenzausrichtung der ausgewählten Strukturen auf der Registerkarte SEARCH auszuführen. </li><li> Ausrichtungsübersicht <ol><li> Überprüfen Sie die Ausrichtungsübersicht in Panel A) &quot;Alignment Summary&quot;. Stellen Sie sicher, dass die interessierenden Regionen ausgerichtet sind und nicht durch Lücken in einer oder mehreren Strukturen maskiert sind. </li><li> Wenn nötig, schalten Sie die &quot;Display-Ausrichtungsbearbeitungsoptionen&quot; und entfernen Sie unerwünschte PDB-IDs, z. B. PDBs mit fehlenden Resten. </li></ol></li><li> Sequenzausrichtungsanalyse <ol><li> Klicken Sie auf die blaue Schaltfläche &quot;Weiter&quot; (Analyse), um eine sequenzbasierte Clusteranalyse der gesammelten Strukturen durchzuführen. </li><li> Wählen Sie die Plotoption Dendrogramm. Passen Sie den Cluster in den K-Gruppen-Schieberegler an, um die Strukturen in k-Gruppen zu partitionieren. </li><li> Ändern Sie ggf. die Clustering-Methode, indem Sie das Kontrollkästchen Weitere Clustering- und Ausgabeoptionen umschalten. </li></oL&gt; </li><li> Rückstandskonservierungsanalyse <ol><li> Klicken Sie auf die blaue Schaltfläche &quot;Weiter&quot; (Konservierung), um die säulenweise Rückstände zu berechnen. </li><li> Wählen Sie die Aligned-Struktur-Sets aus, um ein Diagramm der Rückstands-Konservierung an jeder Ausrichtungsposition zu erzeugen. </li><li> Wählen Sie Strukturen, die mit der PFAM-Saatgutausrichtung ausgerichtet sind, um die Erhaltung zu erhalten, die in Bezug auf die zugehörige PFAM-Saatgutausrichtung berechnet wird, die repräsentative Mitglieder der Familie enthält. </li></ol></li><li> Sequenzausrichtung <ol><li> Klicken Sie auf die blaue Schaltfläche &quot;Weiter&quot; (Ausrichtung), um die vollständige Sequenzausrichtung mit dem Visualisierungswerkzeug im Browser anzuzeigen. </li></ol></li></ol> 3. Struktur Anpassung und Analyse (FIT) <ol><li> Führen Sie die Strukturüberlagerung durch, indem Sie die Registerkarte FIT eingeben. </li><li> Strukturüberlagerung <ol><li> Umschalten des Kontrollkästchens &quot;Show PDBs&quot;, um das ausgerichtete Protei zu visualisierenN-Strukturen im Browser. </li><li> Stellen Sie sicher, dass die Proteinstrukturen den entsprechenden und relevanten Regionen durch visuelle Inspektionen überlagert werden. Klicken und ziehen Sie die Maus über die Strukturen zu drehen, und blättern zu zoomen. </li><li> Passen Sie die Farbgebung der Strukturen an, indem Sie auf die &quot;Farboptionen&quot; klicken. Farboptionen umfassen Ausrichtungsposition, strukturelle Variabilität pro Position, RMSD-Clustergruppen, Sequenzclustergruppen, ausgerichtete Regionen und Sekundärstruktur. </li><li> Laden Sie die überlagerten Strukturen entweder als herkömmliche PDB-Dateien oder als einzelne PyMOL-Session-Datei zur Visualisierung in einem spezialisierten molekularen Viewer-Programm herunter. </li></ol></li><li> Strukturanalyse <ol><li> Klicken Sie auf die blaue Schaltfläche &quot;Weiter&quot; (Analyse), um eine strukturbasierte Clusterung der gesammelten PDB-Strukturen durchzuführen. </li><li> Umschalten der RMSD-Heatmap im Dropdown-Menü Plotoptionen. </li><li> Passen Sie die Clustering-Optionen an, einschließlich der Clustering-Methode selbst, Indem Sie das Kontrollkästchen &quot;Mehr Clustering und Ausgabeoptionen&quot; umschalten. HINWEIS: Pairwise RMSD-Daten können auch als Dendrogramm, Histogramm oder Wärmekarte visualisiert werden. </li></ol></li><li> Rückstandsschwankungen <ol><li> Klicken Sie auf die blaue Schaltfläche &quot;Weiter&quot; (RMSF), um die strukturelle Variabilität jedes Restes (als RMSF-Plot dargestellt) mit großen sekundären Strukturelementen, die in den Randbereichen der x-Achse dargestellt sind, zu betrachten. </li><li> Um die kristallographischen B-Faktoren der Referenzstruktur auf das RMSF-Plot zu überlagern, schalte das Kontrollkästchen Show B-Faktoren ein. </li></ol></li></ol> 4. Hauptkomponentenanalyse (PCA) <ol><li> Führen Sie die Hauptkomponentenanalyse durch, indem Sie die Registerkarte &quot;PCA&quot; eingeben. </li><li> Visualisierung der Hauptkomponenten <ol><li> Schalten Sie das Kontrollkästchen &quot;PC-Trajektorie anzeigen&quot; ein, um die von den PCs mit dem In-Browser-Visualisierungstool beschriebenen Bewegungen zu visualisieren. </li><li> Stellen Sie sicher, &quot;PrinCipal Component 1 &quot;wird aus dem ersten Dropdown-Menü ausgewählt. </li><li> Um die von anderen PCs beschriebenen Bewegungen zu visualisieren, wählen Sie den gewünschten PC aus dem Dropdown-Menü &quot;Select Principal Component&quot;. </li><li> Ändern Sie die Farbgebung der Trajektorie aus dem Dropdown-Menü &quot;Farboptionen&quot;. </li><li> Wählen Sie &quot;Variabilität pro Position&quot; von den &quot;Farboptionen&quot; bis zur Farbverschiebung. </li><li> Klicken Sie im Bedienfeld &quot;Principal Component Visualization&quot; auf die Schaltfläche &quot;PDB-Trajektorie herunterladen&quot;, um eine Trajektorienansicht der von den PCs beschriebenen Bewegung zu erhalten. </li><li> Klicken Sie auf die Schaltfläche &quot;PyMOL herunterladen&quot;, um eine PyMOL-Sitzungsdatei zu erzeugen, die die Bewegungen als Vektorfeld angibt. </li></ol></li><li> Konformeranalyse <ol><li> Projizieren Sie die einzelnen Strukturen auf zwei ausgewählte PCs, indem Sie auf die blaue Schaltfläche &quot;Weiter&quot; klicken. </li><li> Vergewissern Sie sich, dass &quot;PC auf X-Achse&quot; auf 1 gesetzt ist und &quot;PC oN Y-Achse &quot;bis 2. Um die Strukturen auf andere PCs zu projizieren, stellen Sie die PC-Nummerierung entsprechend ein. </li><li> Wählen Sie &quot;Cluster by PC Subspace&quot;, um die Strukturen im Plot durch PC-basiertes Clustering zu färben. &quot;RMSD&quot;, um durch &quot;RMSD-basiertes&quot; Clustering zu färben; Und &quot;Sequenz&quot;, um nach sequenzbasierter Clusterung zu färben. </li><li> Klicken Sie auf alle einzelnen Punkte in der Handlung, um die Strukturen zu kennzeichnen. Alternativ markieren Sie eine oder mehrere Strukturen in der Tabelle &quot;PCA Conformer Plot Annotation&quot; unterhalb der Handlung. </li><li> Schieben Sie die PCs im Subraum-Schieberegler auf, um mehr / weniger PCs für den Clustering-Algorithmus einzuschließen. </li></ol></li><li> Rückstandsbeiträge <ol><li> Berechnen Sie die Rückstandsbeiträge zu den einzelnen PCs, indem Sie auf die blaue Schaltfläche &quot;Weiter&quot; (Rückstandsbeiträge) klicken. </li><li> Zeichnen Sie die Beiträge für weitere PCs, indem Sie die PC-Nummer in das Textfeld &quot;Select Principal Component&quot; einfügen. </li><li> Toggle die &quot;Spread liNes &quot;Kontrollkästchen vermeiden, die Rückstandsbeiträge übereinander zu platzieren. </li><li> Schalten Sie das Kontrollkästchen &quot;Multiline Plot&quot; aus, um die Rückstandsbeiträge in separaten Plots zu zeichnen. </li><li> Schalten Sie die &quot;Show RMSF&quot; ein, um die RMSF-Werte (auf der Registerkarte FIT) einzuschließen. </li></ol></li></ol> 5. Ensemble Normalmodusanalyse (eNMA) <ol><li> Klicken Sie auf die Registerkarte eNMA, um die normale Modi (NMs) zu berechnen. </li><li> Filterstruktur <ol><li> Passen Sie die Anzahl der Strukturen an, indem Sie den &quot;Cutoff&quot; für die Strukturintegration / den Ausschluss senken oder erhöhen. </li><li> Klicken Sie auf die grüne &quot;Run Ensemble NMA&quot;, um die NMA-Berechnung zu starten. </li></ol></li><li> Normalmodi Visualisierung <ol><li> Scrollen Sie nach unten zum zweiten Panel der eNMA-Registerkarte (Normal Modes Visualization) zur Visualisierung der NMs. HINWEIS: Standardmäßig wird der NM mit der höchsten Überlappung (Ähnlichkeit) zu PC-1 im visuellen angezeigtFenster. </li><li> Um die von anderen NMs oder anderen PDB-Strukturen beschriebenen Bewegungen zu visualisieren, wählen Sie die gewünschte NM und Struktur aus den Dropdown-Menüs &quot;Select Mode&quot; und &quot;Show NMs for structure&quot; . </li></ol></li><li> Rückstandsschwankungen <ol><li> Klicken Sie auf die blaue Schaltfläche &quot;Next&quot; (Fluctuations), um die rückstandsbedingten Fluktuationen der für eNMA ausgewählten Strukturen zu berechnen. </li><li> Schalte den &quot;Cluster von RMSD&quot; ein, um die Fluktuationsprofile durch RMSD-basiertes Clustering zu färben. </li><li> Schalte den &quot;Cluster von RMSIP&quot; ein, um die Fluktuationsprofile durch RMSIP-basiertes Clustering zu färben. </li><li> Umschalten Sie das Kontrollkästchen &quot;Spread Linien&quot;, um die gruppierten Fluktuationsprofile voneinander zu unterscheiden. </li></ol></li><li> Vergleich von NMA und PCA <ol><li> Klicken Sie auf die blaue Schaltfläche &quot;Next&quot; (PCA-vs-NMA), um die Ähnlichkeit zwischen den einzelnen NMs und PCs zu berechnen. </li><li> Wählen Sie ein PDB-ID aus dem Dropdown-Menü &quot;Vergleich NMs der Struktur&quot;, um die Ähnlichkeit zwischen den NMs dieser Struktur zu den im PCA-Tab berechneten PCs zu berechnen. </li></ol></li><li> Überlappungsanalyse <ol><li> Klicken Sie auf die blaue Schaltfläche &quot;Weiter&quot; (Überlappungsanalyse), um die Überlappung zwischen berechneten NMs und dem Strukturdifferenzvektor zwischen zwei ausgewählten Strukturen zu berechnen. </li><li> Wählen Sie eine &quot;Referenz&quot; PDB ID aus dem Dropdown-Menü &quot;Vergleich NMs der Struktur&quot; und oder eine oder mehrere PDB-IDs in der Strukturtabelle für den paarweisen Vergleich mit dem Referenz-PDB. </li></ol></li><li> Clusteranalyse <ol><li> Klicken Sie auf die blaue Schaltfläche &quot; Weiter&quot; (Clustering), um das Strukturclustering basierend auf der paarweisen NM-Ähnlichkeit (RMSIP) auszuführen. </li></ol></li></ol>

<ol>
	<li>Kornev, A. P., Taylor, S. S. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=Dynamics-Driven+Allostery+in+Protein+Kinases.">Dynamics-Driven Allostery in Protein Kinases.</a> Trends Biochem. Sci. 40 (11), 628-647 (2015).</li><li>Yao, X. -. Q., Grant, B. J. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=Domain-opening+and+dynamic+coupling+in+the+&#945;-subunit+of+heterotrimeric+G+proteins.">Domain-opening and dynamic coupling in the &#945;-subunit of heterotrimeric G proteins.</a> Biophys. J. 105 (2), L08-L10 (2013).</li><li>Henzler-Wildman, K. A., et al. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=Intrinsic+motions+along+an+enzymatic+reaction+trajectory.">Intrinsic motions along an enzymatic reaction trajectory.</a> Nature. 450 (7171), 838-844 (2007).</li><li>Boehr, D., Nussinov, R., Wright, P. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=The+role+of+dynamic+conformational+ensembles+in+biomolecular+recognition.">The role of dynamic conformational ensembles in biomolecular recognition.</a> Nat. Chem. Biol. 5 (11), 789-796 (2009).</li><li>Teilum, K., Olsen, J. G., Kragelund, B. B. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=Functional+aspects+of+protein+flexibility.">Functional aspects of protein flexibility.</a> Cell Mol Life Sci. 66 (14), 2231-2247 (2009).</li><li>Henzler-Wildman, K., Kern, D. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=Dynamic+personalities+of+proteins.">Dynamic personalities of proteins.</a> Nature. 450 (7172), 964-972 (2007).</li><li>Grant, B. J., Gorfe, A. A., McCammon, J. A. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=Large+conformational+changes+in+proteins:+signaling+and+other+functions.">Large conformational changes in proteins: signaling and other functions.</a> Curr. Opin. Struct. Biol. 20 (2), 142-147 (2010).</li><li>Grant, B. J., Rodrigues, A. P. C., ElSawy, K. M., McCammon, J. A., Caves, L. S. D. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=Bio3d:+an+R+package+for+the+comparative+analysis+of+protein+structures.">Bio3d: an R package for the comparative analysis of protein structures.</a> Bioinformatics. 22 (21), 2695-2696 (2006).</li><li>Bakan, A., Meireles, L. M., Bahar, I. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=ProDy:+protein+dynamics+inferred+from+theory+and+experiments.">ProDy: protein dynamics inferred from theory and experiments.</a> Bioinformatics. 27 (11), 1575-1577 (2011).</li><li>Zimmermann, M. T., Kloczkowski, A., Jernigan, R. L. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=MAVENs:+motion+analysis+and+visualization+of+elastic+networks+and+structural+ensembles.">MAVENs: motion analysis and visualization of elastic networks and structural ensembles.</a> BMC Bioinformatics. 12 (1), 264 (2011).</li><li>Yang, L. -. W., et al. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=oGNM:+online+computation+of+structural+dynamics+using+the+Gaussian+Network+Model.">oGNM: online computation of structural dynamics using the Gaussian Network Model.</a> Nucleic Acids Res. 34, 24-31 (2006).</li><li>Suhre, K., Sanejouand, Y. -. H. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=ElNemo:+a+normal+mode+web+server+for+protein+movement+analysis+and+the+generation+of+templates+for+molecular+replacement.">ElNemo: a normal mode web server for protein movement analysis and the generation of templates for molecular replacement.</a> Nucleic Acids Res. 32, W610-W614 (2004).</li><li>Tiwari, S. P., et al. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=WEBnm@+v2.0:+Web+server+and+services+for+comparing+protein+flexibility.">WEBnm@ v2.0: Web server and services for comparing protein flexibility.</a> BMC Bioinformatics. 15 (1), 427 (2014).</li><li>Hrabe, T., et al. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=PDBFlex:+exploring+flexibility+in+protein+structures.">PDBFlex: exploring flexibility in protein structures.</a> Nucleic Acids Res. 44, D423-D428 (2016).</li><li>Skj&#230;rven, L., Jariwala, S., Yao, X. -. Q., Grant, B. J. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=Online+interactive+analysis+of+protein+structure+ensembles+with+Bio3D-web.">Online interactive analysis of protein structure ensembles with Bio3D-web.</a> Bioinformatics. , (2016).</li><li>Skj&#230;rven, L., Yao, X., Scarabelli, G., Grant, B. J. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=Integrating+protein+structural+dynamics+and+evolutionary+analysis+with+Bio3D.">Integrating protein structural dynamics and evolutionary analysis with Bio3D.</a> BMC Bioinformatics. 15 (399), 1-11 (2014).</li><li>Eddy, S. R. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=Accelerated+Profile+HMM+Searches.">Accelerated Profile HMM Searches.</a> PLoS Comput. Biol. 7 (10), (2011).</li><li>Edgar, R. C. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=MUSCLE:+multiple+sequence+alignment+with+high+accuracy+and+high+throughput.">MUSCLE: multiple sequence alignment with high accuracy and high throughput.</a> Nucleic Acids Res. 32 (5), 1792-1797 (2004).</li><li>Berman, H. M. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=The+Protein+Data+Bank.">The Protein Data Bank.</a> Nucleic Acids Res. 28 (1), 235-242 (2000).</li><li>Finn, R. D., et al. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=Pfam:+the+protein+families+database.">Pfam: the protein families database.</a> Nucleic Acids Res. 42, D222-D230 (2014).</li><li>Kerns, S. J., et al. <a target="_blank" href="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&cmd=Search&doptcmdl=Citation&defaultField=Title+Word&term=The+energy+landscape+of+adenylate+kinase+during+catalysis.">The energy landscape of adenylate kinase during catalysis.</a> Nat. Struct. Mol. Biol. 22 (2), 124-131 (2015).</li></ol>

Die Autoren erklären, dass sie keine konkurrierenden finanziellen Interessen haben.

Bio3D-web kann verwendet werden, um die strukturellen, dynamischen und funktionellen Zustände von Proteinen interaktiv aus den verfügbaren kristallographischen Strukturen zu untersuchen und abzubilden. Darüber hinaus können die NMA- und PCA-basierten Clustering-Ergebnisse zusammen mit den Annotationen und der sequenzbasierten Analyse besonders nützlich sein, um repräsentative Strukturen für eine zeitaufwändige Analyse, wie z. B. Ensemble-Kleinmolekül-Docking- oder Molekulardynamik-Simulationen, auszuwählen. Bio3D-web erleichtert damit die fortgeschrittene strukturelle Bioinformatik-Analyse für ein breiteres Spektrum von Forschern durch die Verringerung des erforderlichen Fachwissens. Das aktuelle Design von Bio3D-Web unterstreicht die Einfachheit über die umfassende Einbeziehung der vielen Analysemethoden, die im gesamten Standalone-Bio3D-Paket zur Verfügung stehen. In vielen Fällen ist es vorgesehen, dass die Forscher Bio3D-Web nutzen, um allgemeine Trends in ihrer Proteinfamilie oder Superfamilie von Interesse zu verstehen, die dann mehr spezialisierte Analysen informieren können. Bio3D-web ist dasUm die biomolekularen Strukturdatensätze schnell zu erforschen und als hypothesenerzeugendes Werkzeug zu fungieren. Wir ermutigen die Benutzer, ihre Daten weiter zu erforschen, indem sie den Bio3D-Code in dem reproduzierbaren Bericht bereitstellen, der auch alle Abfragedetails und Analyseergebnisse speichert. In dem oben genannten repräsentativen Beispielprotokoll zeigen wir die Fähigkeit von Bio3D-web, die strukturellen Merkmale der funktionalen Konformationsübergänge von Adk aufzudecken. Zusätzliche Anwendungen von Bio3D-web beinhalten die Struktur- und Dynamikanalyse von vom Benutzer hochgeladenen PDB-Strukturen. Zum Beispiel kann der Benutzer neue Strukturen oder sogar Proteinsequenzen zur Analyse hochladen. Die zuvor erwähnten Analyseschritte, insbesondere der eNMA-Schritt, können sowohl lokale als auch globale Trends in Proteinbewegungen offenbaren, wobei kollektive Bewegungen von funktioneller Bedeutung sind. Der Vergleich mit Apo-Strukturen kann auch Merkmale von ungebundenen, gebundenen Konformationsübergängen zeigen. Weitere Anwendungsbeispiele fürEine Reihe von verschiedenen Proteinfamilien werden online zur Verfügung gestellt. Obwohl alle Proteine ​​flexible und dynamische Einheiten sind, haben nicht alle Proteine ​​atomare Auflösungsstrukturen, die in verschiedenen Zuständen verfügbar sind ( zB aktive und inaktive Zustände). Unsere Sicht auf den Proteinstrukturraum ist somit begrenzt und daher ist die Einsicht aus Werkzeugen wie Bio3D-Web notwendigerweise auch für bestimmte Proteine ​​begrenzt. Doch mit aktuellen technologischen Fortschritten und neuen Initiativen für die Strukturgenomik wird das hier vorgestellte Protokoll zunehmend zu einem wichtigen Weg, um Einblicke in wichtige Struktur-Funktions-Beziehungen zu gewinnen. Ein kritischer Schritt, der bei der Analyse von weiter entfernten Proteinen besonders wichtig ist, ist das mögliche Auftauchen von Ausrichtungsfehlern auf der Registerkarte ALIGN. Ausrichtungsfehler treten unvermeidlich auf, wenn die Sequenzähnlichkeit unter 30% sinkt und der Benutzer in solchen Fällen die Sequenzausrichtung überprüfen und korrigieren mussAuf der Registerkarte ALIGN. Ausrichtungsfehler führen möglicherweise zu falschen überlagerten Strukturen in der FIT-Registerkarte und maskieren die relevantesten Konformationsvariationen für den nachfolgenden PCA. Darüber hinaus sollte der Anwender sich über fehlende Reste in den ausgewählten PDB-Strukturen bewusst sein, wie bei der aktuellen Implementierung PCA kann nur an Proteinresten durchgeführt werden, bei denen alle Strukturen ihr entsprechendes Kohlenstoff-Alpha-Atom aufgelöst haben. Wenn folglich ein ausgewählter PDB ungelöste Reste für eine bestimmte Region des Proteins aufweist, wird diese Region von PCA weggelassen. Bio3D-Web ist derzeit auf die Analyse von Single-Chain-PDB-Strukturen beschränkt. Folglich können Funktionsbewegungen, die auf der quaternären Ebene auftreten, nicht mit dem aktuellen Protokoll erforscht werden. Obwohl wir derzeit neue Algorithmen entwickeln, um solche Analysen in Bio3D-Web einzubeziehen, ist die einzige aktuelle Option durch konventionelle Bio3D-Nutzung. Bio3D-Web ist die einzige Online-BewerbungIon, das es ermöglicht, Struktursets abzufragen und zu identifizieren, ihre Sequenzmuster und strukturelle Variabilität zu interpretieren und mechanistische Informationen sowohl von der Analyse als auch von der Vorhersage ihrer strukturellen Plastizität zu extrahieren. Eine breite Palette an molekularen Visualisierungswerkzeugen und Online-Servern ermöglicht es Forschern, einzelne biomolekulare Strukturen zu erforschen und zu analysieren. Allerdings erfordern die vorhandenen Werkzeuge für die Analyse der Sequenz, Struktur und Dynamik großer heterogener Proteinfamilien oftmals umfangreiche Rechenkenntnisse und sind in der Regel nur für Benutzer mit relevanten Programmierkenntnissen zugänglich. Zum Beispiel benötigt das Bio3D-Paket R 8 , ProDy benötigt Python und Maven erfordert Matlab-Kenntnisse 9 , 10 . Bio3D-Web im Gegensatz dazu erfordert keine Programmierkenntnisse und erhöht so die Zugänglichkeit und verringert die Eintrittsbarriere zur Durchführung fortgeschrittener Vergleichsfolge, Struktur und dyNamics analyse Darüber hinaus ist die Vorbereitung, Kuration, Annotation und Aufräumung von molekularen Strukturen, die häufig für eine effiziente Analyse notwendig ist, im Bio3D-Web Service enthalten. Darüber hinaus wird die Einschränkung für die Durchführung einer solchen Analyse auf fähige Berechnungsressourcen durch unsere Serverinstanz gemildert, die eine umfangreiche Analyse vieler Strukturen ermöglicht, die von jedem modernen Webbrowser initiiert und gesteuert werden können. Die offene Entwicklung von Bio3D-Web ist im Gange (siehe https://bitbucket.org/Grantlab/bio3d). Wir setzen fort, neue Analysefunktionalität hinzuzufügen und bestehende Methoden zu verbessern. Die zukünftige Entwicklung konzentriert sich auf die Hinzufügung von Distanzmatrix-basierten PCA- und Torsions-PCA, umfangreichere Sequenz-Konservierungsansätze, die eine phylogenetische Komponente, Ensemble-Bindungsstellenidentifizierung und neue Ansätze für eine dynamische Netzwerkanalyse über Proteinfamilien beinhalten. In dieser Hinsicht repräsentiert die aktuelle Webanwendung den AnfangszeigerT für viele andere kollaborative strukturelle bioinformatische Analysen-Workflows, indem es reproduzierbare und zugängliche Schritte auf benutzerdefinierte experimentelle Struktur-Sets ermöglicht. Wir planen auch zukünftige Unterstützung von rekonstruierten biologischen Einheitskoordinatensätzen zusätzlich zu Einzel- und Mehrfachketten aus der asymmetrischen Einheit der PDB-Strukturen. Zusätzliche Features beinhalten das verbesserte Speichern und Laden von kollaborativen Arbeitsräumen zusammen mit einer Undo-Möglichkeit. Bio3D-web ist eine Online-Anwendung für die interaktive Analyse von biomolekularen Strukturdaten. Bio3D-Web läuft auf jedem modernen Webbrowser und bietet Funktionalität für: (1) Die Identifizierung der verwandten Proteinstruktur setzt auf benutzerdefinierte Schwellenwerte der Ähnlichkeit; (2) Ihre mehrfache Ausrichtung und Strukturüberlagerung; (3) Sequenz- und Strukturerhaltungsanalyse; (4) Inter-Conformer-Relationship-Mapping mit Hauptkomponentenanalyse und (5) Vergleich der vorhergesagten internen Dynamik über Ensemble nochMal Modusanalyse Diese integrierte Funktionalität bietet einen kompletten Workflow für die Untersuchung von sequenzstruktur-dynamischen Beziehungen innerhalb von Proteinfamilien und Superfamilien. Zusätzlich zu einer bequemen, einfach zu bedienenden dynamischen Schnittstelle zur Erforschung der Effekte von Parameter- und Methodenwahlen zeichnet Bio3D-web auch die vollständigen Benutzereingaben und die nachfolgenden grafischen Ergebnisse einer Benutzersitzung auf. Dies ermöglicht es Benutzern, die Reihenfolge der Analyseschritte, die ihre Ergebnisse erstellt haben, einfach zu teilen und zu reproduzieren. Bio3D-Web ist vollständig in der R-Sprache implementiert und basiert auf den Paketen Bio3D und Shiny R. Es kann von unserem Online-Server ausgeführt werden oder lokal auf jedem Computer mit R installiert werden. Dies schließt lokale Server-Installation, um eine benutzerdefinierte Multi-User-Instanz mit Zugriff auf prioritäre strukturelle Datensätze wie die in der pharmazeutischen Industrie. Voller Quellcode und umfangreiche Dokumentation finden Sie unter einer GPL-3 Open-Source-Lizenz von: http://thegrantlab.org/ Bio3d / webapps

Die Proteindatenbank (PDB) enthält jetzt mehr als 120.000 Proteinstrukturen - viele davon sind dieselbe Proteinfamilie, aber unter verschiedenen experimentellen Bedingungen gelöst. Diese mehrfachen Strukturen stellen eine unschätzbare Ressource für das Verständnis der Feinheiten der Proteinform und -funktion dar. Beispielsweise kann der rigorose Vergleich dieser Strukturensembles wichtige molekulare Mechanismen 1 , 2 , 3 aufzeigen und über die Konformationsdynamik informieren, die an Prozessen einschließlich der Ligandenbindung, der enzymatischen Katalyse und der biomolekularen Erkennung 4 , 5 , 6 , 7 beteiligt ist . Neue Erkenntnisse können oft aus der detaillierten Großanalyse der Sequenz, Struktur und Dynamik von Proteinfamilien gewonnen werden. Dies erfordert jedoch typischerweise ein beträchtliches BioinfOrmatik und Computerprogrammierkenntnisse zusammen mit der Vertrautheit mit den zu untersuchenden Proteinsystemen. Zum Beispiel benötigen Softwarepakete wie Bio3D, ProDy und Maven die Programmierung in R, Python und Matlab bzw. 8 , 9 , 10 . Umgekehrt sind Online-Tools zur Analyse der strukturellen Flexibilität im Allgemeinen auf die Untersuchung der einzelnen Strukturen 11 , 12 beschränkt . Eine Ausnahme in dieser Hinsicht ist der kürzlich entwickelte WebNM @ Server, der den Vergleich von Flexibilitätsmustern ermöglicht, die aus der Normalmodusanalyse (NMA) mehrerer vorjustierter benutzerdefinierter Strukturen erhalten wurden 13 . Jedoch fehlt diesem Server ein automatisiertes Verfahren zur Identifizierung von Strukturen zum Vergleich, deren Ausrichtung oder weitere Analyse über NMA hinaus. Ein weiterer neuer Beitrag ist die Online-PDBFlex-Datenbank, die Pre-c präsentiertGestoßene Analyse von PDB-Strukturen, die 95% oder höhere Sequenzidentität teilen 14 . Allerdings ist die Analyse von vielfältigeren Struktursets derzeit nicht verfügbar. Wir haben bereits Bio3D-web präsentiert - eine einfach zu bedienende Webapplikation zur Analyse von Proteinsequenz-Struktur-dynamischen Beziehungen 15 . Bio3D-Web ist einzigartig in der Bereitstellung von einfach zu bedienenden integrierten Funktionalität für die Identifikation, Vergleich und detaillierte Analyse der großen homologen Struktur-Sets online. Hier stellen wir ein detailliertes Protokoll für die Online-Untersuchung der Proteinsequenz-Struktur-Dynamik-Beziehung mit Bio3D-Web vor. Bio3D-web bietet eine Vielzahl von Funktionen, um die fünf wichtigsten Schritte der Datenanalyse zu unterstützen, die in Abbildung 1 gezeigt sind und im Folgenden ausführlich diskutiert werden. Diese Schritte bilden einen Workflow, der sich von der Abfragesequenz oder der Struktureingabe über mehrere Ebenen der Sequenzstruktur-dynamischen Analyse erstreckt, um zusammenzufassenY berichtsgenerierung Die Ergebnisse sind sofort über umfangreiche In-Browser-Visualisierungs- und Plottergeräte sowie durch das Herunterladen von Ergebnisdateien in gängigen Formaten verfügbar. Neben einer komfortablen, einfach zu bedienenden, dynamischen Schnittstelle zur Erforschung der Effekte von Parameter- und Methodenwahlen zeichnet Bio3D-web auch die vollständigen Benutzereingaben und nachfolgenden grafischen Ergebnisse der Session eines Benutzers als einen spürbaren, reproduzierbaren Bericht in PDF-, DOC- und HTML-Formaten auf. User-Sessions können zu zukünftigen Zeiten gespeichert und neu geladen werden und komplette Ergebnisse heruntergeladen und weiter interpretiert werden durch das Bio3D R-Paket auf der lokalen Maschine eines Benutzers. Bio3D-web wird durch das Bio3D R-Paket zur Analyse der biomolekularen Struktur, der Sequenz und der molekularen Simulationsdaten 8 , 16 angetrieben. Insbesondere Bio3D-Algorithmen zur starren Kernidentifikation 8 , Überlagerung, Hauptkomponentenanalyse(PCA) 8 und die Ensemble-Normalmodusanalyse (eNMA) 16 bilden die Basis der Anwendung. Wir nutzen auch Bio3D-Protokolle, die von pHMMER 17 für die Identifizierung verwandter Proteinstrukturen und MUSCLE 18 für die mehrfache Sequenzausrichtung abhängen. Struktur- und Sequenz-Annotationen werden über Bio3D-Dienstprogramme aus den RCSB-PDB 19- und PFAM-Datenbanken 20 abgeleitet . Bio3D-Web kann von unserem Online-Server aus betrieben werden oder lokal auf jedem Computer installiert werden. R. Bio3D-Web steht allen Benutzern offen und wird kostenlos unter einer GPL-3 Open-Source-Lizenz von: http: // thegrantlab zur Verfügung gestellt. Org / bio3d / webapps

<table><tbody><tr><td>Bio3D-web</td><td></td><td></td><td></td></tr><tr><td>Web-site</td><td>http://thegrantlab.org/bio3d-web/</td><td></td><td></td></tr><tr><td>Requirements</td><td>Web browser</td><td></td><td></td></tr></tbody></table>

investigating protein sequence-structure-dynamics relationships with bio3d-web

Wir zeigen die Nutzung von Bio3D-Web für die interaktive Analyse von biomolekularen Strukturdaten. Die Bio3D-Web-Anwendung bietet Online-Funktionalität für: (1) Die Identifizierung der verwandten Proteinstruktur setzt auf benutzerdefinierte Schwellenwerte der Ähnlichkeit; (2) Ihre mehrfache Ausrichtung und Strukturüberlagerung; (3) Sequenz- und Strukturerhaltungsanalyse; (4) Inter-Conformer-Relationship-Mapping mit Hauptkomponentenanalyse und (5) Vergleich der vorhergesagten internen Dynamik über Ensemble-Normalmodusanalyse. Diese integrierte Funktionalität bietet einen kompletten Online-Workflow zur Untersuchung von sequenzstruktur-dynamischen Beziehungen innerhalb von Proteinfamilien und Superfamilien.

Adenylat-Kinase (Adk) ist ein ubiquitäres Enzym, das dazu dient, das Gleichgewicht zwischen zytoplasmatischen Nukleotiden, die für viele zelluläre Prozesse essentiell sind, zu erhalten. Adk arbeitet durch katalysieren der reversiblen Übertragung einer Phosphorylgruppe von ATP zu AMP. Diese Reaktion begleitet von gut untersuchten ratenbegrenzenden Konformationsübergängen 3 , 21 . Hier analysieren wir alle derzeit verfügbaren Adk-Strukturen mit Bio3D-web, um detaillierte Features und mechanistische Prinzipien dieser wesentlichen Übergänge zu vermitteln. Wir können unsere Bio3D-Web-Analyse von Adk beginnen, indem wir den RCSB-PDB-Code einer bekannten Adk-Struktur eingeben. Wenn zum Beispiel die Eingabe der PDB-ID 1AKE in Panel A der SEARCH-Registerkarte 167 Sequenz ähnliche Strukturen zurückgibt, aus denen die Top 26 automatisch zur weiteren Analyse ausgewählt werden (siehe Panel B). Die Annotation vorhandenEd in Panel C zeigt an, dass diese ausgewählten Strukturen alle von E. coli sind, wurden durch Röntgenbeugung in einem Bereich von Raumgruppen gelöst; Haben einen Auflösungsbereich von 1,63 bis 2,8 Å und wurden mit einer Reihe von verschiedenen Liganden (einschließlich keine Liganden, AMP, ADP, MG und dem Inhibitor AP5) co-kristallisiert. Beachten Sie, dass zusätzliche Anmerkungsdetails angezeigt werden können, indem Sie im Panel C auf &quot;Show / Hide Columns&quot; klicken. Bei der Eingabe der ALIGN-Registerkarte wird eine mehrfache Sequenzausrichtung durchgeführt. Die erste Tafel der ALIGN-Registerkarte zeigt eine Zusammenfassung der Ausrichtung an, die Details über die Anzahl der Sequenzzeilen (entspricht der Anzahl der PDB-Strukturen) sowie die Anzahl der Positionen ( dh Ausrichtungsspalten) enthält. Dies schließt eine Spezifikation der Anzahl der Spalt- und Spalt-Spalten ein. Die Figur auf der rechten Seite der ersten Reihe liefert eine schematische Darstellung der Sequenzausrichtung. Hier thE graue Bereiche repräsentieren Nichtspaltpositionen, während weiße Flächen in der Ausrichtung Lücken entsprechen. Eine Darstellung der Sequenzkonservierung ist oberhalb der Ausrichtung mit roten Bereichen gezeigt, die gut konservierte Positionen anzeigen, und Weiß, das weniger konserviert zeigt. Beachten Sie, dass die Sequenzen in dieser Figur auf der Grundlage ihrer Ähnlichkeit, die durch das Clustering-Dendrogramm auf der linken Seite zur Verfügung gestellt wird, geordnet sind. Das zweite Panel dieser Registerkarte erleichtert das Clustering der ausgewählten PDBs auf der Grundlage ihrer paarweisen Sequenzähnlichkeit, die entweder als Dendrogramm oder als Wärmekarte visualisiert werden kann. Standardmäßig ist ein Dendrogramm (oder Baumdiagramm) dargestellt, das die Anordnung von Clustern darstellt. Die y-Achse des Dendrogramms repräsentiert den Abstand (in Bezug auf die Sequenzidentität) zwischen den Clustern. Die Strukturüberlagerung erfolgt automatisch beim Eingeben der Registerkarte FIT. Die überlagerten Strukturen, die interaktiv in Panel A, Indica angezeigt werdenTe die Anwesenheit eines relativ starren Kernbereichs (mit den Resten 1-29, 68-117 und 161-214), siehe &quot;optionale Kern- und RMSD-Details&quot; an der Unterseite der FIT-Registerkarte für Details). Zwei weitere variable Nukleotid-bindende Regionen (Reste 30-67 und 118-167) sind ebenfalls deutlich sichtbar ( Abbildung 2 ). RMSD-basierte Clustering-Gruppen diese Strukturen in zwei verschiedene Konformationen. Ein Klick auf die PCA- Registerkarte zeigt deutlich die Beziehung zwischen den Strukturen in Bezug auf die Verschiebungen dieser Regionen, die effektiv über die gebundenen Nukleotidspezies in verwandten Strukturen schließen ( Abbildung 2B und 2C ). Die Mehrheit der Strukturen befindet sich in der &quot;geschlossenen&quot; Form (blau in Abbildung 2C ) und ist mit einem gebundenen Liganden oder Inhibitor assoziiert. Im Gegensatz dazu sind &quot;offene&quot; Konformationen Nukleotid und Inhibitor frei. Das ist im Einklang mitDie umfangreiche Erforschung der Adk-Struktur und -Dynamik, die darauf hinweist, dass eine offene Konfiguration dieser Regionen für die Nukleotidbindung und eine geschlossene Konformation für eine effiziente Phosphoryl-Übertragung und Unterdrückung von schädlichen Hydrolyse-Ereignissen erforderlich ist. Es ist bemerkenswert, dass ein einzelner PC 97% der gesamten mittleren quadratischen Verschiebung in diesem Adk-Struktur-Set erfasst und eine klare und überzeugende Beschreibung des offenen, geschlossenen Übergangs zusammen mit den einzelnen Restbeiträgen zu dieser funktionalen Verschiebung bereitstellt (Panel C der App Und Fig. 2 ). Der Besuch der NMA-Registerkarte und die Erhöhung der Anzahl der für die Berechnung berücksichtigten Strukturen (über die Verringerung des Cutoffs zum Filtern ähnlicher Strukturen) zeigt an, dass offene Zustandsstrukturen im Vergleich zu den geschlossenen Formularstrukturen eine verbesserte lokale und globale Dynamik aufweisen ( Abbildung 2D und Panel C von App) . Vergleich von PCA- und NMA-Ergebnissen fürEinzelne Strukturen (Panel D) zeigt an, dass der erste Modus aller offenen Formularstrukturen eine relativ hohe Überlappung zu PC1 (mit einem Mittelwert von 0,37 ± 0,04) aufweist. Im Gegensatz dazu zeigen geschlossene Formstrukturen niedrigere Werte (mit einem Mittelwert von 0,30 ± 0,01). RMSIP-Werte für offene Formstrukturen (0,62 ± 0,003) sind ebenfalls höher als die der geschlossenen Strukturen (0,56 ± 0,008). Darüber hinaus zeigt die Überlappungsanalyse, dass die ersten Modi des offenen Zustands in guter Übereinstimmung mit der Konformationsänderung sind, die die Differenz der offenen und geschlossenen Zustände (Tafel E) beschreibt. Das auf RMSIP-Werte basierende Clustering zeigt wieder eine konsistente Partitionierung von offenen und geschlossenen Zustandsstrukturen (Panel F). Gemeinsam zeigen diese Ergebnisse die Existenz von zwei großen deutlichen Konformationszuständen für Adk. Diese unterscheiden sich durch eine kollektive niederfrequente Verschiebung von zwei Nukleotid-Bindungsstellenregionen, die unterschiedliche Flexibi aufweisenBei der Nukleotidbindung. <img alt="Abbildung 1" src="/files/ftp_upload/55640/55640fig1.jpg" /> Abbildung 1: Bio3D-Web-Übersicht mit Screenshots der PCA- und NMA-Tabs. Bio3D-web nimmt eine vom Benutzer bereitgestellte Proteinstruktur oder Sequenz als Eingabe in die SEARCH-Registerkarte ( 1 ) ein. Der Server stellt eine Liste der verwandten Strukturen zur Verfügung, die für eine weitere Analyse ausgewählt werden können. ( 2 ) Die Registerkarte ALIGN bietet die Sequenzausrichtung und die Analyse der in der SEARCH-Registerkarte ausgewählten Strukturen. ( 3 ) Auf der Registerkarte FIT werden alle Strukturen in 3D überlagert und visualisiert, zusammen mit den Ergebnissen der konventionellen paarweisen Strukturanalyse. ( 4 ) Die Hauptkomponentenanalyse des Struktursatzes wird auf der Registerkarte PCA durchgeführt, um Interkonformer-Beziehungen zu charakterisieren. ( 5 ) Die normale Modusanalyse auf jeder Struktur kann auf der Registerkarte eNMA durchgeführt werdenDynamische Trends für die vorhandenen strukturellen Zustände zu erforschen. <a href="http://ecsource.jove.com/files/ftp_upload/55640/55640fig1large.jpg" target="_blank">Bitte klicken Sie hier, um eine größere Version dieser Figur zu sehen.</a> <img alt="Figur 2" src="/files/ftp_upload/55640/55640fig2.jpg" /> Abbildung 2: Ergebnisse der Bio3D-Web-Analyse der Adenylatkinase. ( A ) Verfügbare PDB-Strukturen der Adenylatkinase, die dem identifizierten invarianten Kern überlagert sind. Strukturen werden nach RMSD-basiertem Clustering gefärbt, das auf der Registerkarte FIT bereitgestellt wird. ( B ) Die Visualisierung der Hauptkomponenten ist auf der Registerkarte PCA verfügbar, um die wichtigsten Konformationsvariationen im Datensatz zu charakterisieren. Hier ist die Trajektorie, die der ersten Hauptkomponente entspricht, in der Rohrdarstellung gezeigt, die die großräumige Schließbewegung des Proteins zeigt. ( C ) Strukturen sind prAuf ihre beiden ersten Hauptkomponenten in einem Konformerplot, der eine niederdimensionale Darstellung der Konformationsvariabilität zeigt, Jeder Punkt (oder jede Struktur) wird nach benutzerdefinierten Kriterien gefärbt, in diesem Fall werden PCA-basierte Clusterergebnisse erzielt. ( D ) Die Normalmodusanalyse auf der Registerkarte eNMA schlägt eine verbesserte lokale und globale Dynamik für Strukturen im offenen Zustand (rot) im Vergleich zu den geschlossenen Formularen (blauen) Strukturen vor. <a href="http://ecsource.jove.com/files/ftp_upload/55640/55640fig2large.jpg" target="_blank">Bitte klicken Sie hier, um eine größere Version dieser Figur zu sehen.</a>

Watch this Scientific Journal Video about Investigating Protein Sequence-structure-dynamics Relationships with Bio3D-web at JoVE.com

Investigating Protein Sequence-structure-dynamics Relationships with Bio3D-web

Ein Protokoll für die Online-Untersuchung von Proteinsequenz-Struktur-Dynamik-Beziehungen mit Bio3D-Web wird vorgestellt.

Untersuchung der Proteinsequenz-Struktur-Dynamik Beziehungen zu Bio3D-Web

We demonstrate the usage of Bio3D-web for the interactive analysis of biomolecular structure data. The Bio3D-web application provides online functionality ...

investigating-protein-sequence-structure-dynamics-relationships-with

Research

JoVE Journal

Biochemistry

15.4K Aufrufe.  University of Michigan Medical School.  Ein Protokoll für die Online-Untersuchung von Proteinsequenz-Struktur-Dynamik-Beziehungen mit Bio3D-Web wird vorgestellt. 

Serie: Investigating Protein Sequence-structure-dynamics Relationships with Bio3D-web

Assessment of Immunologically Relevant Dynamic Tertiary Structural Features of the HIV-1 V3 Loop Crown R2 Sequence by ab initio Folding

The antigenic diversity of HIV-1 has long been an obstacle to vaccine design, and this variability is especially pronounced in the V3 loop of the virus' surface envelope glycoprotein. We previously proposed that the crown of the V3 loop, although dynamic and sequence variable, is constrained throughout the population of HIV-1 viruses to an immunologically relevant &beta;-hairpin tertiary structure. Importantly, there are thousands of different V3 loop crown sequences in circulating HIV-1 viruses, making 3D structural characterization of trends across the diversity of viruses difficult or impossible by crystallography or NMR. Our previous successful studies with folding of the V3 crown1, 2 used the ab initio algorithm 3 accessible in the ICM-Pro molecular modeling software package (Molsoft LLC, La Jolla, CA) and suggested that the crown of the V3 loop, specifically from positions 10 to 22, benefits sufficiently from the flexibility and length of its flanking stems to behave to a large degree as if it were an unconstrained peptide freely folding in solution. As such, rapid ab initio folding of just this portion of the V3 loop of any individual strain of the 60,000+ circulating HIV-1 strains can be informative. Here, we folded the V3 loop of the R2 strain to gain insight into the structural basis of its unique properties. R2 bears a rare V3 loop sequence thought to be responsible for the exquisite sensitivity of this strain to neutralization by patient sera and monoclonal antibodies4, 5. The strain mediates CD4-independent infection and appears to elicit broadly neutralizing antibodies. We demonstrate how evaluation of the results of the folding can be informative for associating observed structures in the folding with the immunological activities observed for R2.

Assessment of Immunologically Relevant Dynamic Tertiary Structural Features of the HIV-1 V3 Loop Crown R2 Sequence by ab initio Folding

The crown region of different V3 loop sequences of the surface envelope glycoprotein (gp120) of HIV-1 can be structurally characterized in many cases by in silico folding of positions 10 to 22 of the loop using a state-of-the-art ab initio folding algorithm. Here we demonstrate the folding and evaluation of this region of the V3 loop from the R2 strain of HIV-1, a uniquely neutralization sensitive strain with puzzling functional properties.

Bewertung von immunologisch relevanten dynamischen tertiären strukturellen Merkmale der HIV-1 V3-Loop Crown R2 Sequence durch Ab initio Folding

The antigenic diversity of HIV-1 has long been an obstacle to vaccine design, and this variability is especially pronounced in the V3 loop of the virus' ...

Forschung

Immunologie und Infektion

Optimization of Synthetic Proteins: Identification of Interpositional Dependencies Indicating Structurally and/or Functionally Linked Residues

Protein alignments are commonly used to evaluate the similarity of protein residues, and the derived consensus sequence used for identifying functional units (e.g., domains). Traditional consensus-building models fail to account for interpositional dependencies &#8211; functionally required covariation of residues that tend to appear simultaneously throughout evolution and across the phylogentic tree. These relationships can reveal important clues about the processes of protein folding, thermostability, and the formation of functional sites, which in turn can be used to inform the engineering of synthetic proteins. Unfortunately, these relationships essentially form sub-motifs which cannot be predicted by simple &#8220;majority rule&#8221; or even HMM-based consensus models, and the result can be a biologically invalid &#8220;consensus&#8221; which is not only never seen in nature but is less viable than any extant protein. We have developed a visual analytics tool, StickWRLD, which creates an interactive 3D representation of a protein alignment and clearly displays covarying residues. The user has the ability to pan and zoom, as well as dynamically change the statistical threshold underlying the identification of covariants. StickWRLD has previously been successfully used to identify functionally-required covarying residues in proteins such as Adenylate Kinase and in DNA sequences such as endonuclease target sites.

Synthetic protein sequences based on consensus motifs typically ignore co-evolving residues, that imply interpositional dependencies (IPDs). IPDs can be essential to activity, and designs that disregard them may result in suboptimal results. This protocol uses StickWRLD to identify IPDs and help inform rational protein design, resulting in more efficient results.

Optimierung der synthetische Proteine: Bezeichnung interpositional Abhängigkeiten Anzeige- strukturell und / oder funktionell verknüpft Rückstände

Protein alignments are commonly used to evaluate the similarity of protein residues, and the derived consensus sequence used for identifying functional ...

Chemie

Analyzing Dynamic Protein Complexes Assembled On and Released From Biolayer Interferometry Biosensor Using Mass Spectrometry and Electron Microscopy

In vivo, proteins are often part of large macromolecular complexes where binding specificity and dynamics ultimately dictate functional outputs. In this work, the pre-endosomal anthrax toxin is assembled and transitioned into the endosomal complex. First, the N-terminal domain of a cysteine mutant lethal factor (LFN) is attached to a biolayer interferometry (BLI) biosensor through disulfide coupling in an optimal orientation, allowing protective antigen (PA) prepore to bind (Kd 1 nM). The optimally oriented LFN-PAprepore complex then binds to soluble capillary morphogenic gene-2 (CMG2) cell surface receptor (Kd 170 pM), resulting in a representative anthrax pre-endosomal complex, stable at pH 7.5. This assembled complex is then subjected to acidification (pH 5.0) representative of the late endosome environment to transition the PAprepore into the membrane inserted pore state. This PApore state results in a weakened binding between the CMG2 receptor and the LFN-PApore and a substantial dissociation of CMG2 from the transition pore. The thio-attachment of LFN to the biosensor surface is easily reversed by dithiothreitol. Reduction on the BLI biosensor surface releases the LFN-PAprepore-CMG2 ternary complex or the acid transitioned LFN-PApore complexes into microliter volumes. Released complexes are then visualized and identified using electron microscopy and mass spectrometry. These experiments demonstrate how to monitor the kinetic assembly/disassembly of specific protein complexes using label-free BLI methodologies and evaluate the structure and identity of these BLI assembled complexes by electron microscopy and mass spectrometry, respectively, using easy-to-replicate sequential procedures.

Here we present a protocol to monitor the assembly and disassembly of the anthrax toxin using biolayer interferometry (BLI). Following assembly/disassembly on the biosensor surface, the large protein complexes are released from the surface for visualization and identification of components of the complexes using electron microscopy and mass spectrometry, respectively.

Analyse dynamischer Proteinkomplexe montiert auf und befreit Biolayer Interferometrie Biosensor mit Massenspektrometrie und Elektronenmikroskopie

In vivo, proteins are often part of large macromolecular complexes where binding specificity and dynamics ultimately dictate functional outputs. In this ...

Biochemie

Analyzing Protein Architectures and Protein-Ligand Complexes by Integrative Structural Mass Spectrometry

Proteins are an important class of biological macromolecules that play many key roles in cellular functions including gene expression, catalyzing metabolic reactions, DNA repair and replication. Therefore, a detailed understanding of these processes provides critical information on how cells function. Integrative structural MS methods offer structural and dynamical information on protein complex assembly, complex connectivity, subunit stoichiometry, protein oligomerization and ligand binding. Recent advances in integrative structural MS have allowed for the characterization of challenging biological systems including large DNA binding proteins and membrane proteins. This protocol describes how to integrate diverse MS data such as native MS and ion mobility-mass spectrometry (IM-MS) with molecular dynamics simulations to gain insights into a helicase-nuclease DNA repair protein complex. The resulting approach provides a framework for detailed studies of ligand binding to other protein complexes involved in important biological processes.

Mass spectrometry (MS) has emerged as an important tool for the investigation of structure and dynamics of macromolecular assemblies. Here, we integrate MS-based approaches to interrogate protein complex formation and ligand binding.

Analyse von Protein-Architekturen und Protein-Ligand-komplexen durch Integrative strukturelle Massenspektrometrie

Proteins are an important class of biological macromolecules that play many key roles in cellular functions including gene expression, catalyzing ...

Modeling an Enzyme Active Site using Molecular Visualization Freeware

Biomolecular visualization skills are paramount to understanding key concepts in the biological sciences, such as structure-function relationships and molecular interactions. Various programs allow a learner to manipulate 3D structures, and biomolecular modeling promotes active learning, builds computational skills, and bridges the gap between two dimensional textbook images and the three dimensions of life. A critical skill in this area is to model a protein active site, displaying parts of the macromolecule that can interact with a small molecule, or ligand, in a way that shows binding interactions. In this protocol, we describe this process using four freely available macromolecular modeling programs: iCn3D, Jmol/JSmol, PyMOL, and UCSF ChimeraX. This guide is intended for students seeking to learn the basics of a specific program, as well as instructors incorporating biomolecular modeling into their curriculum. The protocol enables the user to model an active site using a specific visualization program, or to sample several of the free programs available. The model chosen for this protocol is human glucokinase, an isoform of the enzyme hexokinase, which catalyzes the first step of glycolysis. The enzyme is bound to one of its substrates, as well as a non-reactive substrate analog, which allows the user to analyze interactions in the catalytic complex.

A key skill in biomolecular modeling is displaying and annotating active sites in proteins. This technique is demonstrated using four popular free programs for macromolecular visualization: iCn3D, Jmol, PyMOL, and UCSF ChimeraX.

Modellierung einer Enzym-Aktiv-Site mit Molekularer Visualisierung Freeware

Biomolecular visualization skills are paramount to understanding key concepts in the biological sciences, such as structure-function relationships and ...

<meta charset="utf8"></head><body>Vorhersage der Aminosäurepräferenzen von Protein-Protein-Bindungsgrenzflächen

Computational Prediction of Amino Acid Preferences of Potentially Multispecific Peptide-Binding Domains Involved in Protein-Protein Interactions

Many protein-protein interactions involve the binding of short protein segments to peptide-binding domains. Usually, such interactions require the recognition of linear motifs with variable conservation. The combination of highly conserved and more variable regions in the same ligands often contributes to the multispecificity of binding, a common property of enzymes and cell signaling proteins. Characterization of amino acid preferences of peptide-binding domains is important for the design of mediators of protein-protein interactions (PPIs). Computational methods are an efficient alternative to the often costly and cumbersome experimental techniques, enabling the design of potential mediators that can be later validated in downstream experiments. Here, we described a methodology using the Pepspec application of the Rosetta molecular modeling package to predict the amino acid preferences of peptide-binding domains. This methodology is useful when the structure of the receptor protein and the nature of the peptide ligand are both known or can be inferred. The methodology starts with a well-characterized anchor from the ligand, which is extended by randomly adding amino acid residues. The binding affinity of peptides generated this way is then evaluated by flexible-backbone peptide docking in order to select the peptides with the best predicted binding scores. These peptides are then used to calculate amino acid preferences and to optionally compute a position-weight matrix (PWM) that can be used in further studies. To illustrate the application of this methodology, we used the interaction between subunits of human interferon regulatory factor 5 (IRF5), previously known to be multispecific but globally guided by a short conserved motif called pLxIS. The estimated amino acid preferences were consistent with previous knowledge about the IRF5 binding surface. Positions occupied by phosphorylatable serine residues exhibited a high frequency of aspartate and glutamate, likely because their negatively charged side chains are similar to phosphoserine.

<meta charset="utf8"></head><body>Autor im Rampenlicht: Ein computergestützter Ansatz zur Entschlüsselung von Aminosäurepräferenzen in multispezifischen Protein-Protein-Wechselwirkungen

We describe a methodology based on sequence diversification to estimate the amino acid preferences of multispecific binding sites in protein-protein interactions (PPIs). In this strategy, thousands of potential peptide ligands are generated and screened in silico, thus overcoming some limitations of available experimental methods.

Computergestützte Vorhersage der Aminosäurepräferenzen potenziell multispezifischer Peptidbindungsdomänen, die an Protein-Protein-Wechselwirkungen beteiligt sind

Many protein-protein interactions involve the binding of short protein segments to peptide-binding domains. Usually, such interactions require the ...

A Protocol for Computer-Based Protein Structure and Function Prediction

Genome sequencing projects have ciphered millions of protein sequence, which require knowledge of their structure and function to improve the understanding of their biological role. Although experimental methods can provide detailed information for a small fraction of these proteins, computational modeling is needed for the majority of protein molecules which are experimentally uncharacterized. The I-TASSER server is an on-line workbench for high-resolution modeling of protein structure and function. Given a protein sequence, a typical output from the I-TASSER server includes secondary structure prediction, predicted solvent accessibility of each residue, homologous template proteins detected by threading and structure alignments, up to five full-length tertiary structural models, and structure-based functional annotations for enzyme classification, Gene Ontology terms and protein-ligand binding sites. All the predictions are tagged with a confidence score which tells how accurate the predictions are without knowing the experimental data. To facilitate the special requests of end users, the server provides channels to accept user-specified inter-residue distance and contact maps to interactively change the I-TASSER modeling; it also allows users to specify any proteins as template, or to exclude any template proteins during the structure assembly simulations. The structural information could be collected by the users based on experimental evidences or biological insights with the purpose of improving the quality of I-TASSER predictions. The server was evaluated as the best programs for protein structure and function predictions in the recent community-wide CASP experiments. There are currently &gt;20,000 registered scientists from over 100 countries who are using the on-line I-TASSER server.

Guidelines for computer based structural and functional characterization of protein using the I-TASSER pipeline is described. Starting from query protein sequence, 3D models are generated using multiple threading alignments and iterative structural assembly simulations. Functional inferences are thereafter drawn based on matches to proteins with known structure and functions.

Ein Protokoll für die Computer-Based Protein Structure and Function Prediction

Genome sequencing projects have ciphered millions of protein sequence, which require knowledge of their structure and function to improve the ...

Biologie

Analyzing and Building Nucleic Acid Structures with 3DNA

The 3DNA software package is a popular and versatile bioinformatics tool with capabilities to analyze, construct, and visualize three-dimensional nucleic acid structures. This article presents detailed protocols for a subset of new and popular features available in 3DNA, applicable to both individual structures and ensembles of related structures. Protocol 1 lists the set of instructions needed to download and install the software. This is followed, in Protocol 2, by the analysis of a nucleic acid structure, including the assignment of base pairs and the determination of rigid-body parameters that describe the structure and, in Protocol 3, by a description of the reconstruction of an atomic model of a structure from its rigid-body parameters. The most recent version of 3DNA, version 2.1, has new features for the analysis and manipulation of ensembles of structures, such as those deduced from nuclear magnetic resonance (NMR) measurements and molecular dynamic (MD) simulations; these features are presented in Protocols 4 and 5. In addition to the 3DNA stand-alone software package, the w3DNA web server, located at <a href="http://w3dna.rutgers.edu" target="_blank">http://w3dna.rutgers.edu</a>, provides a user-friendly interface to selected features of the software. Protocol 6 demonstrates a novel feature of the site for building models of long DNA molecules decorated with bound proteins at user-specified locations.

The 3DNA software package is a popular and versatile bioinformatics tool with capabilities to analyze, construct, and visualize three-dimensional nucleic acid structures. This article presents detailed protocols for a subset of new and popular features available in 3DNA, applicable to both individual structures and ensembles of related structures.

Analysieren und Bauen Nukleinsäurestrukturen mit 3DNA

The 3DNA software package is a popular and versatile bioinformatics tool with capabilities to analyze, construct, and visualize three-dimensional nucleic ...

Untersuchung der Proteinsequenz-Struktur-Dynamik Beziehungen zu Bio3D-Web

Zusammenfassung

Weitere Videos entdecken

Bewertung von immunologisch relevanten dynamischen tertiären strukturellen Merkmale der HIV-1 V3-Loop Crown R2 Sequence durch Ab initio Folding

Optimierung der synthetische Proteine: Bezeichnung interpositional Abhängigkeiten Anzeige- strukturell und / oder funktionell verknüpft Rückstände

Analyse dynamischer Proteinkomplexe montiert auf und befreit Biolayer Interferometrie Biosensor mit Massenspektrometrie und Elektronenmikroskopie

Analyse von Protein-Architekturen und Protein-Ligand-komplexen durch Integrative strukturelle Massenspektrometrie

Modellierung einer Enzym-Aktiv-Site mit Molekularer Visualisierung Freeware

Computergestützte Vorhersage der Aminosäurepräferenzen potenziell multispezifischer Peptidbindungsdomänen, die an Protein-Protein-Wechselwirkungen beteiligt sind

Computergestützte Vorhersage der Aminosäurepräferenzen potenziell multispezifischer Peptidbindungsdomänen, die an Protein-Protein-Wechselwirkungen beteiligt sind

Computergestützte Vorhersage der Aminosäurepräferenzen potenziell multispezifischer Peptidbindungsdomänen, die an Protein-Protein-Wechselwirkungen beteiligt sind

Ein Protokoll für die Computer-Based Protein Structure and Function Prediction

Analysieren und Bauen Nukleinsäurestrukturen mit 3DNA