מטרת פרוטוקול זה היא לחשוף דינמיקה מבנית של דיפוזיה חד-ממדית של חלבון לאורך דנ"א, תוך שימוש בחלבון מקדם שעתוק צמחי WRKY כמערכת מופתית. ההדמיות האטומיות תחת בניית מודל מצב מרקוב חושפות תנועות דריכה של 1-bp של חלבון לאורך דנ"א בפרטים אטומיים. בעוד ההדמיות הגסות מתמקדות בדגימה של דיפוזיות תהליכיות של חלבונים מעל 10 של bps לאורך הדנ"א.
כדי להתחיל, השתמש במסלול MD של 10 מיקרו-שניות עם כל האטום כדי לחלץ 10, 000 מסגרות באופן שווה קדימה, נתיב דריכה אחד של זוג בסיסים. הכן את נתיב המעבר עם 10, 000 מסגרות ב- VMD על-ידי לחיצה על קובץ ושמור קואורדינטות. לאחר מכן, הקלד חלבון או גרעין בתיבה אטומים נבחרים.
בחרו 'מסגרות' בתיבת המסגרות ולחצו על 'שמור' כדי לקבל את המסגרות הדרושות. יישרו את הציר הארוך של הייחוס מהמבנה הגבישי של הדנ"א לציר ה-x, וקמו את מרכז המסה הראשוני של הדנ"א המלא של 34 זוגות הבסיסים במקור מרחב הקואורדינטות על ידי לחיצה על הרחבות ולאחר מכן בחירה ב-TkConsole ב-VMD. לאחר מכן, הקלד את הפקודה בחלון הפקודה TkConsole.
לאחר מכן, חשב את השורש פירושו מרחק ריבועי של עמוד השדרה של החלבון על-ידי לחיצה על VMD, ולאחר מכן עבור אל הרחבות, לחץ על ניתוח ובחר את כלי המסלול של RMSD. בתיבת בחירת האטום, הקלד גרעין ושאריות 14 עד 23, ו- 46 עד 55. לחץ על יישור ולאחר מכן על תיבת RMSD.
כדי לחשב את מידת הסיבוב של החלבון סביב תטא T DNA, כאשר המיקום הזוויתי הראשוני מוגדר כתטא 0, במישור XY ב- MATLAB, בצע את הפקודה. הזן את ההוראות ב- MATLAB כדי להשתמש בשיטות K-means, וסווג את המבנים של 10, 000 ל- 25 אשכולות. לאחר שתסיים, אסוף את המבנים של 25 מרכזי האשכולות לסימולציה נוספת של MD.
כדי לבצע את סימולציית MD הסיבוב הראשון, בנה מערכת אטומיסטית עבור 25 המבנים באמצעות GROMACS, וקובץ sh של מערכת הבנייה. ביצוע 60 ננו-שניות הדמיות MD עבור 25 המערכות תחת אנסמבל NPT עם שלב זמן של שתי femtosecond על ידי עיבוד הפקודה במעטפת. כדי לקבץ את מסלולי MD בסיבוב הראשון, הסר את 10 הננו-שניות הראשונות של כל מסלול סימולציה ואסוף אישורים ממסלולים של 25 פעמים 50 ננו-שניות.
עבור ניתוח רכיבים בלתי תלוי בזמן, הזן את הסקריפט ב- GROMACS, ולאחר מכן בחר זוגות מרחק בין חלבון לדנ"א כפרמטרים של קלט. מתוך האינדקס. קובץ ndx, לאינדקס קובץ טקסט חדש.dat.
כדי לקבל את המידע הזוגי בין אטומים אלה, השתמש בסקריפט Python. חשב את 415 זוגות המרחקים מכל מסלול בחלון הפקודה של MSMBuilder. לאחר מכן, בצע ניתוח רכיבים בלתי תלוי בזמן כדי להקטין את ממד הנתונים לשני הרכיבים או הווקטורים העצמאיים הראשונים על ידי ביצוע הפקודה.
עם עיבוד ההוראה ב- MSMBuilder, קבץ את ערכות הנתונים הצפויות ל- 100 אשכולות בשיטת מרכז המקרה ובחר את מבנה המרכז של כל אשכול. כדי לבצע סימולציית MD בסיבוב השני, ערכו 60 סימולציות MD של ננו-שניות החל מ-100 המבנים הראשוניים. לאחר הטלת מהירויות ראשוניות אקראיות על כל האטומים, הוסף את המהירויות הראשוניות האקראיות על ידי הפעלת דור המהירות בקובץ MDP.
הסר את 10 הננו-שניות הראשונות של כל סימולציה כמתואר קודם לכן. ולאסוף 2, 500, 000 תמונות מתוך 100 פעמים 50 ננו-שניות מסלולים, באופן שווה, כדי לבנות את MSM. כדי לקבץ מסלולי MD בסיבוב השני, בצע את ניתוח הרכיבים הבלתי תלוי בזמן עבור מסלולי הסיבוב השני ב- MSMBuilder כפי שמוצג.
וחשב את סולם הזמן המשתמע כדי לאמת פרמטרים על ידי ביצוע סקריפט Python. לאחר מכן, שנה את זמן ההשהיה טאו ואת מספר המיקרו-מצבים על-ידי שינוי הפרמטרים. סווג את האישורים ל-500 אשכולות על-ידי ביצוע הפקודה.
עבור בניית MSM, רכזו את 500 המיקרו-מצבים לשלושה עד שישה מצבי מאקרו. כדי לגלות את מספר מצבי המאקרו המתאימים ביותר, על פי אלגוריתם PCCAplus ב- MSMBuilder באמצעות סקריפט Python. מיפו את האישורים הממדיים הגבוהים ל-X ואת זווית הסיבוב של החלבון לאורך הדנ"א עבור כל מיקרו-מצב.
כדי לחשב את זמני המעבר הראשונים הממוצעים, בצע חמישה מסלולי מונטה קרלו של 10 אלפיות השנייה, בהתבסס על מטריצת הסתברות המעבר של 500 מיקרו-מצב MSM עם זמן השהיה של 10 ננו-שניות שנקבע כצעד הזמן של מונטה קרלו. חשב את זמני הקטע הראשון הממוצעים בין כל זוג מצבי מאקרו בתוך כתב Python ואת ממוצע השגיאות הסטנדרטיות של זמני הקטע הראשון הממוצעים באמצעות קובץ Bash. בתוכנת CafeMol 3.0, הפעל את הסימולציה המגורענת במסלול על ידי ביצוע הפקודה על המסוף.
לאחר ציון הבלוקים בקובץ הקלט, הגדר את בלוק שמות הקבצים ואת בלוק job_cntl עם הפקודות הבודדות. לאחר מכן, הגדר את בלוק unit_and_state, ולאחר מכן הגדרת בלוק energy_function ואת בלוק md_information. כל אישורי החלבונים בדנ"א מופו לתנועת האורך X ולזווית הסיבוב של החלבון לאורך הדנ"א, שניתן לקבץ אותם עוד יותר לשלושה מצבי מאקרו.
מצב S1 פחות נוח מכיוון שקשרי המימן דומים למבנה הממודל, ואילו S3 מתייחס למצב מטא-יציב שבו כל קשרי המימן זזו לאחר דריכה של זוג בסיסים אחד ונראו יציבים עם האוכלוסייה הגבוהה ביותר של 63% מצב הביניים S2 מחבר את S1 ו-S3 עם אוכלוסייה בינונית גבוהה של 30%המעבר של S2 ל-S3 מאפשר שבירה קולקטיבית ורפורמה של קשרי המימן בכשבעה מיקרו-שניות, בעוד שמעבר S1 ל-S2 יכול להתרחש בכ-0.06 מיקרו-שניות. מספרי המגע בין חלבון לדנ"א חושבו וזוהו ארבעה מצבים. במדינות 1 ו-3, אזור אצבעות האבץ נקשר לכיוון Y.
ואילו במדינות 2 ו-3, אזור אצבע האבץ נקשר לכיוון Y. גודל הדריכה של כל שארית שמורה על רצפים שונים של דנ"א נמדד, מה שגילה כי גדלי הדריכה של שאריות אלה מסונכרנים יותר על דנ"א פוליA מאשר על פוליאט או רצפי דנ"א אקראיים. השלבים החשובים בבניית מודל מצב מרקוב הם בחירת זוגות מרחקים בין תיקוני נתוני חלבון ודנ"א לתנועות הדריכה של 1 bp, ובחירה של מספר מתאים של מיקרו-מצבים ומאקרו-מצבים.