הפרוטוקול שלנו מדגים כיצד תוכנת קוד פתוח יכולה לאפשר לכל חוקר ליצור ולאצור ספריית מבנה חישובית. ערעור הפרוטוקולים הזה נובע מהפתיחות והגמישות שלו. כל אחד יכול להשתמש בו ולשנות אותו כך שיתאים לשאלת המחקר הספציפית שלו.
ניתן ליישם גרסאות של פרוטוקול זה על יישומי גילוי תרופות, תוך יצירת ספריות מבנה ספציפיות במהירות לסינון סיליקו. למרות שהפרוטוקול מוסבר צעד אחר צעד, אם משתמשים אינם מכירים את Java או קידוד בסיסי הם יכולים תחילה להסתכל על אלה לפני יישום הפרוטוקול. התחל על ידי יצירת ספרייה חדשה עבור הפרויקט.
מקם את כל הקבצים והתקני ההפעלה בספריה זו לגישה נוחה. הורד את הגרסה האחרונה של Maygen כקובץ צנצנת ואת תוכנת ניהול החבילות Anaconda. במערכות Windows חפש את הנחיית Anaconda ולחץ על קיצור הדרך שנוצר כדי לפעול.
כדי ליצור סביבת RDKit באנקונדה ולהוריד את ה- RDKit לסביבה, הקלד את הפקודה המוצגת על המסך, לחץ על Enter כדי לפעול וענה כן על כל שאלה שעולה במהלך ההתקנה. לאחר מכן הורד את מחברות Jupyter וקבצי הטקסט של תבניות המצע מהקבצים המשלימים, אחד עד חמישה. בשורת הפקודה, נווט אל הספריה המכילה את המייגן.
קובץ הפעלה של צנצנת. עבור כל נוסחה כימית מעניינת השתמש בפקודה המוצגת על המסך כדי להפעיל את Maygen. אם הנוסחה היא נוסחה מטושטשת במקום נוסחה בדידה, החלף את דגל המקף F בדגל מקף מטושטש והקף את כל מרווחי הרכיבים בסוגריים.
בשורת אנקונדה נווט אל התיקיה המכילה את מחברות Jupyter והפעל את סביבת RDKit. המחברות שהורדת דורשות RDKit. כך שכל שימוש עתידי בהם בפרוטוקול זה יחייב אותם להיפתח בסביבת RDKit.
לאחר מכן, פתח את מחברת Jupyter לסינון תת-מבנה וסגור את שם הקובץ במרכאות אם הוא מכיל רווחים. בתא המיועד בתחילת המחברת הזן את נתיב הקובץ המלא של קובץ sdf הקלט. נתיב הקובץ המלא של קובץ הפלט הרצוי sdf ונתיב הקובץ של קובץ הרשימה הגרועה כמחרוזות.
אם יש לשמור מבני משנה מסוימים בספריה המסוננת או ברשימה טובה, צור קובץ txt של תבניות SMARTS עבור מבני משנה אלה והצב את נתיב קובץ הרשימה הטוב בשורה המיועדת בתחילת המחברת. מהתפריט בחלק העליון בחר ליבה, הפעל מחדש והפעל הכל כדי להפעיל מחדש את ליבת המחברת ולהפעיל את כל התאים. קובץ sdf עם השם הרצוי ייווצר בתיקיית הפלט שצוינה.
חזור על שלבים אלה עבור כל קובץ מבנה שנוצר על-ידי Maygen. להחלפת פסאודו-אטום, פתח הנחיה של Anaconda, נווט אל התיקיה המכילה את מחברות Jupyter והפעל את סביבת RDKit. לאחר מכן פתח את מחברת Jupyter להחלפה פסאודו-אטומית.
בתא המיועד בתחילת המחברת הזן את נתיב הקובץ המלא של קובץ sdf הקלט ואת נתיב הקובץ המלא של קובץ הפלט הרצוי sdf כמחרוזות. הפעל מחדש את ליבת המחברת והפעל את כל התאים כדי לקבל קובץ sdf עם השם הרצוי בתיקיית הפלט שצוינה. באופן דומה, פתחו הנחיית אנקונדה לכיסוי חומצות אמינו N ו-C.
נווט אל התיקיה המכילה את מחברות Jupyter והפעל את סביבת RDKit. פתחו את מחברת Jupyter לכיסוי חומצות אמינו. בתא המיועד בתחילת המחברת הזן את נתיב הקובץ המלא של קובץ sdf הקלט ואת נתיב הקובץ המלא של קובץ הפלט הרצוי sdf כמחרוזות.
הפעל מחדש את ליבת המחברת והפעל את כל התאים כדי לקבל קובץ sdf עם השם הרצוי בתיקיית הפלט שצוינה. עבור יצירת המתארים מקם את כל קבצי ה- sdf שעבורם יש לחשב מתארים בתיקיה אחת. לאחר מכן הורד את תיאור PaDEL, פתח אותו וחלץ אותו לתיקיה זו.
פתח שורת פקודה, נווט אל התיקיה המכילה את קובץ צנצנת המתאר PaDEL והפעל את מתאר PaDEL עבור קבצי sdf שנאספו. המרחב הכימי של כל ספריות חומצות האמינו המסוננות מוצג כאן. סמנים שחורים מייצגים חומצות אמינו מהספריות ללא גופרית וסמנים צהובים מייצגים חומצות אמינו מספריות מועשרות בגופרית.
כאן, VAIL וספריות VAIL_S מיוצגות על ידי מעגלים. ספריות DEST ו- DEST_S מיוצגות על ידי ריבועים. ספריות Proline ו-Pro S מיוצגות על ידי משולשים וכוכבים מייצגים חומצות אמינו מקודדות.
טווח ערכי הלוג P האפשריים גדל עם הנפח המולקולרי אפילו בתוך הספריות שחסרות במפורש שרשראות צד הידרופיליות. חומצות אמינו מקודדות עם שרשראות צד פחמימנים הן הידרופוביות יותר מרוב חומצות האמינו האחרות בנפח דומה מהספרייה המתאימה להן. זה גם המקרה של מתיונין מתעקש בהשוואה לחברים אחרים בספריית VAILS עם כרכים דומים.
חומצות אמינו מקודדות עם שרשראות צד הידרוקסיל היו בין החברים הקטנים ביותר בספריית DEST עם חומצה אספרטית רק מעט גדולה יותר משלוש אנין. התמונה המיוצגת מציגה את הנפחים הממוצעים של ואן דר ואל של ספריות עם גופרית וללא גופרית. תחליפי גופרית הובילו לעלייה קלה בנפח המולקולרי בכל הספריות.
ערכי מקדם החלוקה הממוצעים של ספריות עם ובלי גופרית מוצגים כאן. ההשפעה של החלפת גופרית על לוג P אינה הומוגנית כמו נפח. התמונה הייצוגית מציגה את ההשפעות של פסאודו-אטום טריוולנטי על יצירת מבנה מייגן.
שימוש בפסאודואטום ביצירת מבנים הפחית את מספר המבנים הנוצרים בשלושה סדרי גודל בסך הזמן הדרוש ליצירת מבנים אלה בסדר גודל אחד עד שניים. בעקבות פרוטוקול זה, ניתן לשלב פונקציות נוספות בעתיד בהתבסס על צרכי החוקרים. לדוגמה, ניתן לשלב מסנני תת-מבנה ב-Maygen כדי להימנע מהשלב שלאחר העיבוד.
יצירת ספרייה, אוצרות ושינוי. תהליך כללי זה יכול להכיל מבנים מולקולריים אחרים ושינויים עם ידע מסוים בקידוד, שיאפשר לחוקרים לחקור ספריות חישוביות מעבר לאלה של חומצות אמינו אלפא. פרוטוקול זה יסייע לחוקרים לשפר את עבודתם החישובית בתחום מקורות החיים.
ערכות כלים בקוד פתוח יסייעו מאוד למאמצים אלה.