נתונים מדעיים הפכו מורכבים ועשירים יותר ויותר במהלך העשורים האחרונים, אך מדענים ממשיכים להשתמש בשיטות ארגון שכבר אינן עונה על צרכי הנתונים המתרחבים שלהם. היתרון העיקרי של טכניקה המתוארת בסרטון זה הוא שהיא מאפשרת מסד נתונים המעניק צינור נתונים ואחסון קפדניים תוך שמירה על גמישות לניתוח נתונים. כדי להתחיל בהערכה של ערכת הנתונים המעניינים, הורד את הקודים ומסדי הנתונים לדוגמה המוצגים בטבלה זו.
לאחר מכן, השתמש בייצוג גרפי זה של מסד נתונים רב-ממדי כדי להעריך אם ערכת הנתונים של הריבית אכן רב-ממדית. הנתונים צריכים לעמוד בשני תנאים כדי ליהנות מארגון מסד הנתונים. ראשית, הנתונים צריכים להיות מסוגלים להיות חזותיים בצורה רב-מיתית.
ושנית, היא חייבת לקבל תובנה מדעית גדולה יותר על ידי היכולת לקשר תוצאה ניסיונית ספציפית לכל אחד מהממדים. מסדי נתונים יחסיים מאחסנים מידע בצורה של טבלאות המאורגנות בשורות ובעמודות ובאפשרותך להשתמש בהן כדי לקשר מידע מזהה בתוך מסד הנתונים. ריבוי תחומים מטופל על-ידי התייחסות בין שדות שונים, כגון עמודות הטבלה וטבלאות בודדות, זה לזה.
ראשית, לארגן את קבצי הנתונים כך שהם חשבו היטב, שמות ייחודיים. תרגול טוב עם מוסכמות למתן שמות לקבצים ומבני תיקיות/תיקיות משנה מאפשרים מדרגיות מסד נתונים רחבה מבלי להתפשר על הקריאות של גישה לקבצים באופן ידני. הוסף קבצים מתוארכים בתבנית עקבית ותיקיות משנה של שמות בהתאם למטא-נתונים.
כאשר מבנה מסד הנתונים מעוצב, צייר קשרי גומלין בין השדות בטבלאות שונות. צור תיעוד README המתאר את מסד הנתונים ואת קשרי הגומלין שנוצרו. זה יכול להיות גם גרפי כמו דמות זו או מבוסס טקסט.
לאחר שערך בין טבלאות שונות מקושר, כל המידע המשויך קשור לערך זה ובאפשרותך להשתמש בו כדי לקרוא לשאילתות מורכבות כדי לסנן כלפי מטה אל המידע הרצוי. הפוך את התוצאה הסופית לדומה לדוגמה זו שבה המאפיינים השונים של אנשים קשורים לנתונים ניסיוניים משויכים של אנשים אלה. הדבר נעשה באמצעות התייחסות עמודות של סוגי תבניות וסוגי נתונים לערכים תואמים בטבלה הראשית DataValues כדי להסביר סיומים קצרים שונים.
זהה את כל שיטות הניסויים וניתוח הנתונים השונות שעשויות להוביל לאיסוף נתונים, יחד עם נוהלי אחסון הנתונים הרגילים עבור כל סוג נתונים. עבוד עם תוכנת בקרת גירסאות קוד פתוח כגון GitHub כדי להבטיח עקביות ובקרת גירסאות נחוצות תוך מזעור נטל המשתמש. הקפד ליצור הליך למתן שמות ואחסון עקביים של נתונים כדי לאפשר צינור אוטומטי.
השתמש בכל שפת תיכנות נוחה כדי ליצור ערכי נתונים חדשים עבור מסד הנתונים. צור טבלאות עוזרים קטנות בקבצים נפרדים שיכולים להנחות בחירה אוטומטית של נתונים. קבצים אלה משמשים כתבנית של אפשרויות עבור הצינור לפעול תחת והם קלים לעריכה.
כדי ליצור ערכי נתונים חדשים עבור צינור הנתונים, תכנת את הקוד באופן דומה לדוגמה המוצגת כאן המסופקת בקבצים המשלים עם מאמר זה. פעולה זו תאפשר למשתמש להשתמש בטבלאות המסייעות כקלט שנבחר על-ידי המשתמש. מכאן, הרכב גיליון אלקטרוני חדש של מיקומי קבצים על-ידי שילוב הערכים החדשים עם הערכים הקודמים.
הקוד המוצג כאן ומסופק בקבצים המשלים יכול לשמש כדי להפוך תהליך זה לאוטומטי. לאחר מכן, בדוק אם קיימים כפילויות בגיליון האלקטרוני הממוזג באמצעות הקוד המוצג כאן כדי להפוך שלב זה לאוטומטי. בנוסף, בדוק אם קיימות שגיאות בגיליון האלקטרוני באמצעות שיטה אוטומטית והודע למשתמש על הסיבה והמיקום שלו.
יתר על כן, באפשרותך לכתוב קוד שיבדוק את מסד הנתונים המהודר ויזהה נקודות נתונים רעות חסרות. הסר באופן ידני נקודות רעות מבלי לאבד את שלמות מסד הנתונים באמצעות קוד דומה למה שמוצג כאן. חזור על שלבים אלה כדי להוסיף נקודות נתונים נוספות.
לאחר מכן השתמש במיקומי הקבצים כדי ליצור גיליון אלקטרוני של ערך נתונים. כמו כן, צור רשימה מעודכנת של ערכים שניתן לגשת אליהם כדי לזהות מיקומי קבצים או למזג אותם עם ערכים עתידיים. כדי להתחיל ביצירת מסד נתונים, צור תחילה מסמך מסד נתונים ריק כדי לטעון את טבלת המסייעים עבור שורות התאים, סוגי הנתונים וסוגי הדוגמאות.
עבור לתפריט נתונים חיצוניים, בחר ייבוא קובץ טקסט, לחץ על עיון ולאחר מכן בחר את הקובץ הרצוי. באשף הייבוא, בחר מופרד ולחץ על הבא. בחר שורה ראשונה מכילה שמות שדות ופסיק עבור סוג המפריד.
לאחר לחיצה על הבא, בחר באפשרויות ברירת המחדל של השדה ולאחר מכן בחר ללא מפתח ראשי. לחץ על הבא ולאחר מכן סיים. לאחר מכן, טען את סוגי הנתונים והתבניות על-ידי חזרה על אותם שלבים.
לאחר מכן, טען את טבלת ערכי הנתונים. עבור לתפריט נתונים חיצוניים, בחר ייבוא קובץ טקסט, לחץ על עיון ולאחר מכן בחר את הקובץ הרצוי. באשף הייבוא, בחר מופרד ולחץ על הבא.
בחר שורה ראשונה מכילה שמות שדות ופסיק עבור סוג המפריד. לאחר לחיצה על הבא, בחר באפשרויות ברירת המחדל של השדה ולאחר מכן בחר אפשר ל- Access להוסיף מפתח ראשי. לחץ על הבא ולאחר מכן סיים.
כעת צור את קשרי הגומלין על-ידי בחירת כלי מסד הנתונים, עבור אל קשרי גומלין וגרירה של כל הטבלאות אל הלוח. לאחר מכן עבור אל עריכת קשרי גומלין ובחר צור חדש. בחר את שמות הטבלה והעמודות ולאחר מכן לחץ על סוג הצירוף שיצביע על טבלאות המסייעים.
לאחר הגדרת כל קשר גומלין רצוי, עבור אל צור ובחר עיצוב שאילתה ובחר או גרור את כל הטבלאות הרלוונטיות לחלון העליון. בדוגמה זו, מוצגים קווי תא, ערכי נתונים, סוגי נתונים וסוג תבנית. על קשרי הגומלין להיות מוגדרים באופן אוטומטי בהתבסס על עיצוב קשר הגומלין הקודם.
כעת, מלא את עמודות השאילתה לקבלת התוצאות הרצויות. עבור ערכת נתונים זו, עבור אל הצגה ובחירת סכומים. מלא את העמודה הראשונה, העמודה השניה והעמודה השלישית כפי שמוצג כאן.
מלא את הגיס הרביעי, את הגיס החמישי ואת הגיס השישי גם כן. לאחר שתסיים למלא את העמודות, שמור והפעל את השאילתה. עבור נתונים ניסיוניים לדוגמה זו, השתמש בניתוח חד-כיוון של שונות באמצעות הבדיקה של Tukey להשוואות ממוצעות בין תנאים שונים.
כאשר ניתנים מספר רב של אישורים אפשריים, זה יכול להיות קשה לזהות היכן קיימים יחסים חדשים באמצעות שיטות צבירת נתונים ידניות. כאן, הארגון של תווי actin subcellular על פני תנאים מרובים נמדדו באמצעות מידת סדר הכיוון על ידי ביצוע שאילתה על מסד הנתונים באישורים שונים. ערכות הנתונים אניזוטרופית איזוטרופית להראות OOPs שונים בהרבה, אשר היה צפוי מאז micropatterning fibronectin משפיע מאוד על ארגון רקמות.
עם זאת, לא היו הבדלים משמעותיים בין תנאי מצב מוטציה בעת השוואת רקמות איזוטרופיות. לעומת זאת, רקמות התבנית היו פחות מאורגנות סטטיסטית בקו תא הבקרה החיובי. מערכת יחסים זו התקיימה גם כאשר הנתונים נצבר על ידי משפחות שונות לעומת שליטה חיובית ושלילית.
במידת הצורך, ניתן לנתח את הנתונים עוד יותר. כדוגמה, כאן actin OOP התווה נגד גילו של הפרט בזמן הביופסיה, מופרד על ידי מעמד מוטציה ומשפחה כדי להמחיש צבירה נגד משתנה קליני. עם ערכת נתונים זו, אין מתאם בין ארגון actin לבין גילו של אדם.
זה מראה כיצד ניתן לנתח את אותם נתונים בשילובים שונים ובאופן שבו ניתן לבצע בקלות את המשימה הקשה בדרך כלל של צבירת נתונים שנופלים תחת מחלקות מרובות באמצעות מסדי נתונים. פרוטוקול זה ליצירת צינור ארגוני של נתונים וליצור מסד נתונים מספק הקפדה מדעית החיונית לחלוטין בעידן זה של איסוף נתונים בכמויות גדולות.