وقد ازدادت البيانات العلمية تعقيداً وثراءً على مدى العقدين الماضيين، ومع ذلك يواصل العلماء استخدام أساليب التنظيم التي لم تعد تلبي احتياجاتهم المتزايدة من البيانات. الميزة الرئيسية لتقنية الموصوفة في هذا الفيديو هي أنها تسمح بقاعدة بيانات تعطي خط أنابيب بيانات وتخزين صارم مع الحفاظ على المرونة لتحليل البيانات. لبدء تقييم مجموعة البيانات ذات الاهتمام، قم بتنزيل رموز المثال وقواعد البيانات الموضحة في هذا الجدول.
بعد ذلك، استخدم هذا التمثيل الرسومي لقاعدة بيانات متعددة الأبعاد لتقييم ما إذا كانت مجموعة البيانات ذات الاهتمامات متعددة الأبعاد بالفعل. والبيانات بحاجة إلى تلبية شرطين للاستفادة من قاعدة البيانات المنظمة. أولا، يجب أن تكون البيانات قادرة على أن تصور في شكل متعدد الأبعاد.
وثانياً، يجب أن تكتسب رؤية علمية أكبر من خلال القدرة على ربط نتيجة تجريبية محددة بأي من الأبعاد. تخزن قواعد البيانات العلائقية المعلومات في شكل جداول منظمة في صفوف وأعمدة ويمكن استخدامها لربط معلومات التعريف داخل قاعدة البيانات. تتم معالجة الأبعاد المتعددة من خلال ربط حقول مختلفة، مثل أعمدة الجدول والجداول الفردية، ببعضها البعض.
أولا ، تنظيم ملفات البيانات بحيث يكون لديهم مدروسة جيدا ، وأسماء فريدة من نوعها. تسمح الممارسات الجيدة مع اصطلاحات تسمية الملفات و بنيات المجلد/المجلد الفرعي بتوسيع قاعدة البيانات القابلية للتوسع دون المساس بإمكانية الوصول إلى الملفات يدوياً. إضافة ملفات مؤرخة بتنسيق متناسق و مجلدات فرعية اسم وفقا لبيانات التعريف.
كما تم تصميم بنية قاعدة البيانات، رسم العلاقات بين الحقول في جداول مختلفة. إنشاء وثائق README التي تصف قاعدة البيانات والعلاقات التي تم إنشاؤها. يمكن أن يكون كلا رسومية مثل هذا الشكل أو النص القائم.
بمجرد ربط إدخال بين جداول مختلفة، كافة المعلومات المقترنة يرتبط هذا الإدخال ويمكن استخدامها لاستدعاء استعلامات معقدة لتصفية وصولاً إلى المعلومات المطلوبة. جعل النتيجة النهائية مشابهة لهذا المثال حيث ترتبط الخصائص المختلفة للأفراد بالبيانات التجريبية المرتبطة بها لهؤلاء الأفراد. وقد تم تنفيذ نفس الشيء من خلال ربط الأعمدة لأنواع النقش وأنواع البيانات بالإدخالات المتطابقة في جدول DataValues الرئيسي لشرح مختلف البنود المختصرة.
تحديد جميع التجارب المختلفة وطرق تحليل البيانات التي قد تؤدي إلى جمع البيانات، إلى جانب ممارسات تخزين البيانات العادية لكل نوع من أنواع البيانات. العمل مع برنامج التحكم في الإصدار المفتوح المصدر مثل GitHub لضمان الاتساق الضروري والتحكم في الإصدار مع تقليل عبء المستخدم. تأكد من إنشاء إجراء لتسمية البيانات وتخزينها بشكل متناسق للسماح لخط أنابيب تلقائي.
استخدام أي لغة برمجة ملائمة لإنشاء إدخالات بيانات جديدة لقاعدة البيانات. إنشاء جداول مساعد صغير في ملفات منفصلة يمكن أن توجه التحديد التلقائي للبيانات. هذه الملفات بمثابة قالب من الاحتمالات لخط الأنابيب للعمل تحت وسهلة لتحرير.
لإنشاء إدخالات بيانات جديدة لخطوط البيانات، قم ببرمجة التعليمات البرمجية بطريقة مشابهة إلى المثال المعروض هنا والذي يتم توفيره في الملفات الإضافية مع هذه المقالة. سيسمح هذا أحد لاستخدام الجداول المساعد كمدخلات ليتم تحديدها من قبل المستخدم. من هنا، تجميع جدول بيانات جديد لمواقع الملفات عن طريق دمج الإدخالات الجديدة مع الإدخالات السابقة.
يمكن استخدام التعليمات البرمجية الموضحة هنا والموفّرة في الملفات التكميلية لأتمتة هذه العملية. بعد ذلك، تحقق من جدول البيانات المدمجة للتكرار باستخدام التعليمات البرمجية الموضحة هنا لأتمتة هذه الخطوة. بالإضافة إلى ذلك، تحقق من جدول البيانات عن الأخطاء باستخدام أسلوب تلقائي وإخطار المستخدم بالسبب والموقع.
علاوة على ذلك، يمكنك كتابة تعليمات برمجية التي سيتم التحقق من قاعدة البيانات المترجمة وتحديد أية نقاط البيانات السيئة مفقود. إزالة النقاط السيئة يدوياً دون فقدان تكامل قاعدة البيانات باستخدام تعليمات برمجية مشابهة لما هو موضح هنا. كرر هذه الخطوات لإضافة المزيد من نقاط البيانات.
ثم استخدم مواقع الملفات لإنشاء جدول بيانات قيمة البيانات. أيضاً، قم بإنشاء قائمة محدثة من الإدخالات التي يمكن الوصول إليها لتحديد مواقع الملفات أو دمجها مع الإدخالات المستقبلية. لبدء إنشاء قاعدة بيانات، قم أولاً بإنشاء مستند قاعدة بيانات فارغ لتحميل جدول المساعد لخطوط الخلية وأنواع البيانات وأنواع النقش.
انتقل إلى القائمة البيانات الخارجية، وحدد استيراد ملف نصي، وانقر فوق استعراض، ثم حدد الملف المطلوب. في معالج الاستيراد، حدد محدد ثم ضرب التالي. حدد الصف الأول يحتوي على أسماء الحقول وفاصلة لنوع المحدد.
بعد النقر فوق التالي، حدد خيارات الحقل الافتراضية ثم حدد لا مفتاح أساسي. انقر على التالي ثم إنهاء. بعد ذلك، قم بتحميل أنواع البيانات والنقش بتكرار هذه الخطوات نفسها.
بعد ذلك، قم بتحميل جدول قيمة البيانات. انتقل إلى القائمة البيانات الخارجية، وحدد استيراد ملف نصي، وانقر فوق استعراض، ثم حدد الملف المطلوب. في معالج الاستيراد، حدد محدد ثم ضرب التالي.
حدد الصف الأول يحتوي على أسماء الحقول وفاصلة لنوع المحدد. بعد النقر فوق التالي، حدد خيارات الحقل الافتراضي ثم حدد السماح Access بإضافة المفتاح الأساسي. انقر على التالي ثم إنهاء.
الآن إنشاء العلاقات عن طريق تحديد أدوات قاعدة البيانات، والذهاب إلى العلاقات، وسحب كافة الجداول إلى المجلس. ثم انتقل إلى تحرير العلاقات وحدد إنشاء جديد. حدد أسماء الأعمدة والجدول ثم انقر فوق نوع الانضمام الذي يشير إلى الجداول المساعد.
بعد إعداد كل علاقة تريدها، انتقل إلى إنشاء وحدد تصميم الاستعلام وحدد أو اسحب كافة الجداول ذات الصلة في النافذة العليا. في هذا المثال، يتم عرض خطوط الخلايا وقيم البيانات وأنواع البيانات ونوع النقش. يجب إعداد العلاقات تلقائيًا استنادًا إلى تصميم العلاقة السابق.
الآن، تعبئة أعمدة الاستعلام للنتائج المطلوبة. بالنسبة لمجموعة البيانات هذه، انتقل إلى إظهار المجاميع وحددها. تعبئة العمود الأول، العمود الثاني، والعمود الثالث كما هو موضح هنا.
تعبئة العمود الرابع، والعمود الخامس، والعمود السادس أيضاً. عند الانتهاء من تعبئة الأعمدة، قم بحفظ الاستعلام وتشغيله. لهذه العينة البيانات التجريبية، استخدم تحليل في اتجاه واحد من التباين باستخدام اختبار توكي لمقارنات متوسط بين مختلف الظروف.
عندما تعطى العديد من التأكيدات الممكنة، قد يكون من الصعب تحديد مكان وجود علاقات جديدة باستخدام أساليب تجميع البيانات اليدوية. هنا، تم قياس تنظيم خيوط actin دون الخلوية عبر شروط متعددة باستخدام درجة الترتيب التوجه عن طريق الاستعلام عن قاعدة البيانات في تأكيدات مختلفة. مجموعات البيانات anisotropic وisotropic تظهر مختلفة إلى حد كبير OOPs، الذي كان متوقعا منذ micropatterning الليفية يؤثر بشدة على تنظيم الأنسجة.
ومع ذلك، لم تكن هناك اختلافات كبيرة بين ظروف حالة الطفرة عند مقارنة الأنسجة المتينة. وعلى العكس من ذلك، كانت أنسجة النمط أقل تنظيما إحصائيا في خط الخلية التحكمية الإيجابية. وقد كانت هذه العلاقة مُمَسَكة حتى عندما جمعت البيانات من قِبل مختلف الأسر مقابل السيطرة الإيجابية والسلبية.
إذا لزم الأمر، يمكن تحليل البيانات بشكل أكبر. على سبيل المثال، هنا actin OOP كان مخطط ضد عمر الفرد في وقت خزعة، مفصولة عن حالة الطفرة والأسرة لتوضيح التجميع ضد متغير السريرية. مع مجموعة البيانات هذه، لا يوجد أي ارتباط بين منظمة actin وعمر الفرد.
وهذا يبين كيف يمكن تحليل البيانات نفسها في مجموعات مختلفة وكيف يمكن إنجاز مهمة صعبة عادة تجميع البيانات التي تقع في فئات متعددة باستخدام قواعد البيانات. يوفر هذا البروتوكول لإنشاء خط أنابيب تنظيمية للبيانات وإنشاء قاعدة بيانات الدقة العلمية الضرورية للغاية في هذا العصر من جمع البيانات كبيرة الحجم.