ومن المتوقع أن تكون مجموعة متنوعة من مهام تصنيف التسلسل البيولوجي، مثل تصنيف الأنواع، وتصنيف وظائف الجينات، وتصنيف المضيف السلكي عمليات في العديد من تحليلات البيانات الميتاجنومية. وبما أن البيانات الميتاجنومية تحتوي على عدد كبير من أنواع ومورثات نوفو، فإن هناك حاجة إلى كائنات تصنيف عالية الأداء في العديد من الدراسات. غالبا ما يواجه علماء الأحياء تحديا في العثور على أدوات تصنيف وتصنيف تسلسل مناسبة لمهمة محددة ، وغالبا ما لا يكونون قادرين على بناء كائن حي مناظر بمفردهم بسبب نقص المعرفة الرياضية والحسابية اللازمة.
تقنيات التعلم العميق أصبحت مؤخرا موضوعا شعبيا وتظهر ميزة قوية في العديد من المهام التصنيف. حتى الآن ، تم تطوير العديد من حزمة التعلم العميق المعبأة للغاية ، والتي تجعل من الممكن لعلماء الأحياء بناء أطر تعلم عميقة ، وفقا لاحتياجاتهم الخاصة دون معرفة متعمقة بتفاصيل الكائن الحي. في هذا البرنامج التعليمي، ونحن نقدم مبادئ توجيهية لبناء سهلة الاستخدام إطار التعلم العميق لتصنيف تسلسل دون الحاجة إلى المعرفة الرياضية الكافية أو مهارات البرمجة.
يظهر الفيديو التالي كيفية استخدام الجهاز الظاهري لإجراء تصنيف التسلسل البيولوجي. يحتاج المستخدمون إلى تنزيل ملف الجهاز الظاهري من الصفحة الرئيسية للبرنامج التعليمي ، ثم تنزيل برنامج VirtualBox. يتم ضغط الجهاز الظاهري كملف سبعين.
يمكن بسهولة فك ضغط الملف السبعين باستخدام برنامج ضغط حالي، مثل WinRar وWinzip و7-Zip. فك ضغط الجهاز الظاهري باستخدام 7-Zip. قد يستغرق تخفيف الضغط بعض الوقت.
الرجاء الانتظار لفترة من الوقت. بعد الضغط المستخدمين بحاجة إلى تثبيت برنامج فيرتثلبوإكس. إنشاء مجلد لتثبيت فيرتثلبوإكس.
إنشاء حزمة تثبيت فيرتثلبوإكس. حدد المجلد الذي أنشأته بنفسك. ثم قم بتثبيت برنامج VirutalBox بالنقر فوق الزر التالي في كل خطوة.
قد يستغرق التثبيت بعض الوقت، يرجى الانتظار لفترة من الوقت. افتح برنامج فيرتثلبوإكس. إنشاء زر جديد لإنشاء جهاز ظاهري.
أدخل اسم الجهاز الظاهري المحدد من قبل نفسك في إطار الاسم. حدد Linux كنظام تشغيل في إطار النوع. حدد أوبونتو في إطار الإصدار وانقر فوق الزر التالي.
إذا كان ذلك ممكنا، تخصيص كمية أكبر من الذاكرة إلى الجهاز الظاهري. صحيح استخدام تحديد ملف القرص الثابت موجود. حدد ملف الجهاز الظاهري الذي تم تنزيله من الصفحة الرئيسية التعليمية.
ثم انقر فوق الزر إنشاء. انقر فوق زر بدء لفتح الجهاز الظاهري. بدء تشغيل الجهاز الظاهري قد يستغرق بعض الوقت.
الرجاء الانتظار للحظة قبل الخطوة التالية. ثم يحتاج المستخدمون إلى إنشاء مجلد مشترك في كل من المضيفين الفعليين والجهاز الظاهري لتبادل الملفات. في المضيف الفعلي الخاص بك، قم بإنشاء مجلد مشترك يسمى المضيف المشترك وعلى سطح المكتب للجهاز الظاهري، قم بإنشاء مجلد مشترك يسمى المشترك VM.In الشريط اليدوي للجهاز الظاهري، انقر فوق الأجهزة، المجلدات المشتركة، إعدادات المجلد المشتركة على التوالي.
انقر فوق الزر الموجود في الزاوية العلوية اليمنى. حدد المجلد المشترك في المضيف الفعلي الذي أنشأته بنفسك. حدد خيار التحميل التلقائي.
انقر فوق الزر موافق. ثم أعد تشغيل الجهاز الظاهري. قد تستغرق إعادة تشغيل الجهاز الظاهري لحظة.
الرجاء الانتظار للحظة قبل الخطوة التالية. انقر على زر الماوس الأيمن على سطح المكتب من الجهاز الظاهري وفتح المحطة الطرفية. اكتب الأمر التالي إلى المحطة الطرفية.
سودو، مفتاح الفضاء، جبل، مفتاح الفضاء، شريط T، مفتاح الفضاء، vboxsf، مفتاح الفضاء، المضيف المشترك، مفتاح الفضاء، نقطة مائلة، سطح المكتب، مائل، VM.When المشتركة المطالبة بكلمة مرور، أدخل واحدة واضغط على مفتاح الدخول. نسخ كافة الملفات تسلسل أربعة بتنسيق أسرع لعملية التدريب والاختبار إلى المجلد المضيف المشترك للمضيف الفعلي. وبهذه الطريقة، سوف تحدث كافة الملفات أيضا في مجلد VM المشتركة للجهاز الظاهري.
ثم نسخ الملفات في المجلد VM المشتركة إلى المجلد التعلم العميق للجهاز الظاهري. انقر فوق الزر الأيمن ثم افتح المحطة الطرفية واكتب الأمر التالي لتنفيذ الترميز السريع. نقطة مائلة ، ترميز واحد الساخنة ، وتحديد الملفات للتدريب والاختبار.
وحدد نوع التسلسل. ثم اكتب الأمر التالي لبدء عملية الاتجاه. بيثون مفتاح الفضاء، قطار نقطة P Y.Then ستبدأ العملية تتجه.
قد تستغرق هذه العملية بضع ساعات أو بضعة أيام، اعتمادا على حجم مجموعة البيانات. عند الانتهاء من العملية، تكون نتيجة التنبؤ ببيانات الاختبار موجودة في ملف CSV نقطة التنبؤ. في عملنا السابق ، قمنا بتطوير سلسلة من أدوات تصنيف التسلسل للبيانات الميتاجنومية ، باستخدام نهج مشابه لهذا البرنامج التعليمي.
على سبيل المثال، قمنا بتطوير أداة تهدف إلى تحديد بروتينات فيروس prokaryote الكاملة والجزئية من بيانات التشغيل. وأداة تهدف إلى تحديد شظايا الحمض النووي phage من شظايا الحمض النووي الكروموسوم البكتيري في البيانات الميتوجينومية. يظهر أداء الأدوات باستخدام البرنامج النصي لهذا البرنامج التعليمي في الشكل أ وب.
في الختام، يوفر هذا البرنامج التعليمي لمحة عامة عن المبتدئين تصميم الأحياء والكائنات الحية على كيفية بناء إطار التعلم العميق سهلة الاستخدام لتصنيف التسلسل البيولوجي في البيانات الميتوجينومية. يهدف هذا البرنامج التعليمي إلى توفير فهم بديهي للتعلم العميق ومعالجة التحدي الذي يواجه المبتدئين في كثير من الأحيان صعوبة في بدء حزمة التعلم العميق وكتابة التعليمات البرمجية للكائن الحي. بالنسبة لبعض مهام التصنيف البسيطة، يمكن للمستخدمين استخدام إطار عملنا لتنفيذ مهمة التصنيف.