Method Article
Bu, bir tomogramın bir kısmını eğitim girdisi olarak kullanarak kriyo-elektron tomogramlarının çok sınıflı segmentasyonu için çok dilimli bir U-Net'i eğitmek için kullanılan bir yöntemdir. Bu ağın diğer tomogramlara nasıl çıkarılacağını ve subtomogram ortalaması ve filament izleme gibi daha ileri analizler için segmentasyonların nasıl çıkarılacağını açıklıyoruz.
Kriyo-elektron tomografisi (kriyo-ET), araştırmacıların hücreleri yerli, hidratlanmış hallerinde şu anda mümkün olan en yüksek çözünürlükte görüntülemelerini sağlar. Bununla birlikte, tekniğin, ürettiği verileri analiz etmeyi zaman alıcı ve zor hale getiren birkaç sınırlaması vardır. Tek bir tomogramın elle bölümlendirilmesi saatlerden günlere kadar sürebilir, ancak mikroskop günde 50 veya daha fazla tomogramı kolayca üretebilir. Kriyo-ET için mevcut derin öğrenme segmentasyon programları mevcuttur, ancak bir seferde bir yapıyı segmentlere ayırmakla sınırlıdır. Burada, çok kesitli U-Net evrişimli sinir ağları, kriyo-tomogramlar içinde aynı anda birden fazla yapıyı otomatik olarak segmentlere ayırmak için eğitilir ve uygulanır. Uygun ön işleme ile, bu ağlar, her bir tomogram için ayrı ayrı ağları eğitmeye gerek kalmadan birçok tomograma sağlam bir şekilde çıkarılabilir. Bu iş akışı, çoğu durumda segmentasyon süresini 30 dakikanın altına düşürerek kriyo-elektron tomogramlarının analiz edilebileceği hızı önemli ölçüde artırır. Ayrıca, segmentasyonlar, hücresel bir bağlamda filament izlemenin doğruluğunu artırmak ve subtomogram ortalaması için koordinatları hızla çıkarmak için kullanılabilir.
Son on yıldaki donanım ve yazılım gelişmeleri, kriyo-elektron mikroskobu (cryo-EM) için bir "çözünürlük devrimi" ile sonuçlanmıştır1,2. Daha iyi ve daha hızlı dedektörler3, veri toplamayı otomatikleştiren yazılım4,5 ve faz plakaları6 gibi sinyal artırıcı ilerlemelerle, büyük miktarlarda yüksek çözünürlüklü kriyo-EM verisi toplamak nispeten basittir.
Cryo-ET, doğal, hidratlanmış bir durumdahücresel ultrayapıya benzeri görülmemiş bir bakış açısı sunar 7,8,9,10. Birincil sınırlama numune kalınlığıdır, ancak tomografi11 için kalın hücresel ve doku örneklerinin inceltildiği odaklanmış iyon ışını (FIB) frezeleme gibi yöntemlerin benimsenmesiyle, kriyo-ET ile görüntülenebilecek ufuk sürekli genişlemektedir. En yeni mikroskoplar günde 50'den fazla tomogram üretebilmektedir ve bu oranın yalnızca hızlı veri toplama şemalarının geliştirilmesi nedeniyle artacağı tahmin edilmektedir12,13. Kriyo-ET tarafından üretilen büyük miktarda verinin analiz edilmesi, bu görüntüleme yöntemi için bir darboğaz olmaya devam etmektedir.
Tomografik bilginin nicel analizi, önce açıklamalı olmasını gerektirir. Geleneksel olarak, bu zaman alıcı olan bir uzman tarafından elle segmentasyon gerektirir; kriyo-tomogramda bulunan moleküler karmaşıklığa bağlı olarak, saatlerce veya günlerce özel dikkat gerektirebilir. Yapay sinir ağları bu soruna çekici bir çözümdür, çünkü segmentasyon çalışmasının büyük kısmını zamanın bir bölümünde yapmak için eğitilebilirler. Evrişimli sinir ağları (CNN'ler) özellikle bilgisayarlı görme görevleri için uygundur14 ve son zamanlarda kriyo-elektron tomogramlarının analizi için uyarlanmıştır15,16,17.
Geleneksel CNN'ler, biyolojik görüntü analizi görevleri için genellikle mümkün olmayan binlerce ek açıklamalı eğitim örneği gerektirir. Bu nedenle, U-Net mimarisi bu alanda18'de mükemmel olmuştur, çünkü ağı başarılı bir şekilde eğitmek için veri artırmaya dayanır ve büyük eğitim kümelerine bağımlılığı en aza indirir. Örneğin, bir U-Net mimarisi tek bir tomogramın yalnızca birkaç dilimi (dört veya beş dilim) ile eğitilebilir ve yeniden eğitilmeden diğer tomogramlara sağlam bir şekilde çıkarılabilir. Bu protokol, Dragonfly 2022.119 içindeki elektron kriyo-tomogramlarını segmentlere ayırmak için U-Net sinir ağı mimarilerini eğitmek için adım adım bir kılavuz sağlar.
Dragonfly, derin öğrenme modelleri tarafından 3D görüntü segmentasyonu ve analizi için kullanılan ticari olarak geliştirilmiş bir yazılımdır ve akademik kullanım için serbestçe kullanılabilir (bazı coğrafi kısıtlamalar geçerlidir). Uzman olmayan bir kişinin hem semantik segmentasyon hem de görüntü gürültüsünü gidermek için derin öğrenmenin güçlerinden tam olarak yararlanmasını sağlayan gelişmiş bir grafik arayüze sahiptir. Bu protokol, yapay sinir ağlarını eğitmek için Dragonfly içindeki kriyo-elektron tomogramlarının nasıl önceden işleneceğini ve ek açıklama ekleneceğini gösterir; bu da daha sonra büyük veri kümelerini hızlı bir şekilde segmentlere ayırmak için çıkarılabilir. Ayrıca, filament izleme ve alt tomogram ortalaması için koordinat ekstraksiyonu gibi daha ileri analizler için segmentlere ayrılmış verilerin nasıl kullanılacağını tartışır ve kısaca gösterir.
NOT: Dragonfly 2022.1, yüksek performanslı bir iş istasyonu gerektirir. Sistem önerileri, bu protokol için kullanılan iş istasyonunun donanımıyla birlikte Malzeme Tablosuna dahil edilmiştir. Bu protokolde kullanılan tüm tomogramlar, 3,3 ila 13,2 ang/pix piksel boyutundan 4 kat bağlanır. Temsili sonuçlarda kullanılan örnekler, bu kurumun etik standartlarına uygun hayvan bakım yönergelerini izleyen bir şirketten ( Malzeme Tablosuna bakınız) elde edilmiştir. Bu protokolde kullanılan tomogram ve eğitim girdisi olarak oluşturulan çoklu yatırım getirisi, Ek Dosya 1'e (https://datadryad.org/stash/dataset/doi:10.5061/dryad.rxwdbrvct bulunabilir) paketlenmiş bir veri kümesi olarak dahil edilmiştir, böylece kullanıcı istediği takdirde aynı verilerle birlikte takip edebilir. Dragonfly ayrıca, kullanıcıların eğitilmiş ağları paylaşabilecekleri Infinite Toolbox adlı açık erişimli bir veritabanına da ev sahipliği yapıyor.
1. Kurulum
2. Görüntü içe aktarma
3. Ön işleme (Şekil 1.1)
4. Eğitim verileri oluşturma (Şekil 1.2)
5. Yinelemeli eğitim için segmentasyon sihirbazını kullanma (Şekil 1.3)
6. Ağı uygulama (Şekil 1.4)
7. Segmentasyon manipülasyonu ve temizliği
8. ROI'den alt tomogram ortalaması için koordinatlar oluşturma
9. Havza dönüşümü
Şekil 1: İş akışı. 1) Yoğunluk ölçeğini kalibre ederek ve veri kümesini filtreleyerek eğitim tomogramını önceden işleyin. 2) Bir tomogramın küçük bir kısmını, kullanıcının tanımlamak istediği tüm uygun etiketlerle elle segmentlere ayırarak eğitim verilerini oluşturun. 3) Giriş olarak filtrelenmiş tomogramı ve eğitim çıkışı olarak el segmentasyonunu kullanarak, segmentasyon sihirbazında beş katmanlı, çok dilimli bir U-Net eğitilir. 4) Eğitilen ağ, açıklama eklemek için tam tomograma uygulanabilir ve her bölümlenmiş sınıftan bir 3D oluşturma oluşturulabilir. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.
Protokolü takiben, beş parçalı bir U-Net, beş sınıfı tanımlamak için tek bir tomogram (Şekil 2A) üzerinde eğitildi: Membran, Mikrotübüller, Aktin, Referans belirteçleri ve Arka Plan. Ağ yinelemeli olarak toplam üç kez eğitildi ve daha sonra tomogramı tamamen segmentlere ayırmak ve açıklama eklemek için tomograma uygulandı (Şekil 2B, C). En az temizleme işlemi 7.1 ve 7.2 numaralı adımlar kullanılarak gerçekleştirilmiştir. Sonraki üç ilgi çekici tomogram (Şekil 2D, G, J) ön işleme için yazılıma yüklendi. Görüntü içe aktarmadan önce, tomogramlardan biri (Şekil 2J), farklı bir mikroskopta biraz farklı bir büyütmede toplandığı için 17.22 ş/ px'ten 13.3 ş/ px'e piksel boyutu ayarlaması gerektiriyordu. IMOD program squeezevol aşağıdaki komutla yeniden boyutlandırmak için kullanılmıştır:
'squeezevol -f 0.772 inputfile.mrc outputfile.mrc'
Bu komutta -f , piksel boyutunun değiştirileceği faktörü ifade eder (bu durumda: 13.3/17.22). İçe aktarma işleminden sonra, üç çıkarım hedefinin tümü 3.2 ve 3.3 numaralı adımlara göre önceden işlendi ve ardından beş dilimli U-Net uygulandı. Minimum temizlik tekrar yapıldı. Son segmentasyonlar Şekil 2'de gösterilmiştir.
Her tomogramdan mikrotübül segmentasyonları ikili (adım 7.4) TIF dosyaları olarak dışa aktarıldı, MRC'ye (IMOD tif2mrc programı) dönüştürüldü ve daha sonra silindir korelasyonu ve filament izleme için kullanıldı. Filamentlerin ikili segmentasyonları, tomogramlar üzerinde izlemekten çok daha sağlam filament izleme ile sonuçlanır. Filament izlemeden koordinat haritaları (Şekil 3), mikrotübül oryantasyonunu belirlemek için en yakın komşu ölçümleri (filament paketleme) ve tek filamentler boyunca sarmal alt tomogram ortalaması gibi daha ileri analizler için kullanılacaktır.
Başarısız veya yetersiz eğitilmiş ağların belirlenmesi kolaydır. Başarısız bir ağ herhangi bir yapıyı segmentlere ayıramazken, yetersiz eğitilmiş bir ağ tipik olarak bazı yapıları doğru bir şekilde bölümlere ayırır ve önemli sayıda yanlış pozitif ve yanlış negatife sahip olur. Bu ağlar, performanslarını artırmak için düzeltilebilir ve yinelemeli olarak eğitilebilir. Segmentasyon sihirbazı, eğitildikten sonra modelin zar benzerlik katsayısını (SegWiz'de skor olarak adlandırılır) otomatik olarak hesaplar. Bu istatistik, eğitim verileri ile U-Net segmentasyonu arasındaki benzerliğin bir tahminini verir. Dragonfly 2022.1 ayrıca, arayüzün üst kısmındaki Yapay Zeka sekmesinden erişilebilen bir modelin performansını değerlendirmek için yerleşik bir araca sahiptir (kullanım için belgelere bakın).
Şekil 2: Çıkarım. (A-C) 2019 yılında bir Titan Krios üzerinde toplanan bir DIV 5 hipokampal sıçan nöronunun orijinal eğitim tomogramı. Bu, IMOD'de CTF düzeltmesi ile geriye dönük bir rekonstrüksiyondur. (A) Sarı kutu, eğitim girişi için el segmentasyonunun yapıldığı bölgeyi temsil eder. (B) Eğitim tamamlandıktan sonra U-Net'ten 2D segmentasyon. (C) Membran (mavi), mikrotübüller (yeşil) ve aktin (kırmızı) gösteren parçalanmış bölgelerin 3D görüntüsü. (D-F) DIV 5 hipokampal sıçan nöronu, eğitim tomogramı ile aynı seanstan. (E) Ek eğitim ve hızlı temizlik olmadan U-Net'ten 2D segmentasyon. Membran (mavi), mikrotübüller (yeşil), aktin (kırmızı), referanslar (pembe). (F) Bölümlere ayrılmış bölgelerin 3B olarak oluşturulması. (G-I) 2019 oturumundan DIV 5 hipokampal sıçan nöronu. (H) Hızlı temizleme ve (I) 3B oluşturma ile U-Net'ten 2B segmentasyon. (J-L) DIV 5 hipokampal sıçan nöronu, 2021 yılında farklı bir Titan Krios üzerinde farklı bir büyütmede toplandı. Piksel boyutu, eğitim tomogramına uyacak şekilde IMOD programı squeezevol ile değiştirildi. (K) Hızlı temizleme ile U-Net'ten 2B segmentasyon, uygun ön işleme ve (L) segmentasyonun 3B oluşturulması ile veri kümeleri arasında sağlam çıkarım gösterir. Ölçek çubukları = 100 nm. Kısaltmalar: DIV = gün in vitro; CTF = kontrast transfer fonksiyonu. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.
Şekil 3: Filament izleme iyileşmesi . (A) Titan Krios üzerinde toplanan bir DIV 4 sıçan hipokampal nöronunun Tomogramı. (B) Aktin filamentleri üzerindeki silindir korelasyonundan elde edilen korelasyon haritası. (C) Parametreleri tanımlamak için korelasyon haritasındaki aktin filamentlerinin yoğunluklarını kullanarak aktinin filament takibi. İzleme, membranı ve mikrotübülleri ve gürültüyü yakalarken, sadece aktini izlemeye çalışır. (D) Tomogramın U-Net segmentasyonu. Mavi renkte vurgulanan membran, kırmızı renkte mikrotübüller, turuncu renkte ribozomlar, morda triC ve yeşil renkte aktin. (E) Filament izleme için ikili maske olarak ekstrakte edilen aktin segmentasyonu. (F) Silindir korelasyonundan (B)'den aynı parametrelerle oluşturulan korelasyon haritası. (G) Tomogramdan sadece aktin filamentlerinin filament takibi önemli ölçüde iyileştirildi. Kısaltma: DIV = gün in vitro. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.
Ek Dosya 1: Bu protokolde kullanılan tomogram ve eğitim girdisi olarak oluşturulan çoklu yatırım getirisi, paketlenmiş bir veri kümesi (Training.ORSObject) olarak dahil edilir. Bkz. https://datadryad.org/stash/dataset/doi:10.5061/dryad.rxwdbrvct.
Bu protokol, tek bir tomogramdan çok sınıflı bir U-Net'i eğitmek için Dragonfly 2022.1 yazılımını kullanmak için bir prosedür ve bu ağın aynı veri kümesinden olması gerekmeyen diğer tomogramlara nasıl çıkarılacağını ortaya koymaktadır. Eğitim nispeten hızlıdır (tamamen eğitilen ağa ve kullanılan donanıma bağlı olarak, dönem başına 3-5 dakika kadar hızlı veya birkaç saat kadar yavaş olabilir) ve öğrenmesini geliştirmek için bir ağı yeniden eğitmek sezgiseldir. Ön işleme adımları her tomogram için gerçekleştirildiği sürece, çıkarım tipik olarak sağlamdır.
Tutarlı ön işleme, derin öğrenme çıkarımı için en kritik adımdır. Yazılımda birçok görüntüleme filtresi vardır ve kullanıcı belirli veri kümeleri için hangi filtrelerin en iyi şekilde çalıştığını belirlemek için denemeler yapabilir; eğitim tomogramında kullanılan filtreleme ne olursa olsun, çıkarım tomogramlarına aynı şekilde uygulanması gerektiğini unutmayın. Ağa doğru ve yeterli eğitim bilgisi sağlamak için de özen gösterilmelidir. Eğitim dilimleri içinde bölümlere ayrılmış tüm özelliklerin mümkün olduğunca dikkatli ve hassas bir şekilde bölümlere ayrılması hayati önem taşımaktadır.
Görüntü segmentasyonu, sofistike bir ticari sınıf kullanıcı arayüzü ile kolaylaştırılmıştır. El segmentasyonu için gerekli tüm araçları sağlar ve voksellerin eğitim ve yeniden eğitimden önce herhangi bir sınıftan diğerine kolayca yeniden atanmasını sağlar. Kullanıcının vokselleri tomogramın tüm bağlamında elle segmentlere ayırmasına izin verilir ve bunlara birden fazla görünüm ve ses seviyesini serbestçe döndürme yeteneği verilir. Ek olarak, yazılım, daha iyi performans gösterme eğiliminde olan16 ve birden fazla tek sınıflı ağ ile segmentasyondan daha hızlı olan çok sınıflı ağları kullanma yeteneği sağlar.
Tabii ki, bir sinir ağının yeteneklerinde sınırlamalar vardır. Cryo-ET verileri, doğası gereği, açısal örneklemede çok gürültülü ve sınırlıdır, bu da aynı nesnelerde yöne özgü bozulmalara yol açar21. Eğitim, yapıları doğru bir şekilde elle segmentlere ayırmak için bir uzmana dayanır ve başarılı bir ağ yalnızca verilen eğitim verileri kadar iyidir (veya kötüdür). Sinyali artırmak için görüntü filtreleme eğitmen için yararlıdır, ancak belirli bir yapının tüm piksellerini doğru bir şekilde tanımlamanın zor olduğu birçok durum vardır. Bu nedenle, eğitim segmentasyonunu oluştururken büyük özen gösterilmesi önemlidir, böylece ağ eğitim sırasında öğrenilebilecek en iyi bilgiye sahip olur.
Bu iş akışı her kullanıcının tercihine göre kolayca değiştirilebilir. Tüm tomogramların tam olarak aynı şekilde önceden işlenmesi gerekli olsa da, protokolde kullanılan filtrelerin tam olarak kullanılması gerekli değildir. Yazılımın çok sayıda görüntü filtreleme seçeneği vardır ve birçok tomogramı kapsayan büyük bir segmentasyon projesine başlamadan önce bunları kullanıcının özel verileri için optimize etmeniz önerilir. Kullanılabilecek epeyce ağ mimarisi de vardır: Çok dilimli bir U-Net'in bu laboratuvardan gelen veriler için en iyi şekilde çalıştığı bulunmuştur, ancak başka bir kullanıcı başka bir mimarinin (3D U-Net veya Sensor 3D gibi) daha iyi çalıştığını görebilir. Segmentasyon sihirbazı, aynı eğitim verilerini kullanarak birden çok ağın performansını karşılaştırmak için kullanışlı bir arabirim sağlar.
Burada sunulanlar gibi araçlar, tam tomogramların elle bölümlendirilmesini geçmişin bir görevi haline getirecektir. Sağlam bir şekilde çıkarılabilir iyi eğitilmiş sinir ağlarıyla, tomografik verilerin mikroskopun toplayabildiği kadar hızlı bir şekilde yeniden yapılandırıldığı, işlendiği ve tamamen bölümlere ayrıldığı bir iş akışı oluşturmak tamamen mümkündür.
Bu protokol için açık erişim lisansı Object Research Systems tarafından ödendi.
Bu çalışma, Penn State College of Medicine ve Biyokimya ve Moleküler Biyoloji Bölümü ile Tütün Uzlaşma Fonu (TSF) hibesi 4100079742-EXT tarafından desteklenmiştir. Bu projede kullanılan CryoEM ve CryoET Core (RRID: SCR_021178) hizmetleri ve araçları, kısmen, Pennsylvania Eyalet Üniversitesi Tıp Fakültesi tarafından, Araştırma ve Lisansüstü Öğrenciler Dekan Yardımcısı Ofisi ve Pennsylvania Sağlık Bakanlığı aracılığıyla Tütün Yerleşim Fonları (CURE) kullanılarak finanse edilmiştir. İçerik yalnızca yazarların sorumluluğundadır ve mutlaka Üniversite veya Tıp Fakültesi'nin resmi görüşlerini temsil etmemektedir. Pennsylvania Sağlık Bakanlığı, herhangi bir analiz, yorum veya sonuç için özellikle sorumluluk kabul etmez.
Name | Company | Catalog Number | Comments |
Dragonfly 2022.1 | Object Research Systems | https://www.theobjects.com/dragonfly/index.html | |
E18 Rat Dissociated Hippocampus | Transnetyx Tissue | KTSDEDHP | https://tissue.transnetyx.com/faqs |
IMOD | University of Colorado | https://bio3d.colorado.edu/imod/ | |
Intel® Xeon® Gold 6124 CPU 3.2GHz | Intel | https://www.intel.com/content/www/us/en/products/sku/120493/intel-xeon-gold-6134-processor-24-75m-cache-3-20-ghz/specifications.html | |
NVIDIA Quadro P4000 | NVIDIA | https://www.nvidia.com/content/dam/en-zz/Solutions/design-visualization/productspage/quadro/quadro-desktop/quadro-pascal-p4000-data-sheet-a4-nvidia-704358-r2-web.pdf | |
Windows 10 Enterprise 2016 | Microsoft | https://www.microsoft.com/en-us/evalcenter/evaluate-windows-10-enterprise | |
Workstation Minimum Requirements | https://theobjects.com/dragonfly/system-requirements.html |
Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi
Izin talebiThis article has been published
Video Coming Soon
JoVE Hakkında
Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır