Method Article
Le présent article décrit les bases de l'analyse multivariée et il l'oppose à la plus couramment utilisée voxel-sage analyse univariée. Les deux types d'analyse sont appliquées à un ensemble de données cliniques-neurosciences. Supplémentaire moitié-moitié simulations montrent une meilleure reproduction des résultats multivariés ensembles de données indépendants.
Techniques d'analyse multivariée des données de neuro-imagerie ont récemment reçu une attention croissante car ils ont de nombreuses caractéristiques attrayantes qui ne peuvent pas être facilement réalisés par les plus couramment utilisés univariée, voxel-sage, les techniques
Les résultats représentatifs
Performances univariée Les résultats peuvent être vus en détail dans la figure 3. La zone de la plus grande AD liés déficit de FDG a été trouvé dans le gyrus temporal Super, aire de Brodmann 38. L'aire sous la courbe ROC-AUC a été atteint = 0,90. La généralisation de cette opposition à l'échantillon de réplication a été très bon avec une aire sous la courbe ROC de l'ASC = 0,84.
Performances multivariée Les résultats peuvent être vus en détail dans la figure 4. Les zones où les charges positives, faisant allusion à une relative préservation des signaux dans le visage de la maladie ont été trouvés dans le cervelet, tandis que la perte de signal a été trouvé associé les domaines parietotemporal et frontales, et le gyrus cingulaire postérieur. Les aires sous les courbes ROC-tant dans la dérivation et la réplication des échantillons ont été légèrement mieux que le marqueur univariée à 0,96 et 0,88, respectivement.
Split-échantillon de simulations Les résultats peuvent être vus en détail dans la figure 5. La figure montre que le marqueur multivariée donne une meilleure reproduction des performances diagnostiques que le marqueur univariée. Le taux d'erreur totale moyenne pour le marqueur multivariée est 0,203, tandis que pour le marqueur univariée, il est 0.307.
. Figure 1 Ce simple chiffre décrit la différence entre univariée et multivariée des stratégies analytiques: un hypothétique en 3 dimensions l'ensemble de données est affiché dans cette illustration. Sur le côté gauche, il n'ya pas de corrélation entre les 3 variables tracées. Sur le côté droit en revanche, on peut voir une importante source de variance indique une corrélation positive entre les trois voxels. Une analyse univariée que nous venons de considérer les valeurs moyennes sur une base voxel par voxel-ne pouvait pas dire aucune différence entre ces deux scénarios. L'analyse multivariée, en revanche, identifie les principales sources de VarianCE dans les données (flèche rouge) avant de procéder à construire des modèles d'activation neuronale sous forme de ces sources.
Figure 2. Cette diapositive montre sous une forme simplifiée l'accomplissement de base de toute analyse multivariée des données en neuroimagerie. Le tableau de données Y (s, x), qui dépend d'un indice de sujet s, et un voxel indice x, indiquant l'emplacement du voxel dans le cerveau, est décomposé en une somme de plusieurs termes. Tout d'abord, un produit d'un score de facteur purement sujet-dépendante, SSF (s), et un modèle de covariance purement voxel-dépendant, v (x). Deuxièmement, l'activation qui ne peuvent pas être expliqués par le modèle de covariance est capturée dans un terme de bruit et de l'objet-voxel-dépendant, e (s, x). Les deux graphiques ci-dessous l'équation donner un exemple de facteur d'échelle sujet et le modèle de covariance. Chaque participant se manifeste le modèle de covariance, juste à un degré différent comme le montre le score du facteur sujet. Plutôt que d'avoir à garder une trace du comportement de chaque voxel séparément, le modèle de covariance et son expression sous réserve de fournir un résumé parcimonieux de la principale source de variance. Comme les augmentations de réserve facteur d'échelle de grandeur, les zones désignées en bleu dans le modèle de covariance diminuer leur activation associée, tandis que les zones indiquées en rouge simultanément accroître leur activation associée. Le score facteur sujet peuvent être corrélées avec les variables externes d'intérêt comme l'âge du sujet ou de la performance de comportement dans une tâche cognitive, et aucune correction pour les comparaisons multiples doit être appliquée à cette corrélation.
Plusieurs techniques d'une telle décomposition existe, mais le plus commun est l'analyse en composantes principales (ACP). C'est la technique de choix pour nous. Notez que les facteurs d'échelle peuvent être obtenus en projetant le modèle de covariance dans n'importe quel ensemble de données de la dimensionnalité d'égalité, et pas seulement l'ensemble de données qui a produit le modèle de covariance, en premier lieu. Cela rend les modèles de covariance adapté pour tester si le cerveau-comportementale des relations qui ont été observées dans un ensemble de données peuvent être reproduits dans un autre ensemble de données.
Figure 3. Cette figure montre le résultat de l'analyse univariée. Dans le panneau inférieur gauche, les valeurs de signal FDG sont tracées pour la zone qui affiche le plus grand AD liés déficit dans l'échantillon de dérivation. Ses coordonnées sont INM X = 2 mm, Y = -48 mm, Z = 30mm (precuneus / PCG, aire de Brodmann 31). Le panneau en bas à droite montre le signal de FDG à cet endroit très dans l'échantillon de réplication. On peut comprendre que les différences entre les patients atteints de MA FDG et de contrôle dans l'échantillon de réplication, tout en restant significative dans l'ensemble, sont réduits de plus de chevauchement entre les groupes.
Figure 4. Cette figure montre les résultats de l'analyse multivariée. Dans le panneau supérieur, nous affichons plusieurs coupes axiales qui montrent de façon significative positivement et négativement les zones pondéré (p <0,001) dans le modèle de covariance en rouge et bleu, respectivement. Notez que nous avons réduit chaque scan par sa valeur moyenne de la planète, la couleur si rouge et bleu indiquent des augmentations relatives au lieu et absolue, et diminue de signal PET avec la sévérité de la maladie. Les zones en rouge ainsi allusion à la préservation relative de la surface de la maladie, tandis que le bleu indique une perte de signal comme une conséquence de la maladie. Les zones rouges se trouvent principalement dans le cervelet, tandis que les zones bleues apparaissent dans le gyrus cingulaire postérieur, les régions parietotemporal et frontal. Panneau inférieur gauche: les scores facteur sujet du modèle de covariance AD-liés sont affichés dans l'échantillon de dérivation. Scores plus élevés sont l'objet trouvé pour les patients AD. Panneau inférieur droit: les scores facteur sujet résultant de l'application prospective de la structure de covariance AD liés à l'échantillon de réplication sont tracées ici. On peut apprécier une légère détérioration du contraste de diagnostic avec un chevauchement accru dans l'échantillon de réplication, mais la généralisation de l'efficacité diagnostique est nettement meilleure que dans le cas univarié.
Figure 5. Cette figure montre les résultats de la 1000 échantillons fractionnés simulations. Cotées sont les moyens et les écarts-types des taux univariés et multivariés erreur de diagnostic dans les échantillons de réplication. On peut apprécier que la généralisation multivariée le marqueur de la performance est nettement meilleure, bien que légèrement plus variable que la variable marqueur.
Nous espérons avoir donné au spectateur un goût de l'essentiel de l'analyse multivariée; téléspectateurs intéressés sont encouragés à consulter notre site web. Un peu de choix pour les paramètres dans l'analyse multivariée ont été faites qui peuvent être soumis à un débat un débat considérable. Nous épargné la discussion de ces questions dans cet article pour éviter la distraction des enjeux majeurs. Tout d'abord, nous avons choisi le 6 premières composantes principales pour construire notre modèle de covariance AD-connexes. Il ya des raisons théoriques de ce choix que nous n'avons pas discuté 4. Le choix particulier de 6 Composantes Principales n'est cependant pas critique pour notre argument: on peut choisir dans la gamme de 2 à 20 PC et toujours obtenir une performance supérieure de généralisation du marqueur multivariée dans les simulations d'échantillons fractionnés. Les résultats sont également très fortes en ce qui concerne le choix du nombre de sujets en dérivation et des échantillons de réplication. Nous avons choisi 20 sujets pour les deux groupes dans l'échantillon de réplication, mais cela était purement mathématique pour plus de commodité pour accélérer les calculs. Nos résultats sur les mérites relatifs des deux techniques tiendrait même, si le nombre de sujets dans les échantillons de dérivation ont été augmentés.
Deuxièmement, nous avons seulement présenté les plus élémentaires de l'analyse multivariée. Complications considérables avec des techniques empruntées à la littérature sur l'apprentissage machine, des transformations linéaires et non linéaires avant l'APC, et divers autres rides sont réalisables qui pourraient stimuler les performances de généralisation encore plus. Pour simplifier, nous n'avons pas touché à ces possibilités dans cet article.
The author is grateful for NIH grant support:
NIH/NIBIB 5R01EB006204-03 Multivariate approaches to neuroimaging analysis
NIH/NIA 5R01AG026114-02 Early AD Detection with ASL MRI & Covariance Analysis
ADNI: Imaging data was provided by the Alzheimer's Disease Neuroimaging Initiative (ADNI) (NIH U01AG024904). Data collection and sharing for this project was funded by the Alzheimer's Disease Neuroimaging Initiative (ADNI) (National Institutes of Health Grant U01 AG024904). ADNI is funded by the National Institute on Aging, the National Institute of Biomedical Imaging and Bioengineering, and through generous contributions from the following: Abbott, AstraZeneca AB, Bayer Schering Pharma AG, Bristol-Myers Squibb, Eisai Global Clinical Development, Elan Corporation, Genentech, GE Healthcare, GlaxoSmithKline, Innogenetics ,Johnson and Johnson, Eli Lilly and Co., Medpace, Inc., Merck and Co., Inc., Novartis AG, Pfizer Inc, F. Hoffman-La Roche, Schering-Plough, Synarc, Inc., and Wyeth, as well as non-profit partners the Alzheimer's Association and Alzheimer's Drug Discovery Foundation, with participation from the U.S. Food and Drug Administration. Private sector contributions to ADNI are facilitated by the Foundation for the National Institutes of Health(http://www.fnih.org). The grantee organization is the Northern California Institute for Research and Education, and the study is coordinated by the Alzheimer's Disease Cooperative Study at the University of California, San Diego. ADNI data are disseminated by the Laboratory for Neuro Imaging at the University of California, Los Angeles. This research was also supported by NIH grants P30 AG010129, K01 AG030514, and the Dana Foundation.
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon