Questa misura può aiutare a rispondere a domande chiave nel campo del rilevamento biomedico sulla generazione di più soluzioni. Il vantaggio principale di questa tecnica è che fornisce un'interfaccia utente grafica intuitiva per assistere i ricercatori biomedici nel rilevamento di più sovvenzioni di funzionalità. Inizia caricando i dati Matrix e le etichette di classe nel software.
Fare clic su carica matrice di dati per selezionare il file di metrica dei dati specificato dall'utente e caricare le etichette delle classi per selezionare il file di etichetta della classe corrispondente. Per determinare le etichette di classe nel numero di funzionalità di alto livello, selezionare i nomi delle classi positive e negative nelle caselle a discesa appropriate e selezionare 10 come numero di funzionalità di alto livello nella casella di riepilogo a discesa X superiore per una schermata completa del sottoinsieme di funzionalità. Per ottimizzare i parametri di sistema per prestazioni diverse, selezionare l'accuratezza della misurazione delle prestazioni come casella di riepilogo a discesa precisione bilanciata per il classificatore automatico di apprendimento estremo selezionato.
Selezionare quindi un valore di cut-off pari a 0,7 per la misurazione delle prestazioni specificata nella casella di input di taglio delle prestazioni. Per eseguire la tubazione, fate clic su analizza (Analyze) e selezionate 0,7 come valore predefinito della misurazione delle prestazioni. E, 10 come numero predefinito dei migliori sottoinsiemi di funzionalità.
Quindi raccogliere e interpretare le funzionalità rilevate dal software. Per generare un grafico a dispersione 3D delle prime 10 caratteristiche dei sottoinsiemi con le migliori prestazioni di classificazione rilevate dal software, fare clic su analizza e ordinare le tre feature in un sottoinsieme di feature in ordine crescente dei loro ranghi, utilizzando i ranghi delle tre caratteristiche come gli assi F1, F2 e F3. Modificare il valore di taglio delle prestazioni su 0,7 e fare clic su analizza per generare un grafico a dispersione 3D dei sottoinsiemi di feature con un valore di misurazione delle prestazioni maggiore o uguale a quello del taglio delle prestazioni.
Quindi fate clic su Sintonizzazione 3D per aprire una nuova finestra per la sintonizzazione manuale degli angoli di visualizzazione del grafico a dispersione 3D e ridurre per ridurre la ridondanza dei sottoinsiemi di feature rilevati. Per annotare un gene sia nei livelli di DNA che di sequenza proteica, aprire la pagina web del database David e fare clic sul collegamento di conversione dell'ID gene per inserire gli ID funzionalità del primo sottoinsieme di biomarcatori del set di dati preparato. Fare clic sul collegamento dell'elenco gene e fare clic su invia elenco per recuperare le annotazioni di interesse e visualizzare l'elenco Gene per ottenere l'elenco dei simboli gene.
Aprire quindi la pagina Web del database GeneCards e immettere il nome del gene di interesse nella casella di input della query del database per trovare le annotazioni di questo gene. Aprire il database Online Mendelian Inheritance in Man e cercare il gene per trovare le annotazioni di questo gene dal database. Per annotare le proteine codificate, aprire la pagina del database della Knowledge Base UniProt e cercare le annotazioni del gene da questo database.
Aprire il sistema di previsione basato sul gruppo, o server web GPS, e recuperare la sequenza proteica codificata dal gene del biomarcatore dal database della knowledge base UniProt e utilizzare lo strumento GPS online per prevedere le proteine residui di modifica post-transizione. Per annotare le interazioni proteina-proteina e i moduli funzionali arricchiti, aprire la pagina del server web di stringhe e utilizzare il database di stringhe per cercare nell'ascensore i geni di interesse per trovare le loro proprietà orchestrate. Per esportare i sottoinsiemi di biomarcatori rilevati per ulteriori analisi, fare clic su esporta la tabella e selezionare il formato di testo appropriato per salvare i file.
Quindi, esporta i grafici di visualizzazione come singoli file di immagine, facendo clic su Salva sotto ogni tracciato e selezionando il formato di immagine appropriato per salvare ogni file. In questo esperimento rappresentativo, due set di dati sono stati formattati come file CSV e caricati nel software come illustrato. Nel primo set di dati, 128 campioni con 12.625 caratteristiche ed etichette di singole classi sono stati caricati con i dati finali Matrix contenenti 95 campioni negativi e 33 campioni positivi.
Operazioni analoghe sono state condotte anche per il secondo set di dati difficile. La ricerca di una parola chiave specifica dell'utente nei nomi delle funzionalità rivela un istogramma delle funzionalità per ogni set di dati. Dopo aver eseguito l'algoritmo della pipeline per ogni set di dati, sono stati rilevati 120 sottoinsiemi di biomarcatori qualificati per un set di dati facile da discriminare, con 57 sottoinsiemi di biomarcatori triplet che dimostrano una precisione del 100%.
Tuttavia, solo 76 sottoinsiemi di biomarcatori sono stati rilevati per il set di dati difficile. E, con una minore precisione del sottoinsieme dei biomarcatori che suggerisce che i biomarcatori sono specifici del fenotipo, un'altra grande sfida nel rilevamento dei biomarcatori. Durante l'utilizzo di questa procedura, è importante ricordare che un problema di selezione futuro ha più soluzioni.
Leggi al meglio le prestazioni della SIM. Dopo il suo sviluppo, questa tecnica ha spianato la strada ai ricercatori biomedici per esplorare il rilevamento biomedico con più soluzioni.