Эта мера может помочь ответить на ключевые вопросы в области биомедицинского обнаружения о генерации нескольких решений. Основным преимуществом этого метода является то, что он обеспечивает удобный графический пользовательский интерфейс для оказания помощи биомедицинских исследователей в обнаружении нескольких функций спадает. Начните с загрузки матрицы данных и классовых меток в программное обеспечение.
Нажмите матрицу данных нагрузки, чтобы выбрать пользовательский файл метрик данных и загрузить метки класса, чтобы выбрать соответствующий файл метки класса. Для определения классовых меток в количестве топовых функций выберите имена положительных и отрицательных классов в соответствующих коробках падения и выберите 10 в качестве числа наиболее рейтинговых объектов в верхней коробке X для всеобъемлющего экрана подмножества функций. Чтобы настроить параметры системы для различных характеристик, выберите точность измерения производительности, так как точность сбалансированной точности падает вниз поле для выбранного экстремального классификатора машины обучения.
Затем выберите значение отсечения 0,7 для указанного измерения производительности в поле ввода отсечения производительности. Чтобы запустить конвейер, нажмите проанализируйте и выберите 0.7 по мере того, как значение по умолчанию измерения производительности отключается. И, 10, как по умолчанию число лучших подмножего функций.
Затем соберите и интерпретируйте функции, обнаруженные программным обеспечением. Для создания 3D рассеяния участок из 10 лучших функций подмножество с лучшими характеристиками классификации обнаружены программное обеспечение, нажмите проанализировать и сортировать три функции в подмножестве функции в порядке возрастания их рядов, используя ряды трех функций, как F1, F2 и F3 осей. Измените производительность, отрезав значение до 0,7, и нажмите анализ, чтобы создать 3D-сюжет рассеяния подмножего функции с большим или равным значению измерения производительности.
Затем нажмите 3D-тюнинг, чтобы открыть новое окно для ручной настройки углов обзора участка 3D рассеяния и уменьшить, чтобы уменьшить избыточность обнаруженных подмножеов функции. Чтобы аннотировать ген в уровнях последовательности ДНК и белка, откройте веб-страницу базы данных David и нажмите на ссылку преобразования идентификатора гена, чтобы ввести идентификаторы функции первого подмножества биомаркеров подготовленного набора данных. Нажмите на ссылку списка генов и нажмите представить список, чтобы получить аннотации, представляющие интерес, и показать список генов, чтобы получить список символов гена.
Затем откройте веб-страницу базы данных GeneCards и введите название гена, представляющий интерес, в поле ввода запросов базы данных, чтобы найти аннотации этого гена. Откройте базу данных Online Mendelian Inheritance in Man и ищите ген, чтобы найти аннотации этого гена из базы данных. Чтобы аннотировать закодированные белки, откройте страницу базовой базы данных UniProt и ищите аннотации гена из этой базы данных.
Откройте систему прогнозирования на основе группы, или веб-сервер GPS, и извлекаем белковую последовательность, закодированную геном биомаркера, из базы данных базы знаний UniProt и используйте онлайн-инструмент GPS для прогнозирования остатков белков после переходной модификации. Чтобы аннотировать белково-белковые взаимодействия и обогащенные функциональные модули, откройте страницу веб-сервера строки и используйте базу данных строк для поиска лифта для генов, представляющих интерес, чтобы найти их организованные свойства. Для экспорта обнаруженных подмножеству биомаркеров для дальнейшего анализа нажмите на таблицу экспорта и выберите соответствующий текстовый формат для сохранения файлов.
Затем экспортировать графики визуализации в качестве отдельных файлов изображений, нажав сохранить под каждым сюжетом и выбрав соответствующий формат изображения для сохранения каждого файла. В этом репрезентативном эксперименте два набора данных были отформатированы как csV-файлы и загружены в программное обеспечение, как это было продемонстрировано. В первом наборе данных 128 образцов с 12, 625 функциями и отдельными классами были загружены матрицей окончательных данных, содержащей 95 отрицательных проб и 33 положительных образца.
Аналогичные операции были также проведены для второго сложного набора данных. Поиск ключевого слова для конкретного пользователя в именах функций показывает гистограмму функций для каждого набора данных. После выполнения алгоритма конвейера для каждого набора данных было обнаружено 120 квалифицированных подмножей биомаркеров для легкого распознавания наборов данных, при этом 57 подмножего биомаркеров в триплете продемонстрировали точность 100%.
Только 76 биомаркеров подмножества, где обнаружены для сложного набора данных, однако. И, с более низкой точностью подмножества биомаркеров, предполагая, что биомаркеры являются специфическими фенотипами, еще одной серьезной проблемой в обнаружении биомаркеров. При использовании этой процедуры важно помнить, что будущая проблема выбора имеет несколько решений.
Читайте SIM лучшие показатели производительности. После своего развития, этот метод проложил путь для биомедицинских исследователей для изучения биомедицинского обнаружения с несколькими решениями.