Выбор нескольких подмножеств биомаркеров с аналогичным образом эффективное двоичной классификации выступления

Xin Feng; Shaofei Wang; Quewang Liu; Han Li; Jiamei Liu; Cheng Xu; Weifeng Yang; Yayun Shu; Weiwei Zheng; Bingxin Yu; Mingran Qi; Wenyang Zhou; Fengfeng Zhou

doi:10.3791/57738

АВТОРЫ

СВЯЖИТЕСЬ С НАМИ

Войдите в систему

Для просмотра этого контента требуется подписка на Jove Войдите в систему или начните бесплатную пробную версию.

В этой статье

Резюме
Аннотация
Введение
протокол
Результаты
Обсуждение
Раскрытие информации
Благодарности
Материалы
Ссылки
Перепечатки и разрешения

Резюме

Существующие алгоритмы генерации одно решение для обнаружения набора биомаркеров. Этот протокол демонстрирует существование нескольких аналогично эффективных решений и представляет удобного программного обеспечения для биомедицинских исследователи расследовать их наборы данных для предлагаемого вызов. Программисты могут также предоставлять эту функцию в их биомаркер алгоритмы обнаружения.

Аннотация

Биомаркер обнаружения является одним из более важных вопросов биомедицинских для высокой пропускной способности «омику» исследователей, и почти все существующие алгоритмы обнаружения биомаркер генерировать один биомаркер подмножество с оптимизированной производительности измерений для заданного набора данных . Однако недавнее исследование продемонстрировал существование нескольких подмножеств биомаркеров с аналогичным образом эффективным или даже идентичные классификации спектаклей. Этот протокол предоставляет простой и понятной методологии для обнаружения подмножеств биомаркеров с двоичной классификации спектакли, лучше, чем отсечки, определяемой пользователем. Протокол состоит из подготовки данных и загрузки, базовой информации уплотнения, настройки параметров, биомаркер скрининг, результат визуализации и интерпретации, биомаркер гена аннотации и результат и визуализация экспорт в качество издания. Предлагаемая биомаркеров, скрининг стратегия является интуитивно понятным и демонстрирует общее правило для разработки алгоритмов обнаружения биомаркеров. Дружественный графический интерфейс пользователя (GUI) был разработан с использованием языка программирования Python, позволяя биомедицинских исследователей, чтобы иметь прямой доступ к их результатам. Исходный код и руководство kSolutionVis можно загрузить с http://www.healthinformaticslab.org/supp/resources.php.

Введение

Двоичной классификации, один из наиболее часто расследование и сложной интеллектуального анализа проблем в области биомедицинских данных используется для построения модели классификации обучение на две группы образцов с наиболее точные дискриминации мощность¹^, ² ^, ³ ^, ⁴ ^, ⁵ ^, ⁶ ^, ⁷. Однако, большие данные, полученные в области биомедицины имеет присущие «большой p малых n» парадигма, с числом функций, обычно намного больше, чем количество образцов⁶^,⁸^,⁹. Таким образом биомедицинских исследователи должны снизить возможность измерения перед использованием классификации алгоритмов, чтобы избежать overfitting проблема⁸^,⁹. Диагноз биомаркеров определяются как часть обнаруженных функций отделения больных данной болезни от здорового управления образцы¹⁰^,¹¹. Пациенты обычно определяются как положительные образцы, и здоровые элементы управления определяются как негативные примеры¹².

Недавние исследования показали, что существует более чем одно решение с идентичными или аналогичным образом эффективной классификации спектакли для биомедицинских данных⁵. Почти все алгоритмы выбора функции являются детерминированными алгоритмы, производить только одно решение для одного набора данных. Генетические алгоритмы могут одновременно создавать несколько решений с аналогичными характеристиками, но они все еще пытаются выбрать одно решение с лучших фитнес-функции в качестве выходных данных для заданного набора данных¹³^,¹⁴.

Функция выбора алгоритмов можно подразделить примерно как фильтры или оболочки¹². Фильтр алгоритм выбирает Топ -k особенности ранжированных по их значительные индивидуальные ассоциации с двоичной класса этикетки, основывается на предположении, что функции являются независимыми друг от друга¹⁵^,¹⁶^,¹⁷. Хотя это предположение не справедливы для почти всех реальных наборов данных, эвристический фильтр выполняет хорошо, во многих случаях, например, mRMR (избыточность минимальной и максимальной релевантности) алгоритм, Вилкоксон тест на функцию фильтрации (WRank) алгоритм и сюжет ROC (приемник эксплуатационные характеристики) на основе алгоритма фильтрации (ROCRank). mRMR, представляет собой эффективный фильтр алгоритм, потому что он приближает комбинаторной оценки проблемы с серией гораздо меньше проблем, сравнивая алгоритм выбора функций максимум зависимость, каждая из которых включает только две переменные, и Таким образом использует попарно совместных вероятностей, которые являются более надежные¹⁸^,¹⁹. Однако mRMR может недооценивать полезность некоторых функций, как это не мера взаимодействия между функциями, которые можно увеличить релевантность и таким образом пропускает некоторые функции комбинаций, которые индивидуально бесполезны, но полезны только при сочетании. WRank алгоритм вычисляет-параметрическая оценка как дискриминационный функцию между двумя классами образцов, и известен за его надежность для останцы²⁰^,²¹. Кроме того ROCRank алгоритм оценивает, насколько важно для исследуемых двоичной классификации производительности²²^,²³площадь под ROC кривой (AUC) конкретного компонента.

С другой стороны оболочка оценивает предварительно определенные классификатора производительность данной функции подмножества, многократно порожденных эвристические правила и создает подмножество функций с лучшими измерения производительности²⁴. Оболочка обычно превосходит фильтра в классификации производительности, но работает медленнее²⁵. Например упорядочить случайный лес (СБР)²⁶^,²⁷ алгоритм использует жадные правило, путем оценки функции на подмножества обучающих данных на каждом узле случайных лесных, чьи оценки важности функция оцениваются индекс Джини . Выбор новой функции будут наказаны, если его прироста информации не улучшить, что выбранной функции. Кроме того анализ прогнозирования для Microarrays (PAM)²⁸^,²⁹ алгоритм, также оболочку алгоритм, вычисляет средневзвешенные для каждого класса знаков, а затем выбирает возможности уменьшить центроиды гена к общей центроид класса. Пэм надежной для удаленных компонентов.

Несколько решений с производительностью лучших классификации могут быть необходимы для любого заданного набора данных. Во-первых цель оптимизации детерминированного алгоритма определяется математическую формулу, например, минимальная ошибка ставка³⁰, который не обязательно подходит для биологических образцов. Во-вторых набор данных может иметь несколько, значительно отличаются, решения с аналогичными эффективным или даже одинаковых спектаклей. Почти все существующие алгоритмы выбора функция будет случайным образом выбирать одну из этих решений как вывода³¹.

Это исследование представит аналитический протокол информатики для генерации несколько функция выбора решений с аналогичными спектаклей для любой данной двоичной классификации набора данных. Учитывая, что наиболее биомедицинских исследователи не знакомы с информатики методы или компьютер кодирование, дружественный графический интерфейс пользователя (GUI) была разработана для облегчения быстрого анализа биомедицинских двоичной классификации наборов данных. Аналитически протокол состоит из загрузки данных и подведение итогов, настройки параметров, конвейер выполнения и интерпретации результатов. С помощью простого клика исследователь способен генерировать биомаркер подмножеств и публикации качество визуализации участков. Протокол был протестирован с помощью transcriptomes двух наборов двоичной классификации острый лимфобластный лейкоз (все), то есть, ALL1 и ALL2¹². Наборы данных ALL1 и ALL2 были загружены из широкой институт генома данных анализа центра, доступны на http://www.broadinstitute.org/cgi-bin/cancer/datasets.cgi. ALL1 содержит 128 образцы с 12,625 функциями. Из этих образцов, 95 являются B-клетка все и 33 являются Т-клеток всех. ALL2 включает в себя 100 образцов с 12,625 функций, а также. Из этих образцов есть 65 пациентов, которые пострадали рецидива и 35 пациентов, которые не. ALL1 был простой двоичной классификации dataset с минимальной точностью четырех фильтров и четыре обертки 96,7%, и 6 8 функция выбора алгоритмов достижения 100%¹². В то время как ALL2 был набор более сложным, с выше 8 функция выбора алгоритмов достижения не лучше, чем 83,7% точность¹². Это лучший точность была достигнута с 56 функций, обнаруженных алгоритмом оболочки, на основе корреляции функция выбора (CFS).

протокол

Примечание: Следующий протокол описывает детали аналитические процедуры информатики и псевдо-коды основных модулей. Система автоматического анализа была разработана с использованием Python версия 3.6.0 и панды модулей Python, abc, numpy, scipy, sklearn, sys, PyQt5, sys, mRMR, математика и matplotlib. Материалы, используемые в данном исследовании, перечислены в Таблице материалов.

1. Подготовка данных матрицы и класса этикетки

Подготовьте файл матрицы данных как файл матрица табуляции или запятыми, как показано на рисунке 1A.
Примечание: Каждая строка содержит все значения функции, и первым пунктом является имя компонента. Probeset ID для набора данных на основе microarray транскриптом или функция может быть другое значение ID как остатков цистеина с ее метилирование значения в наборе данных methylomic. Каждый столбец дает возможность значения данного образца, с первым элементом является имя образца. Строки разделяются на столбцы табуляции (рис. 1B) или запятая (рис. 1 c). Файл с РАЗДЕЛИТЕЛЯМИ табуляциями матрица признается .tsv Расширение файла, и файл с разделителями запятыми матрица имеет расширение .csv. Этот файл может быть порождена сохранения матрицы либо как .tsv или CSV формат от программного обеспечения, таких как Microsoft Excel. Матрица данных также может быть порождена компьютер кодирования.
Подготовьте файл меток класса в формате табуляции или запятыми матрицы (рис. 1 d), аналогично файлу данных матрицы.
Примечание: В первой колонке приводится образец имена, и класс этикетке каждого образца дается в столбце под названием класса. Максимальная совместимость рассматривается в процессе кодирования, так что могут быть добавлены дополнительные столбцы. Ярлык файла класса может быть отформатирован как .tsv или CSV-файл. Имена в столбце класс может быть каких-либо условий, и может быть более двух классов образцов. Пользователь может выбрать любые два из классов для следующих анализа.

2. загрузить матрицы данных и класса этикетки

Загрузка матрицы и класса Метки данных в программное обеспечение. Нажмите на кнопку загрузки данных матрицы для выбора файла пользователем данных матрицы. Нажмите на кнопку Load класса этикетки выбрать соответствующий файл класса label.
Примечание: После того, как оба файлы загружаются, kSolutionVis будет проводить обычные экран совместимости между двумя файлами.
Резюме особенности и образцы из файла данных матрицы. Оцените размер файла данных матрицы.
Суммировать образцы и классов из файла класса label. Оцените размер файла класса label.
Проверьте, имеет ли каждый образец из матрицы данных класса label. Суммируйте количество образцов с метками класса.

3. обобщить и отображения статистики базового набора данных

Нажмите на кнопку суммировать, без ввода указанного ключевого слова, и программное обеспечение будет отображать 20 индексированных функции и соответствующие имена функций.
Примечание: Пользователи должны указать имя компонента, которые они хотели найти, чтобы увидеть ее базовой статистики и соответствующего значения распределения среди всех входных образцов.
Предоставляют ключевое слово, например «1000_at», в текстовом поле функция найти конкретную возможность резюмировать. Нажмите на кнопку конспект для получения базовой статистики для этой заданной функции.
Примечание: Ключевое слово может появиться в любом месте в целевых имен компонентов, облегчить процесс поиска для пользователей.
Нажмите на кнопку, подвести итог найти более чем одну функцию с заданным ключевым словом, а затем укажите идентификатор уникальной особенностью приступить к шаг выше подведения итогов одну особенность.

4. определение класса этикетки и количества функций, топ рейтинг

Выберите имена положительных («P (33)») и отрицательным («N (95)») классы в раскрывающихся списках Класс положительных и Отрицательных класса, как показано на рисунке 2 (в центре).
Примечание: Рекомендуется выбрать что сбалансированного бинарные классификации набора данных, то есть, разница между количеством положительных и отрицательных примеров является минимальным. Количество выборок, также приводится в скобках после имени каждого класса Метки в двух раскрывающихся списках.
Выберите 10 как количество лучших возможностей (параметр pTopX) в раскрывающемся списке Top_X (?) для комплексного экрана особенность-подмножества.
Примечание: Программное обеспечение автоматически занимает все функции по P-значение , вычисленное t тест по каждой функции сравнения положительных и отрицательных классов. Функция с меньше P-значение имеет более требовательных власти между двумя классами образцов. Модуль комплексного скрининга интенсивных вычислений. Параметр pTopX -по умолчанию 10. Пользователи могут изменить этот параметр в диапазоне от 10 до 50, до тех пор, пока они находят удовлетворение располагают подмножества с хорошим классификации спектаклей.

5. Настройте параметры системы для различных исполнений

Выбор показателей (pMeasurement) точность (АКК) в раскрывающемся списке АКК/bAcc (?) для выбранного классификатора крайняя машина обучения (вяз). Еще один вариант этого параметра является измерение сбалансированный точность (bAcc).
Примечание: Пусть TP, FN, TN, и FP количество истинных положительных результатов, ложные негативов, правда негативов и ложных срабатываний, соответственно. Измерения АКК определяется как (TP+TN)/(TP+FN+TN+FP), который лучше всего работает на сбалансированный набор⁶. Но классификатора, оптимизированный для АКК стремится присвоить негативные классу все образцы, если количество отрицательных образцов гораздо больше, чем положительных. BAcc определяется как (Sn + Sp) / 2, где Sn = TP/(TP+FN) и Sp = TN/(TN+FP) правильно предсказал ставки за положительные и отрицательные примеры, соответственно. Таким образом bAcc нормализует предсказания выступления над двумя классами и может привести к сбалансированной предсказание производительности свыше двух классов несбалансированным. АКК является выбором по умолчанию pMeasurement. Программное обеспечение использует классификатор ELM по умолчанию для вычисления классификации спектаклей. Пользователь может также выбрать классификатора из SVM (поддержка векторных машина), KNN (k ближайшего соседа), дерево принятия решений или Байеса.
Выберите пороговое значение 0,70 (параметр pCutoff) для измерения производительности указанного в поле ввода pCutoff:.
Примечание: АКК и bAcc в диапазоне между 0 и 1, и пользователь может указать значение pCutoff[0, 1] как отсечки для отображения соответствующего решения. Программное обеспечение выполняет всеобъемлющую функцию подмножества скрининг, и подходящим выбором pCutoff сделают 3D визуализации, более интуитивным и явной. Значение по умолчанию для pCutoff- 0,70.

6. Запуск конвейера и интерактивная визуализация результатов

Нажмите кнопку Analyze для запуска конвейера и создавать участки визуализации, как показано на рисунке 2 (внизу).
Примечание: Левая таблица дает все подмножества компонентов и их pMeasurement рассчитывается путем десятикратного стратегии перекрестной проверки классификатора вяз, как описано ранее⁵. Для процедуры скрининга особенность подмножество с текущими настройками параметра создаются два 3D точечные участки и участки две линии.
Выберите 0,70 как значение по умолчанию pMeasurement среза (параметр piCutoff, поле ввода значение) и 10 по умолчанию число подмножеств Лучшая особенность (параметр piFSNum).
Примечание: Конвейера выполняется с использованием параметров pTopX, pMeasurement и pCutoff. Функцию обнаруженных подмножества может быть далее экранированный, с помощью отсечки piCutoff, однако piCutoff не может быть меньше, чем pCutoff. Таким образом piCutoff инициализируется как pCutoff и будут визуализированы только подмножества функция с ≥ измерения производительности piCutoff . Значение по умолчанию piCutoff pCutoff. Иногда kSolutionVis обнаруживает множество решений и только лучшие piFSNum (по умолчанию: 10) будет визуализирована функция подмножеств. Если число подмножеств особенность, обнаруженных программой меньше чем piFSNum, все подмножества функция будет визуализирована.
Собирать и интерпретировать особенности обнаружены программного обеспечения, как показано на рисунке 3.
Примечание: В таблице в левом окне показывает обнаруженные функции подмножества и измерения их производительности. Имена первых трех столбцов являются «F1», «F2» и «F3». Три функции в каждой функции подмножества приводятся в порядке их рейтинга в одной строке (F1 < F2 < F3). Последний столбец дает измерение производительности (АКК или bAcc) подмножества каждого компонента, и его имя столбца (АКК или bAcc) является значение pMeasurement.

7. интерпретировать 3D точечные участки визуализации и интерпретации функции подмножества с аналогичным образом эффективное двоичной классификации выступления с использованием 3D точечные участки

Нажмите кнопку анализ для создания 3D точечная подмножеств Топ 10 функция с лучших спектаклей классификации (АКК или bAcc) обнаружены программного обеспечения, как показано на рисунке 3 (средний ящик). Сортировать три функции в подмножестве особенность в возрастающем порядке их ряды и использовать ряды трех функций как F1/F2/F3 осей, т.е., F1 < F2 < F3.
Примечание: Цвет точка представляет двоичной классификации производительность соответствующего подмножества компонентов. Набор данных может иметь несколько подмножеств функция с аналогичным образом эффективность измерений. Таким образом интерактивный и упрощенной точечной является необходимым.
Измените значение на 0,70 в поле ввода pCutoff: и нажмите кнопку анализ для создания 3D Точечная функция подмножеств с производительности измерений ≥ piCutoff, как показано на рисунке 3 (в правом окне). Нажмите кнопку 3D тюнинг открыть новое окно вручную настроить углы 3D точечную диаграмму.
Примечание: Каждое подмножество функций представляет точку в так же, как выше. 3D точечная сгенерирована угла по умолчанию. Для облегчения 3D визуализации и тюнинг, отдельном окне будет открыта, нажав на кнопку 3D тюнинг.
Нажмите кнопку уменьшить уменьшить избыточность обнаруженных функция подмножеств.
Примечание: Если пользователи хотят далее выберите функцию тройни и свести к минимуму избыточность функция подмножеств, программное обеспечение также предоставляет эту функцию, используя алгоритм выбора функций mRMR. После нажатия на кнопку уменьшить , kSolutionVis удаления этих избыточных функций в функцию тройни и восстановить таблицу и два разброс участков, упомянутых выше. Удалены функции функция тройни будет заменен ключевым словом в таблице. Значения None в оси F1/F2/F3 будет обозначать как значение piFSNum (диапазон нормальной стоимости F1/F2/F3 — [1, top_x]). Таким образом точки, которые включают значение None может показаться «выброс» точек в 3D участков. Вручную перестраиваемый 3D участки могут найти в «Ручная настройка 3D точка участков» в дополнительном материале.

8. найти ген аннотации и их ассоциации с заболеваний человека

Примечание: Шаги 8 – 10 будет показано, как для аннотирования ген от уровня последовательности ДНК и белка. Во-первых ген символ каждого биомаркер ID из выше шаги будут извлечены из базы данных Дэвид³², а затем два представителя веб-сервера будет использоваться для анализа этот ген символ от уровней ДНК и белка, соответственно. Сервер GeneCard обеспечивает всеобъемлющие функциональные аннотации данного гена символа, и Менделевское наследование у человека базы данных (Маккусика) обеспечивает наиболее полное курирование болезни Джин ассоциаций. Сервер UniProtKB является одним из наиболее всеобъемлющей базы данных белков, и сервера на основе группы прогнозирования системы (GPS) предсказывает сигнализации фосфорилирование в очень большой список киназы.

Копировать и вставить веб-ссылку базы данных Дэвид в веб-браузер и откройте веб-страницу этой базы данных. Нажмите на ссылку Гена ID преобразования в рисунке 4A и ввода функцию идентификаторы 38319_at/38147_at/33238_at первого биомаркер подмножества набора данных ALL1 (Рисунок 4B). Нажмите на ссылку Генов списка и нажмите кнопку Отправить список , как показано на рисунке 4В. Извлечь заметки интерес и нажмите кнопку Показать список гена (рис. 4 c). Получить список символов гена (рис. 4 d).
Примечание: Символы гена, полученные здесь будет использоваться для дальнейшего функциональных аннотации в следующих шагах.
Копировать и вставить веб-ссылку базы данных ген карты в веб-браузер и откройте веб-страницу этой базы данных. Поиск имя гена CD3D в поле ввода запроса базы данных и найдите аннотации этого гена Джин карт³³^,³⁴, как показано в таблице 1 и Рисунок 5A.
Примечание: Джин карт является геном всеобъемлющей базы знаний, обеспечивая номенклатуры, геномики, протеомики, субцеллюлярные локализации и участие пути и других функциональных модулей. Он также предоставляет внешние ссылки на различных других биомедицинских базах данных как PDB/PDB_REDO³⁵, Джин Entrez³⁶, Маккусика³⁷и³⁸UniProtKB. Если имя компонента не является символом стандартного гена, используйте базу данных ENSEMBL преобразовать³⁹. CD3D — это имя ген Т-клеточный рецептор T3 Дельта цепи.
Копировать и вставить веб-ссылку базы данных Маккусика в веб-браузер и откройте веб-страницу этой базы данных. Поиск имени гена CD3D и найти заметки этого гена из базы данных Маккусика³⁷, как показано в таблице 1 и на рисунке 5B.
Примечание: Маккусика служит теперь одним из наиболее всеобъемлющим и авторитетным источников человеческого гена соединения с наследуемыми заболеваний. Маккусика был инициирован д-р Виктор а. McKusick каталог связанные заболевания генетические мутации⁴⁰. Маккусика в настоящее время охватывает более 15 000 генов человека и более 8500 фенотипов, по состоянию на Декабрь 1^st 2017.

9. Аннотирование закодированные белков и столб-поступательные изменения

Копировать и вставить веб-ссылку базы данных UniProtKB в веб-браузер и откройте веб-страницу этой базы данных. Поиск имени гена CD3D в поле ввода запроса UniProtKB и найти заметки этого гена из базы данных-³⁸, как показано в таблице 1 и на рисунке 5 c.
Примечание: UniProtKB собирает богатым источником аннотации для белков, в том числе номенклатуры и функциональной информации. Эта база данных также содержит внешние ссылки на другие широко используемых баз данных, включая PDB/PDB_REDO³⁵, Маккусика³⁷и⁴¹Pfam.
Копировать и вставить веб-ссылку на веб-сервер GPS в веб-браузер и откройте веб-страницу этого веб-сервера. Извлечение последовательности белка, кодируемых биомаркер гена CD3D от UniProtKB базы данных³⁸ и предсказать белка столб-поступательные изменения (ПТМ) остатков с помощью онлайн-инструмент GPS, как показано в таблице 1 и на рисунке 5 d.
Примечание: Биологические системы является динамичным и сложным, и существующих баз данных собирать только известной информации. Таким образом биомедицинских предсказания онлайн-инструментов, а также автономные программы может предоставить полезные доказательств для дополнения механизма гипотетической. GPS был развитых и улучшение на протяжении 12 лет⁷^,⁴² и могут быть использованы для прогнозирования белка PTM остатков в⁴³^,данной пептида в последовательности⁴⁴. Инструменты также доступны для различных темы исследований, включая прогнозирование белка субцеллюлярные расположение⁴⁵ и транскрипционным фактором привязки мотивы ⁴⁶ среди других.

10. Аннотирование белок белковых взаимодействий и их обогащенных функциональных модулей

Копировать и вставить веб-ссылку на веб-сервер строку в веб-браузер и откройте веб-страницу этого веб-сервера. Поиск в списке для генов CD3D и P53 и найти их организовали свойств, с помощью базы данных строка⁴⁷. Такая же процедура может осуществляться с помощью другой веб-сервер, Дэвид³².
Примечание: Помимо вышеупомянутых аннотации для отдельных генов, есть много крупномасштабных информатики инструментов, доступных для изучения свойств группы генов. Недавнее исследование показало, что индивидуально плохо маркерных генов может представлять набор значительно улучшилась гена⁵. Таким образом стоит вычислительная стоимость экран для более сложных биомаркеров. Базы данных строка может визуализировать подключения известных или прогнозируемое взаимодействие, и Дэвид сервера может обнаружить функциональные модули с значительным фенотип ассоциаций в запрашиваемый гены⁴⁷,³². Также доступны различные другие инструменты анализа крупномасштабных информатики.

11. экспорт подмножеств сгенерированный биомаркеров и участки визуализация

Экспорт обнаруженные биомаркер подмножеств .tsv или CSV текстовый файл для дальнейшего анализа. Нажмите кнопку экспортировать таблицу под столом всех подмножеств обнаруженных биомаркеров и выбрать какой формат текста, чтобы сохранить как.
Экспортируйте участки визуализация файла изображения. Нажмите на кнопку сохранить под каждого участка и выбрать какой формат изображения, чтобы сохранить как.
Примечание: Программное обеспечение поддерживает .png формат пикселей и векторный формат .svg. Пиксель изображения являются хорошими для отображения на экране компьютера, в то время как векторных изображений могут быть преобразованы в любой резолюции, необходимые для целей публикации журнала.

Результаты

Цель этого рабочего процесса (рис. 6) является выявление нескольких подмножеств биомаркеров с аналогичными эффективности для двоичной классификации набора данных. Весь процесс иллюстрируется двумя пример наборов данных ALL1 и ALL2, извлеченные из недавно...

Обсуждение

Это исследование представляет протокол обнаружения и характеристика easy-to последующие мульти решение биомаркер для пользовательской двоичной классификации набора данных. Программное обеспечение ставит акцент на удобство и гибкий импорт/экспорт интерфейсы для различных форматов фай...

Раскрытие информации

У нас нет конфликтов интересов, связанных к настоящему докладу.

Благодарности

Эта работа была поддержана стратегических приоритетных исследований программы Китайской академии наук (XDB13040400) и запуска грант от университета Цзилинь. Анонимные Отзывы и биомедицинских испытаний пользователей были оценены за их конструктивные замечания по улучшению юзабилити и функциональность kSolutionVis.

Материалы

Name	Company	Catalog Number	Comments
Hardware
laptop	Lenovo	X1 carbon	Any computer works. Recommended minimum configuration: 1GB extra hard disk space, 1 GB memory, 2.0MHz CPU
Name	Company	Catalog Number	Comments
Software
Python 3.0	WingWare	Wing Personal	Any python programming and running environments support Python version 3.0 or above