×
27.05.2023
223.018.7168

Результат интеллектуальной деятельности: СПОСОБ УМЕНЬШЕНИЯ ВКЛАДА ТЕХНИЧЕСКИХ ФАКТОРОВ В СУММАРНЫЙ СИГНАЛ ДАННЫХ МАСС-СПЕКТРОМЕТРИИ С ПОМОЩЬЮ ФИЛЬТРАЦИИ ПО ТЕХНИЧЕСКИМ ОБРАЗЦАМ

Вид РИД

Изобретение

Аннотация: Изобретение относится к области медицины. Предложен компьютерно-реализуемый способ удаления липидных признаков со слабым сигналом. Получают технические образцы, в которых отсутствует биологический сигнал, и биологические образцы, в которых присутствует биологический сигнал. На вычислительном устройстве осуществляют сравнение вышеуказанных образцов, при этом установлен порог 0,5 в логарифмической шкале по основанию два, между средними значениями в технических и биологических образцах. Если по меньшей мере один липидный признак имеет разницу меньше чем 0,5 между средним значением в биологических образцах и в технических образцах, то данный липидный признак удаляют из данных. Изобретение обеспечивает уменьшение влияния технических факторов в данных жидкостной хроматографии с масс-спектрометрией посредством удаления липидных признаков со слабым сигналом. 1 ил.

ОБЛАСТЬ ТЕХНИКИ

Настоящее техническое решение относится к области медицины, в частности, к способу уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам.

УРОВЕНЬ ТЕХНИКИ

В уровне техники предложены различные методы корректировки смещения сигнала основываясь на информации о принадлежности батчу или порядку загрузки. Например, в работах [1], [2] описываются методы линейной регрессии на номере загрузки или номере экспериментального батча. Работа [3] использует локально взвешенное сглаживание диаграммы рассеяния. Популярный метод ComBat [4], изначально разработанный для данных секвенирования, основывается на эмпирическом байесовском подходе и на данный момент является популярным методом для коррекции сдвига сигнала области масс-спектрометрии.

Несмотря на существование большого количества подходов, до сих пор не ясно, какой из многочисленных методов работает лучше для решения задачи корректировки смещения сигнала.

Описанные выше методы призваны каждый детектированный липидный признак максимально очистить от нежелательных факторов.

Предлагаемый способ позволяет фильтровать (удалять) некоторые признаки с целью избавления от основной части технического шума.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Технической проблемой, на решение которой направлено заявленное техническое решение, является создание способа уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам, который охарактеризован в независимом пункте формулы.

Технический результат заключается в уменьшение влияния технических факторов в данных жидкостной хроматографии с масс-спектрометрией, посредством удаления липидных признаков со слабым или отсутствующим сигналом.

Заявленный результат достигается за счет осуществления способа уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам, содержащий этапы, на которых:

получают технические образцы, в которых отсутствует биологический сигнал, и биологические образцы, в которых присутствует биологический сигнал;

на вычислительном устройстве осуществляют сравнение вышеуказанных образцов, при этом установлен порог 0.5 в логарифмической шкале по основанию два, между средними значениями в технических и биологических образцах;

если по меньшей мере один липидный признак имеет разницу меньше чем 0,5 между средним значением в биологических образцах и в технических образцах, то данный липидный признак удаляют из данных.

ОПИСАНИЕ ЧЕРТЕЖЕЙ

Реализация изобретения будет описана в дальнейшем в соответствии с прилагаемыми чертежами, которые представлены для пояснения сути изобретения и никоим образом не ограничивают область изобретения. К заявке прилагаются следующие чертежи:

Фиг. 1 иллюстрирует пример общей схемы вычислительного устройства.

ДЕТАЛЬНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

В приведенном ниже подробном описании реализации изобретения приведены многочисленные детали реализации, призванные обеспечить отчетливое понимание настоящего изобретения. Однако, квалифицированному в предметной области специалисту, будет очевидно каким образом можно использовать настоящее изобретение, как с данными деталями реализации, так и без них. В других случаях хорошо известные методы, процедуры и компоненты не были описаны подробно, чтобы не затруднять излишне понимание особенностей настоящего изобретения.

Кроме того, из приведенного изложения будет ясно, что изобретение не ограничивается приведенной реализацией. Многочисленные возможные модификации, изменения, вариации и замены, сохраняющие суть и форму настоящего изобретения, будут очевидными для квалифицированных в предметной области специалистов.

Предлагаемый метод основан на теории, что техническим факторам в большой степени подвержены липидные признаки, которые несут мало биологического сигнала. Под липидными признаками понимается количественное измерение некоторого химического соединения в каждом образце заданного эксперимента. В результате эксперимента жидкостной хроматографии с масс-спектрометрии для каждого образца получается спектр. С сырыми спектрами работать нельзя, для этого существуют специализированные программные обеспечения, которые из набора спектров, соответствующих образцам, производят таблицу с признаками. Таким образом, для каждого образца, вместо спектра имеется набор признаков, которое программное обеспечение нашло в данном спектре. Признак соответствует некоторому химическому соединению, и значение признака - количеству этого соединение в данном образце. В процессе пробоподготовки и данного экспериментального метода получаются липидные соединения.

Технические факторы валяют на липидные признаки следующим образом: например, образцы делятся на две группы по значениям какого-то липидного признака, то есть половина образцов имеет большие значения по этому признаку, а другая половина имеет меньшие значения. Однако это разделение связано не с биологическими факторами, а с техническими, такими, как, например, порядок загрузки образца в масс-спектрометр. То есть для заданного липидного признака, его значения подвержены как биологическим факторам, так и не желательным техническим факторам, а итоговый сигнал складывается как сумма этих факторов.

На первом этапе способа получают технические образцы в которых отсутствует биологический сигнал и биологические образцы в которых присутствует биологический сигнал.

Под биологическими образцами понимаются те образцы, для которых необходимо в процессе эксперимента получить липидные измерения. Это может быть образец мозга, или плазмы кровы и/или другой ткани. Биологический образец противопоставляется техническим образцам - это образцы, которые сами по себе не интересны, но добавляются в эксперимент для вспомогательных функций. Данные технические образцы подготавливаются заранее, они проходят все те же этапы пробоподготовки, что и обычные образцы, однако без добавления биологического материала. Для создания тестовых данных были использованы данные проекта Карты Мозга, и программа XCMS для их первичной обработки.

На вычислительном устройстве осуществляют сравнение вышеуказанных образцов, при этом установлен порог 0.5 в логарифмической шкале по основанию два, между средними значениями в технических и биологических образцах. Если по меньшей мере один липидный признак имеет разницу меньше чем 0,5 между средним значением в биологических образцах и в технических образцах, то данный липидный признак удаляют из данных.

Был проведен сравнительный анализ для данных “карты мозга”, это образцы разных регионов мозга человека и человекоподобных обезьян. Для сравнения работы предложенного способа использовалась популярная программа «ComBat»[4], которая призвана очищать липидные признаки от зашумляющих технических факторов. На данных выхода предложенного способа использовалась наивная коррекция, основанная на среднем значении липидных признаков в одном батче образцов (выравнивание среднего сигнала по батчу). Батч эффект возникает, когда небиологические факторы в эксперименте вызывают изменения в данных, полученных в эксперименте.

В качестве метрики использовалось количество значимых признаков между двумя интересующими группами образцов - образцов из первичной коры и вторичной коры головного мозга данных проекта Карты Мозга. В качестве поправки на множественное тестированное мы использовали поправку Бенджамини-Иекутели, а не более известную поправку Бенджамини-Хохберга в связи с тем, что предположение о неотрицательной взаимосвязи тестов может не выполняться в данных масс-спектрометрии. Из 9089 липидных признаков, которые были детектированы в наших данных, по результатам работы программы «ComBat»[4] было получено 506 значимых признаков после поправки на множественное тестирование. По результатам предложенного способа было получено 633 значимых признаков после поправки на множественное тестирование, что соответствует приросту в 25%. Таким образом, предлагаемый способ позволяет извлечь больше полезного сигнала из данных.

На Фиг. 1 далее будет представлена общая схема вычислительного устройства (100), обеспечивающего обработку данных, необходимую для реализации заявленного решения.

В общем случае устройство (100) содержит такие компоненты, как: один или более процессоров (101), по меньшей мере одну память (102), средство хранения данных (103), интерфейсы ввода/вывода (104), средство В/В (105), средства сетевого взаимодействия (106).

Процессор (101) устройства выполняет основные вычислительные операции, необходимые для функционирования устройства (100) или функциональности одного или более его компонентов. Процессор (101) исполняет необходимые машиночитаемые команды, содержащиеся в оперативной памяти (102).

Память (102), как правило, выполнена в виде ОЗУ и содержит необходимую программную логику, обеспечивающую требуемый функционал.

Средство хранения данных (103) может выполняться в виде HDD, SSD дисков, рейд массива, сетевого хранилища, флэш-памяти, оптических накопителей информации (CD, DVD, MD, Blue-Ray дисков) и т.п. Средство (103) позволяет выполнять долгосрочное хранение различного вида информации, например, вышеупомянутых файлов с наборами данных пользователей, базы данных, содержащих записи измеренных для каждого пользователя временных интервалов, идентификаторов пользователей и т.п.

Интерфейсы (104) представляют собой стандартные средства для подключения и работы с серверной частью, например, USB, RS232, RJ45, LPT, COM, HDMI, PS/2, Lightning, FireWire и т.п.

Выбор интерфейсов (104) зависит от конкретного исполнения устройства (N00), которое может представлять собой персональный компьютер, мейнфрейм, серверный кластер, тонкий клиент, смартфон, ноутбук и т.п.

В качестве средств В/В данных (105) в любом воплощении системы, реализующей описываемый способ, должна использоваться клавиатура. Аппаратное исполнение клавиатуры может быть любым известным: это может быть, как встроенная клавиатура, используемая на ноутбуке или нетбуке, так и обособленное устройство, подключенное к настольному компьютеру, серверу или иному компьютерному устройству. Подключение при этом может быть, как проводным, при котором соединительный кабель клавиатуры подключен к порту PS/2 или USB, расположенному на системном блоке настольного компьютера, так и беспроводным, при котором клавиатура осуществляет обмен данными по каналу беспроводной связи, например, радиоканалу, с базовой станцией, которая, в свою очередь, непосредственно подключена к системному блоку, например, к одному из USB-портов. Помимо клавиатуры, в составе средств В/В данных также может использоваться: джойстик, дисплей (сенсорный дисплей), проектор, тачпад, манипулятор мышь, трекбол, световое перо, динамики, микрофон и т.п.

Средства сетевого взаимодействия (106) выбираются из устройства, обеспечивающий сетевой прием и передачу данных, например, Ethernet карту, WLAN/Wi-Fi модуль, Bluetooth модуль, BLE модуль, NFC модуль, IrDa, RFID модуль, GSM модем и т.п. С помощью средств (105) обеспечивается организация обмена данными по проводному или беспроводному каналу передачи данных, например, WAN, PAN, ЛВС (LAN), Интранет, Интернет, WLAN, WMAN или GSM.

Компоненты устройства (100) сопряжены посредством общей шины передачи данных (110).

В настоящих материалах заявки было представлено предпочтительное раскрытие осуществление заявленного технического решения, которое не должно использоваться как ограничивающее иные, частные воплощения его реализации, которые не выходят за рамки испрашиваемого объема правовой охраны и являются очевидными для специалистов в соответствующей области техники.

Источники информации

[1] Kuligowski J, Pérez-Guaita D, Lliso I, Escobar J, León Z, Gombau L, Solberg R, Saugstad OD, Vento M, Quintás G. Detection of batch effects in liquid chromatography-mass spectrometry metabolomic data using guided principal component analysis. Talanta. 2014 Dec;130:442-8. doi:10.1016/j.talanta.2014.07.031. Epub 2014 Jul 18. PubMed PMID: 25159433.

[2] San-Yuan Wang, Ching-Hua Kuo, and Yufeng J. Tseng. Batch Normalizer: A Fast Total Abundance Regression Calibration Method to Simultaneously Adjust Batch and Injection Order Effects in Liquid Chromatography/Time-of-Flight Mass Spectrometry-Based Metabolomics Data and Comparison with Current Calibration Methods. Analytical Chemistry 2013 85 (2), 1037-1046.

[3] Fernández-Albert F, Llorach R, Garcia-Aloy M, Ziyatdinov A, Andres-Lacueva C, Perera A. Intensity drift removal in LC/MS metabolomics by common variance compensation. Bioinformatics. 2014 Oct 15;30(20):2899-905. doi: 10.1093/bioinformatics/btu423. Epub 2014 Jul 2. PubMed PMID: 24990606.

[4] Leek, J. T., Johnson, W. E., Parker, H. S., Jaffe, A. E., & Storey, J. D. (2012). The sva package for removing batch effects and other unwanted variation in high-throughput experiments. Bioinformatics, 28(6), 882-883. http://doi.org/10.1093/bioinformatics/bts034.

Источник поступления информации: Роспатент

Показаны записи 1-6 из 6.
23.05.2023
№223.018.6df4

Способ определения фазы сна в длительной записи ээг

Изобретение относится к вычислительной технике. Предложен компьютерно-реализуемый способ определения фазы сна в длительной записи ЭЭГ, который содержит подготовительный этап, на котором: производят предобработку по меньшей мере одного сигнала ЭЭГ из базы данных, осуществляют фильтрацию по...
Тип: Изобретение
Номер охранного документа: 0002751137
Дата охранного документа: 08.07.2021
23.05.2023
№223.018.6f0a

Способ улучшения качества аннотации липидных признаков, относящихся к отдельным липидным классам, с использованием информации о времени задержки в масс-спектрометре

Изобретение относится к области медицины. Предложен способ анализа данных о содержании в образце интересующих классов липидов на основе масс-спектрометрического анализа с жидкостной хроматографией, включающий получение данных жидкостной хроматографии с масс-спектрометрией анализируемого...
Тип: Изобретение
Номер охранного документа: 0002743418
Дата охранного документа: 18.02.2021
23.05.2023
№223.018.6f20

Способ локализации отделов головного мозга

Изобретение относится к вычислительной технике, а именно к локализации отделов головного мозга. Способ содержит этапы, на которых: получают изображения магнитно-резонансной томографии в формате DICOM; конвертируют изображения из формата DICOM в формат BIDS; обрабатывают конвертированные...
Тип: Изобретение
Номер охранного документа: 0002743608
Дата охранного документа: 20.02.2021
30.05.2023
№223.018.73b5

Способ детектирования фокальных эпилептиформных разрядов в длительной записи ээг

Изобретение относится к медицине и вычислительной технике. Предложен способ автоматического детектирования фокальных эпилептиформных разрядов в длительной записи ЭЭГ, содержащий: а) подготовительный этап, на котором на вычислительном устройстве осуществляют предобработку по меньшей мере одного...
Тип: Изобретение
Номер охранного документа: 0002753267
Дата охранного документа: 12.08.2021
30.05.2023
№223.018.73d4

Способ выявления депрессии на основе данных ээг

Изобретение относится к вычислительной технике, а именно к выявлению депрессии на основе данных ЭЭГ. Предложен способ, содержащий: подготовительный этап, на котором осуществляют предобработку по меньшей мере одного сигнала покоя ЭЭГ; извлекают информативные признаки из по меньшей мере одного...
Тип: Изобретение
Номер охранного документа: 0002754779
Дата охранного документа: 07.09.2021
30.05.2023
№223.018.73de

Способ определения смещения срединных структур головного мозга по изображениям компьютерной томографии

Настоящее изобретение относится к области вычислительной техник. Предложен способ определения смещения срединных структур головного мозга по изображениям компьютерной томографии (далее - КТ). Предлагаемый способ содержит этапы, на которых: на вычислительном устройстве получают КТ-изображение;...
Тип: Изобретение
Номер охранного документа: 0002756156
Дата охранного документа: 28.09.2021
Показаны записи 1-3 из 3.
27.03.2020
№220.018.1080

Snp-панель для генотипирования и геномной селекции подсолнечника по содержанию жирных кислот в масле семян

Изобретение относится к области биохимии, в частности к способу отбора сорта семян подсолнечника с повышенным или пониженным содержанием жирных кислот, выбранных из группы: 16:2, 18:1, 18:2, 18:3 и 20:2. Изобретение позволяет эффективно определять содержание жирных кислот. 6 з.п. ф-лы, 1 ил., 3...
Тип: Изобретение
Номер охранного документа: 0002717642
Дата охранного документа: 24.03.2020
23.05.2023
№223.018.6f0a

Способ улучшения качества аннотации липидных признаков, относящихся к отдельным липидным классам, с использованием информации о времени задержки в масс-спектрометре

Изобретение относится к области медицины. Предложен способ анализа данных о содержании в образце интересующих классов липидов на основе масс-спектрометрического анализа с жидкостной хроматографией, включающий получение данных жидкостной хроматографии с масс-спектрометрией анализируемого...
Тип: Изобретение
Номер охранного документа: 0002743418
Дата охранного документа: 18.02.2021
27.05.2023
№223.018.7187

Способ квантификации статистического анализа альтернативного сплайсинга в данных рнк-сек

Изобретение относится к биотехнологии. Описан способ обнаружения отличий в частоте включения экзона при помощи анализа данных РНК-секвенирования. Согласно способу: получают данные РНК-секвенирования, состоящие из набора прочтений, из по меньшей мере одного образца, при этом образец получают из...
Тип: Изобретение
Номер охранного документа: 0002752663
Дата охранного документа: 29.07.2021
+ добавить свой РИД