×
12.04.2020
220.018.143b

МЕДИЦИНСКИЙ ПРОГНОЗ И ПРЕДСКАЗАНИЕ РЕЗУЛЬТАТОВ ЛЕЧЕНИЯ, ИСПОЛЬЗУЯ АКТИВНОСТИ МНОЖЕСТВА КЛЕТОЧНЫХ СИГНАЛЬНЫХ ПУТЕЙ

Вид РИД

Изобретение

Юридическая информация Свернуть Развернуть
№ охранного документа
0002718647
Дата охранного документа
10.04.2020
Краткое описание РИД Свернуть Развернуть
Аннотация: Предложенная группа изобретений относится к области медицины, в частности к биоинформатике. Предложены способ, устройство и носитель долговременного хранения информации для определения степени риска, которая указывает на риск рецидива рака после лечения или риск прогрессирования рака или смерти, где степень риска основана на комбинации выведенных активностей двух или более клеточных сигнальных путей в ткани, и/или клетках, и/или жидкости организма субъекта. Клеточные сигнальные пути содержат путь Wnt, путь ER и/или путь HH. Степень риска определяется таким образом, что указанный риск возникновения клинического события в течение определенного промежутка времени уменьшается с увеличением P и увеличивается с увеличением max(P, P), где P, P и P означают выведенную активность пути ER, пути Wnt и пути HH соответственно. Предложенная группа изобретений позволяет эффективно определять степень риска рецидива рака после лечения, риска прогрессирования рака или смерти. 3 н. и 9 з.п. ф-лы, 7 ил., 14 табл., 6 пр.
Реферат Свернуть Развернуть

Описанный здесь объект изобретения в общем относится к биоинформатике, обработке геномных данных, обработке протеомных данных и родственным областям техники.

Уровень техники

Геномный и протеомный анализы имеют в существенной степени реализованную и потенциальную перспективу для клинического применения в областях медицины, такой как онкология, где, как известно, различные типы рака связаны с определенными комбинациями геномных мутаций/вариаций/аномальных паттернов метилирования и/или высокими или низкими уровнями экспрессии определенных генов, которые важны для роста и развития рака, например, клеточной пролиферации и метастазирования. Например, сигнальный путь Wnt оказывает влияние на регуляцию клеточной пролиферации и является жестко регулируемым. Была выявлена корреляция с раком, в том числе со злокачественными опухолями прямой кишки, высокой активности пути Wnt из-за потери регуляции. Не ограничиваясь какой-либо конкретной теорией, считается, что нарушение регуляции пути Wnt в злокачественных клетках в прямой кишке приводит к высокой активности пути Wnt, что, в свою очередь, вызывает клеточную пролиферацию злокачественных клеток в прямой кишке, т.е. к распространению рака прямой кишки. С другой стороны, аномально низкая активность пути также может представлять интерес, например, в случае остеопороза. Другие сигнальные пути, которые играют аналогичные роли в делении, функционировании и/или дифференцировке клеток в здоровом состоянии и в случае болезни, представляют собой клеточные сигнальные пути (например, ER, PR, AR, PPAR, GR, VitD, TGFbeta, Notch, Hedgehog, FGF, NFkappaB, VEGF и PDGF).

Методы получения геномных и протеомных данных стали легко доступными в клинических условиях. Например, измерения с использованием микрочипов обычно применяются для оценки уровней экспрессии генов, уровней белков, метилирования и т.д. Автоматизированное секвенирование генов позволяет выполнять эффективную по стоимости идентификацию генетических изменений/мутаций/паттернов аномального метилирования в ДНК и РНК. Количественная оценка уровней мРНК в процессе секвенирования является перспективной в качестве клинического инструмента для оценки уровней генной экспрессии.

Одной из основных задач для терапевта, например, онколога, является эмпирическая оценка прогноза для пациента, поскольку эта информация влияет на выбор метода терапии. Анализ геномики на основе тканевого образца рака, транскриптомики и протеомики (и других "омик") для отдельного пациента дает информацию, которая может оказать потенциальный вклад в прогностическую оценку состояния пациента. Однако можно с уверенностью утверждать, что интерпретация этих комплексных данных для выделения релевантной клинической информации до сих пор остается нерешенной задачей. Прогноз для пациента может быть представлен в виде количественных данных несколькими способами, например: “время до появления рецидива” или “время до появления метастазов”, или “время выживания”, или “риск смертельного исхода из-за болезни или лечения”.

Сущность изобретения

Настоящее изобретение предоставляет новые и улучшенные способы и устройства, описанные в этом документе.

Согласно основному аспекту настоящего изобретения, указанная выше проблема решается конкретным способом определения степени риска, которая указывает на риск возникновения клинического события в течение определенного промежуток времени, а именно, способ содержит:

Вывод об активности двух или более клеточных сигнальных путей в ткани и/или клетках, и/или в жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии одного или нескольких целевых генов клеточных сигнальных путей, измеренных в извлеченном образце ткани и/или клеток, и/или жидкости организма субъекта, и

определение степени риска, которая указывает на риск возникновения клинического события в течение определенного промежутка времени, где степень риска основана, по меньшей мере, частично на комбинации выведенных активностей (активностей, относительно которых сделан вывод),

где клеточные сигнальные пути содержат путь Wnt, путь ER (эстрогеновый рецептор), путь НН (Hedgehog) и/или путь AR (андрогеновый рецептор),

где клеточные сигнальные пути содержат путь ER, путь Wnt и путь HH, и где степень риска определяется таким образом, что указанный риск возникновения клинического события в течение определенного промежутка времени уменьшается с увеличением PER и увеличивается с увеличением max(PWnt, PHH),

где PER, PWnt и PHH означают выведенные активности пути ER, пути Wnt и пути HH, соответственно.

Субъектом может быть человек или животное и, в частности, медицинский субъект. Помимо этого, "целевой ген(целевые гены)" может представлять собой "непосредственный целевой ген" и/или "опосредованный целевой ген" (как описано здесь).

Путь Wnt, путь ER, путь HH и путь AR предпочтительно определены как клеточный сигнальный путь, который, в конечном итоге, приводит к транскрипционной активности комплексов фактора транскрипции (TF), связанных с этим путем. Предпочтительно, они состоят из, по меньшей мере, β-катенина/TCF4, ERα димера, члена семейства GLI и AR, соответственно.

Вывод об активности клеточных сигнальных путей в ткани и/или клетках и/или жидкости организма у субъекта может быть сделан, например, помимо прочего, по (i) оценке, по меньшей мере, части вероятностной модели, предпочтительно Байесовской сети, представляющей клеточные сигнальные пути, для набора входных данных, включая, по меньшей мере, уровни экспрессии одного или нескольких целевых генов указанных клеточных сигнальных путей, измеренные в ткани и/или клетках и/или жидкости организма (например, путем окрашивания среза ткани или клеток) или в извлеченном образце ткани и/или клетках и/или жидкости организма субъекта, (ii) оценке уровня в ткани субъекта, по меньшей мере, одного элемента фактора транскрипции (TF), причем указанный, по меньшей мере, один элемент TF, управляет транскрипцией одного или нескольких целевых генов клеточных сигнальных путей, и указанная оценка основывается, по меньшей мере, частично на условных вероятностях, относящихся к указанному, по меньшей мере, одному элементу TF и уровням экспрессии указанного одного или нескольких целевых генов клеточного сигнального пути, измеренным в извлеченном образце субъекта, и (iii) выводу об активности клеточных сигнальных путей, сделанному на основании оцененного уровня фактора транскрипции в образце ткани и/или образце клеток и/или образце жидкости организма. Более подробно об этом описано в опубликованной Европейской заявке на патент EP 2 549 399 A1 (“Оценка активности пути Wnt с применением вероятностного моделирования экспрессии целевых генов”) и, в частности, в опубликованной международной заявке на патент WO 2013/011479 A2 (“Оценка активности клеточных сигнальных путей с применением вероятностного моделирования экспрессии целевых генов”), содержание которых включено в настоящую заявку во всей своей полноте в качестве ссылки.

В одной из иллюстративных альтернатив вывод об активности одного или нескольких клеточных сигнальных путей в ткани и/или клетках и/или жидкости организма субъекта может быть сделан, помимо прочего, путем (i) определения уровня элемента фактора транскрипции (TF) в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, где элемент TF управляет транскрипцией одного или нескольких целевых генов сигнального пути, при этом определение основано, по меньшей мере, частично на оценке математической модели, относящейся к уровням экспрессии одного или нескольких целевых генов клеточного сигнального пути для уровня элемента TF, при этом указанная модель основана, по меньшей мере, частично на одной или нескольких линейных комбинациях уровней экспрессии одного или нескольких целевых генов, и по (ii) выводу об уровне активности клеточного сигнального пути в ткани и/или клетках и/или жидкости организма субъекта, сделанному на основании определенного уровня элемента TF в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта. Более подробно об этом описано в неопубликованной предварительной заявке на патент US 61/745839, соответствующей неопубликованной международной заявке на патент PCT/IB2013/061066 (“Оценка активности клеточного сигнального пути с применением линейной(ых) комбинации(й) экспрессии целевых генов”).

Предпочтительно, клеточные сигнальные пути содержат, по меньшей мере, один клеточный сигнальный путь, который принимает участие в развитии рака.

Особо предпочтительным является способ, в котором клеточные сигнальные пути содержат путь Wnt и/или путь HH, и где степень риска определяется таким образом, что указанный риск возникновения клинического события в течение определенного промежутка времени монотонно увеличивается с увеличением выведенной активности пути Wnt и/или увеличением выведенной активности пути HH.

Также особо предпочтительным является способ, в котором клеточные сигнальные пути содержат путь ER, где оценка риска определяется таким образом, что указанный риск возникновения клинического события в течение определенного промежутка времени монотонно уменьшается с увеличением выведенной активности пути ER.

Предпочтительным также является способ, в котором комбинация выведенных активностей содержит выражение:

-α · PER + β · max(PWnt, PHH),

где PER, PWnt и PHH означают выведенную активность пути ER, пути Wnt и пути HH, соответственно, α и β представляют собой положительные постоянные масштабирующие коэффициенты, и указанный риск возникновения клинического события в течение определенного промежутка времени монотонно увеличивается с увеличением значения экспрессии.

Особо предпочтительным является способ, в котором вывод содержит:

вывод об активности пути Wnt в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии, по меньшей мере, одного или нескольких, предпочтительно, по меньшей мере, трех целевых генов пути Wnt, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранных из группы, состоящей из: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 и FZD7,

и/или

вывод об активности пути ER в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии, по меньшей мере, одного или нескольких, предпочтительно, по меньшей мере, трех целевых генов пути ER, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранных из группы, состоящей из: GREB1, PGR, XBP1, CA12, SOD1, CTSD, IGFBP4, TFF1, SGK3, NRIP1, CELSR2, WISP2 и AP1B1,

и/или

вывод об активности пути HH в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии, по меньшей мере, одного или нескольких, предпочтительно, по меньшей мере, трех целевых генов пути HH, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранных из группы, состоящей из: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN и CTSL1,

и/или

вывод об активности пути AR в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии, по меньшей мере, одного или нескольких, предпочтительно, по меньшей мере, трех целевых генов пути AR, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранных из группы, состоящей из: KLK2, PMEPA1, TMPRSS2, NKX3_1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR и EAF2.

Особо предпочтительным является способ, в котором вывод дополнительно основан на:

уровнях экспрессии, по меньшей мере, одного целевого гена пути Wnt, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранного из группы, состоящей из: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A и LECT2,

и/или

уровнях экспрессии, по меньшей мере, одного целевого гена пути ER, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранного из группы, состоящей из: RARA, MYC, DSCAM, EBAG9, COX7A2L, ERBB2, PISD, KRT19, HSPB1, TRIM25, PTMA, COL18A1, CDH26, NDUFV3, PRDM15, ATP5J и ESR1,

и/или

уровнях экспрессии, по меньшей мере, одного целевого гена пути HH, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранного из группы, состоящей из: BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 и TOM1,

и/или

уровнях экспрессии, по меньшей мере, одного целевого гена пути AR, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранного из группы, состоящей из: APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 и TACC2.

Другой аспект настоящего изобретения относится к способу (описанному в настоящей заявке), дополнительно содержащему:

отнесение субъекта к, по меньшей мере, одной из множества групп риска, связанных с разными указанными рисками возникновения клинического события в течение определенного промежутка времени,

и/или

принятие решения о лечении, рекомендуемом для субъекта, на основе, по меньшей мере, частично, указанного риска возникновения клинического события в течение определенного промежутка времени.

Настоящее изобретение также относится к способу (описанному в настоящей заявке), содержащему:

вывод об активности пути Wnt в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии двух, трех или более целевых генов из набора целевых генов пути Wnt, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта,

и/или

вывод об активности пути ER в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии двух, трех или более целевых генов из набора целевых генов пути ER, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта,

и/или

вывод об активности пути HH в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии двух, трех или более целевых генов из набора целевых генов пути HH, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта,

и/или

вывод об активности пути AR в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии двух, трех или более целевых генов из набора целевых генов пути AR, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта.

Предпочтительно,

набор целевых генов пути Wnt включает, по меньшей мере, девять, предпочтительно, все целевые гены, выбранные из группы, состоящей из: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 и FZD7,

и/или

набор целевых генов пути ER включает, по меньшей мере, девять, предпочтительно, все целевые гены, выбранные из группы, состоящей из: GREB1, PGR, XBP1, CA12, SOD1, CTSD, IGFBP4, TFF1, SGK3, NRIP1, CELSR2, WISP2 и AP1B1,

и/или

набор целевых генов пути HH включает, по меньшей мере, девять, предпочтительно, все целевые гены, выбранные из группы, состоящей из: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN и CTSL1,

и/или

набор целевых генов пути AR включает, по меньшей мере, девять, предпочтительно, все целевые гены, выбранные из группы, состоящей из: KLK2, PMEPA1, TMPRSS2, NKX3_1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR и EAF2.

Особо предпочтительным является способ, в котором

набор целевых генов пути Wnt дополнительно включает, по меньшей мере, один целевой ген, выбранный из группы, состоящей из: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A и LECT2,

и/или

набор целевых генов пути ER дополнительно включает, по меньшей мере, один целевой ген, выбранный из группы, состоящей из: RARA, MYC, DSCAM, EBAG9, COX7A2L, ERBB2, PISD, KRT19, HSPB1, TRIM25, PTMA, COL18A1, CDH26, NDUFV3, PRDM15, ATP5J и ESR1,

и/или

набор целевых генов пути HH дополнительно включает, по меньшей мере, один целевой ген, выбранный из группы, состоящей из: BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 и TOM1,

и/или

набор целевых генов пути AR дополнительно включает, по меньшей мере, один целевой ген, выбранный из группы, состоящей из: APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 и TACC2.

Образец(образцы), предназначенные для использования согласно настоящему изобретению, могут представлять собой, например, образец, полученный из пораженного раком участка, или из очага поражения с подозрением на злокачественную опухоль, или из метастатической опухоли, или из полости тела, в которой присутствует жидкость, загрязненная раковыми клетками (например, плевральная или брюшная полость или полость мочевого пузыря), или из других жидкостей организма, содержащих раковые клетки, и т.д., предпочтительно методом биопсии или другим способом извлечения образца. Клетки, из которых был извлечен образец, также могут быть опухолевыми клетками гематологических злокачественных опухолей (таких как лейкемия или лимфома). В некоторых случаях образец клеток также может представлять собой циркулирующие опухолевые клетки, т.е., опухолевые клетки, которые могут попадать в кровоток и могут быть извлечены с помощью подходящего способа выделения, например, с помощью афереза или обычного забора крови из вены. Помимо крови, жидкость организма, из которой извлекают образец, может представлять собой мочу, содержимое желудочно-кишечного тракта или экссудат. Термин “извлеченный образец”, используемый в настоящем документе, также включает случаи, когда ткань и/или клетки и/или жидкость организма субъекта получают от субъекта и, например, помещают на предметное стекло микроскопа, и когда для выполнения заявленного способа извлекают часть образца, например с помощью лазерной захватывающей микродиссекции (LCM), или путем соскабливания представляющих интерес клеток с предметного стекла, или способами сортировки флуоресцентно-активированных клеток.

Еще более предпочтительным является способ, который дополнительно содержит объединение степени риска и/или, по меньшей мере, одной выведенной активности с одной иди несколькими дополнительными степенями риска, полученными из одного или нескольких дополнительных прогностических тестов для получения объединенной степени риска, где объединенная степень риска указывает на риск возникновения клинического события в течение определенного промежутка времени. Один или несколько дополнительных прогностических тестов могут содержать, в частности, тест Oncotype DX® для рака молочной железы, тест Mammostrat® для рака молочной железы, тест MammaPrint® для рака молочной железы, тест BluePrint™ для рака молочной железы, тест CompanDx® для рака молочной железы, тест IndexSM (HOXB13/IL17BR) для рака молочной железы, тест OncotypeDX® для рака толстой кишки и/или пролиферативный тест, выполняемый для измерения экспрессии гена/белка Ki67.

Предпочтительно, клиническое событие представляет собой рак, в частности, рак молочной железы. Риск возникновения клинического события в течение определенного промежутка времени представляет собой, таким образом, предпочтительно риск повторного появления, т.е. риск рецидива рака после лечения. Он может быть либо локальным (т.е., на том же месте, где была первоначальная опухоль), либо удаленным (т.е., метастаз, находящийся за пределами первоначальной опухоли). Альтернативно, риск может представлять собой риск прогрессирования заболевания или смерть.

Согласно другому раскрытому аспекту, устройство содержит цифровой процессор, выполненный с возможностью осуществления способа по изобретению, описанному в данном документе.

Согласно другому раскрытому аспекту, не меняющаяся во времени запоминающая среда хранит инструкции, которые исполняются цифровым процессорным устройством для осуществления способа по изобретению, описанному в настоящей заявке. Не меняющаяся во времени запоминающая среда может представлять собой читаемую компьютером запоминающую среду, такую как жесткий диск, или другую магнитную запоминающую среду, оптический диск, или другую оптическую запоминающую среду, запоминающее устройство с произвольным доступом (RAM), постоянное запоминающее устройство (ROM), флэш-память, или другую электронную запоминающую среду, сетевой сервер и т.д. Цифровое процессорное устройство может представлять собой мобильное устройство (например, персональный электронный помощник или смартфон), ноутбук, настольный компьютер, планшетный компьютер или устройство, удаленный сетевой сервер и т.д.

Согласно другому раскрытому аспекту, компьютерная программа содержит средство программных кодов для обеспечения осуществления цифровым процессорным устройством способа по изобретению, как описано в настоящей заявке. Цифровое процессорное устройство может представлять собой мобильное устройство (например, персональный электронный помощник или смартфон), ноутбук, настольный компьютер, планшетный компьютер или устройство, удаленный сетевой сервер и т.д.

Согласно другому раскрытому аспекту, сигнал представляет собой степень риска возникновения клинического события в течение определенного промежутка времени, где оценка риска является результатом выполнения способа по изобретению, описанного в настоящей заявке. Сигнал может представлять собой аналоговый сигнал или цифровой сигнал.

Одно из преимуществ заключается в системе подтверждения принятия клинического решения (CDS), которая выполнена с возможностью предоставления клинических рекомендаций, например, путем вынесения решения относительно лечения субъекта, принятого на основании анализа двух или нескольких клеточных сигнальных путей, например, с применением прогностической или другой математической модели пути Wnt, пути ER, пути AR и/или пути HH, в частности, на основании риска возникновения клинического события, например, рака, в частности рака молочной железы, в течение определенного промежутка времени, в виде указанной степени риска, которая основана, по меньшей мере, частично, на комбинации выведенной активности клеточных сигнальных путей.

Другое преимущество заключается в CDS системе, которая сконфигурирована с возможностью отнесения субъекта к, по меньшей мере, одной из множества групп риска, связанных с различными рисками возникновения клинического события, например, рака, в частности, рака молочной железы, в течение определенного промежутка времени, в виде указанной степени риска, которая основана, по меньшей мере, частично, на комбинации выведенной активности одного или нескольких клеточных сигнальных путей.

Другое преимущество заключается в комбинировании степени риска возникновения клинического события в течение определенного промежутка времени, который основан, по меньшей мере, частично, на комбинации выведенных активностей одного или нескольких клеточных сигнальных путей, с одной или несколькими дополнительными степенями риска, полученными из одного или нескольких прогностических тестов.

Настоящее изобретение также может применяться, например, совместно с

- прогностической диагностикой, частично основанной на комбинации выведенной активности одного или нескольких клеточных сигнальных путей,

- предсказанием эффективности лекарственного средства, например, химиотерапии и/или гормональной терапии, частично основанном на комбинации выведенной активности одного или нескольких клеточных сигнальных путей,

- мониторингом эффективности лекарственного средства, частично основанном на комбинации выведенной активности одного или нескольких клеточных сигнальных путей,

- разработкой лекарственного средства, частично основанной на комбинации выведенной активности одного или нескольких клеточных сигнальных путей,

- разработкой способа анализа, частично основанного на комбинации выведенной активности одного или нескольких клеточных сигнальных путей,

- определением стадии рака, частично основанным на комбинации выведенной активности одного или нескольких клеточных сигнальных путей.

Дополнительные преимущества станут очевидными специалисту в области техники после ознакомления и изучения прилагаемых чертежей, приведенного ниже описания и, в частности, изучения подробного описания примеров представленных ниже.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

На Фиг.1 показана гистограмма MPS, вычисленная согласно уравнению (7), где α=1 и β=1, для группы пациентов с разной тяжестью рака молочной железы (n=1294) из GSE6532, GSE9195, GSE20685, GSE20685, GSE21653 и E-MTAB-365.

На Фиг.2 приведен график Каплана-Мейера безрецидивной выживаемости ER положительных пациентов, которым была проведена операция и которые прошли гормональное лечение, опубликованное в GSE6532 и GSE9195. Разделение пациентов по группам осуществляли на основании выделения групп с высоким риском в соответствии с MPS, степени возникновения рецидива (RS) Oncotype DX®, и выделения групп с высоким риском для обоих степеней (MPS & RS).

На Фиг.3 приведен график Каплана-Мейера безрецидивной выживаемости пациентов с первичным раком молочной железы, как указано в E-MTAB-365. Разделение пациентов по группам осуществляли, используя алгоритм выделения групп риска, основанный на степени, полученной для множества путей, согласно тому как описано в настоящей заявке. Значение р вычисляли между группами пациентов с низкой степенью риска и высокой степенью риска, используя логарифмический ранговый критерий.

На Фиг.4 приведен график Каплана-Мейера безрецидивной выживаемости группы пациентов с разной тяжестью рака молочной железы, как описано в GSE20685. Разделение пациентов по группам осуществляли, используя алгоритм выделения групп риска, основанный на степени, полученной для множества путей, согласно тому, как описано в настоящей заявке. Указанное значение p вычисляли между группами пациентов с низкой степенью риска и высокой степенью риска, используя логарифмический ранговый критерий.

На Фиг.5 приведен график Каплана-Мейера безрецидивной выживаемости группы пациентов, имеющих раннюю стадию рака молочной железы, как опубликовано в GSE21653. Разделение пациентов по группам осуществляли, используя алгоритм выделения групп риска, основанный на степени, полученной для множества путей, согласно тому, как описано в настоящей заявке. Указанное значение р вычисляли между группами пациентов с низкой степенью риска и высокой степенью риска, используя логарифмический ранговый критерий.

На Фиг.6 приведена диаграмма, демонстрирующая систему подтверждения принятия клинического решения (CDS), сконфигурированную с возможностью определения степени риска возникновения клинического события в течение определенного промежутка времени, как описано в настоящей заявке.

На Фиг.7 показан график, демонстрирующий результаты экспериментов, содержащие две степени риска, определенные разными способами.

ПОДРОБНОЕ ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

Приведенные ниже примеры иллюстрируют особенно предпочтительные способы и выбранные аспекты, связанные с этими способами. Приведенные в настоящей заявке сведения можно использовать для разработки нескольких тестов и/или наборов. Приведенные ниже примеры не следует рассматривать как ограничивающие объем настоящего изобретения.

Пример 1. Вывод об активности двух или более клеточных сигнальных путей

Как подробно описано в опубликованной Европейской заявке на патент ЕР5493992 A1 ("Оценка активности пути WNT с применением вероятностного моделирования экспрессии целевых генов") и, в частности, в опубликованной международной заявке на патент WO 2013/011479 A2 ("Оценка активности клеточных сигнальных путей с применением вероятностного моделирования экспрессии целевых генов"), путем создания вероятностной модели (например, байесовской модели) и включения условных вероятностных отношений между уровнями экспрессии нескольких разных целевых генов и активностью клеточного сигнального пути, такая модель может быть использована для определения активности клеточного сигнального пути с высокой степенью точности. Кроме того, эту вероятностную модель можно легко обновлять для включения дополнительных данных, полученных в более поздних клинических исследованиях, путем корректировки условных вероятностей и/или добавления в модель новых узлов для отображения дополнительных источников информации. Таким образом, вероятностную модель можно обновлять, по мере необходимости, позволяя учитывать самые последние данные, полученные в области медицины.

Целевые гены соответствующих путей предпочтительно можно выбрать, используя способы, описанные в разделах "Пример 3: Выбор целевых генов" и "Пример 4: Сравнение списка отобранных свидетельств с широким списком, полученным на основании литературных источников" в заявке на патент WO 2013/011479 A2, а обучение вероятностной модели можно осуществлять, используя способы, описанные в разделе “Пример 5: Обучение и применение Байесовской сети” в заявке на патент WO 2013/011479 A2. Соответствующий выбор целевого(ых) гена(ов), который используется для определения активности приведенных в качестве примера пути Wnt, пути ER, пути AR и/или пути AR определен в прилагаемой формуле изобретения.

В другом подходе, который является легким для понимания и интерпретации и который подробно описан в неопубликованной предварительной заявке на патент US 61/745839, соответствующей неопубликованной международной заявке на патент РСТ/IB2013/061066 ("Оценка активности клеточных сигнальных путей с применением линейной(ых) комбинации(ий) экспрессии целевых генов"), активность определенного клеточного сигнального пути определяют путем построения математической модели (например, линейной или (псевдо)линейной модели), включающей отношения между уровнями экспрессии одного или более целевых генов клеточного сигнального пути и уровнем элемента фактора транскрипции (TF), TF элемента, контролирующего транскрипцию одного или более целевых генов клеточного сигнального пути, причем эта модель основана, по меньшей мере, частично, на одной или более линейных комбинациях уровней экспрессии одного или более целевых генов.

Что касается последнего подхода, предпочтительным может оказаться измерение уровней экспрессии одного или более целевых генов по уровням мРНК, которые можно получить в результате, например, анализа ПЦР в реальном времени или анализа микрочипов с использованием проб, связанных с мРНК последовательностями целевого(ых) гена(ов), и метода секвенирования РНК. В другом варианте осуществления уровни экспрессии одного или более целевых генов могут быть измерены по уровням белка, например, концентрации белков, кодируемых целевыми генами.

Указанные уровни экспрессии необязательно подвергают преобразованию тем или иным способом, который может, или может не, быть более подходящим для данного приложения. Например, четыре разных преобразования уровней экспрессии, например, уровней мРНК, полученных в результате анализа микрочипов, могут быть следующими:

- "непрерывные данные", т.е., уровни экспрессии, полученные после предварительной обработки микрочипов, с помощью хорошо известных алгоритмов, таких как MAS5.0 и fRMA,

- "Z-критерий" ("z-score"), т.е. непрерывные уровни экспрессии масштабируются таким образом, что среднее значение по всем образцам равно 0, а стандартное отклонение равно 1,

- "дискретное", т.е., уровни экспрессии, превышающие определенный порог, устанавливаются равными 1, а уровни экспрессии, которые ниже этого порога, устанавливаются равными 0 (например, порог для набора проб может быть выбран в виде медианы значений некоторого количества положительных и такого же количества отрицательных клинических образцов),

- "нечеткие", то есть, непрерывные уровни экспрессии преобразуются в значения от 0 до 1 с помощью сигмовидной функции следующего формата: 1/(1+exp((thr-expr)/se)), где expr представляет собой непрерывные уровни экспрессии, thr представляет собой порог, как указывалось выше, и se представляет собой параметр смягчения, отвечающий за разницу между 0 и 1.

Одной из самых простых моделей, которые могут быть построены, является модель, в которой узел в первом слое представляет собой элемент фактора транскрипции (TF), и взвешенные узлы представляют прямые измерения уровней интенсивности экспрессии целевого(ых) гена(ов), например, с применением одного набора проб, который особенно сильно коррелирует с определенным целевым геном, например, в экспериментах с использованием микрочипов или количественной ПЦР, во втором слое. Веса могут быть получены либо на основании расчетов из набора данных обучения, либо на основании экспертных знаний. Такой подход использования только одного уровня экспрессии целевого гена, в случае, когда для одного целевого гена можно измерить множество уровней экспрессии (например, в случае экспериментов с использованием микрочипов, где один целевой ген может быть измерен с помощью нескольких наборов проб), является особенно простым. Конкретным способом выбора одного уровня экспрессии, применяемого для конкретного целевого гена, является использование уровня экспрессии, полученного из набора проб, который обеспечивает наилучшее разделение активных и пассивных образцов обучающего набора данных. Одним из способов определения такого набора проб является выполнение статистического теста, например, t-теста, и выбор набора проб с низким значением р. Уровни экспрессии обучающего набора данных для пробы с самым низким значением р являются по определению пробой, которая имеет самую низкую вероятность того, что уровни экспрессии (известных) активных и пассивных образцов перекрываются. Другой метод выбора основан на отношении шансов. В такой модели, для каждого из одного или более целевых генов предусмотрен один или более уровней экспрессии, и одна или более линейных комбинаций содержат линейную комбинацию, включающую взвешенный показатель для каждого одного или более целевых генов, где каждый взвешенный показатель основан только на одном уровне экспрессии из одного или более уровней экспрессии, предусмотренных для соответствующего целевого гена. Если для одного целевого гена выбирается только один уровень экспрессии, как описано выше, модель можно назвать моделью "наибольших дискриминантных наборов проб".

В качестве альтернативы модели "наибольших дискриминантных наборов проб", в случае, когда можно измерить множество уровней экспрессии для одного целевого гена, можно использовать все уровни экспрессии, предоставленные для одного целевого гена. В такой модели, для каждого одного или нескольких целевых генов предоставляется один или несколько уровней экспрессии, и одна или несколько линейных комбинаций содержат линейную комбинацию всех уровней экспрессии одного или нескольких уровней экспрессии, предоставленных для одного или нескольких целевых генов. Другими словами, для каждого одного или нескольких целевых генов каждый один или более уровней экспрессии, предоставленных для соответствующего целевого гена, могут быть взвешены в линейной комбинации посредством его собственного (индивидуального) веса. Этот вариант можно назвать моделью "все наборы проб". Преимуществом этой модели является простота использования всех предоставленных уровней экспрессии.

Сходство двух описанных выше моделей заключается в том, что их можно рассматривать как "однослойные" модели, в которых уровень TF элемента вычисляется на основе линейной комбинации уровней экспрессии.

После определения уровня TF элемента путем оценки соответствующей модели, определенный уровень TF элемента может быть пороговым для выведенной активности клеточного сигнального пути. Способ вычисления такого соответствующего порога заключается в сравнении определенного уровня TF элемента wlc обучающих образцов, относительно которых известно, что они имеют пассивный путь, и обучающих образцов с активным путем. Способ, который позволяет это осуществить и при этом учитывает дисперсию в этих группах, осуществляется с применением порога:

где σ и μ представляют собой стандартное отклонение и среднее значение обучающих образцов. В случае доступности лишь небольшого количества образцов в активных и/или пассивных обучающих образцах к вычисленным дисперсиям может быть добавлен псевдоотсчет на основании среднего значения дисперсий двух групп:

где v представляет собой дисперсию групп, а x представляет собой положительный псевдоотсчет. Затем может быть получено стандартное отклонение σ путем извлечения квадратного корня из дисперсии v.

Пороговое значение может быть вычтено из определенного уровня FT элемента wlc для простоты интерпретации, что дает в результате оценку активности клеточного сигнального пути такую, что отрицательные значения соответствуют пассивному клеточному сигнальному пути, а положительные значения соответствуют активному клеточному сигнальному пути.

В качестве альтернативы описанным "однослойным" моделям, может быть использована "двухслойная" модель представляющая собой экспериментальное определение активной передачи сигналов в пути. Для каждого целевого гена вычисляется суммарный уровень с помощью линейной комбинации, основанной на измеренных интенсивностях связанных с ним наборами проб ("первый (нижний) слой"). Вычисленное суммарное значение впоследствии объединяют с суммарными значениями других целевых генов пути с использованием дополнительной линейной комбинации ("второй (верхний) слой"). Веса могут быть получены путем использования либо набора обучающих данных, либо экспертных знаний, либо их комбинации. Выражаясь иначе, в "двухслойной" модели для каждого из одного или более целевых генов предусмотрен один или более уровней экспрессии, и одна или более линейных комбинаций одержат для каждого одного или более целевых генов первую линейную комбинацию всех уровней экспрессии одного или более уровней экспрессии, предусмотренных для соответствующего целевого гена ("первый (нижний) слой"). Модель также основана, по меньшей мере, частично, на дополнительной линейной комбинации, включающей взвешенный показатель для каждого одного или более целевых генов, причем взвешенный показатель основан на первой линейной комбинации для соответствующего целевого гена ("второй (верхний слой").

В предпочтительном варианте "двухслойной" модели расчет суммарных значений может включать определение порога для каждого целевого гена с применением обучающих данных и путем вычитания порога из расчетной линейной комбинации, получая таким образом указанную краткую сводку по генам. Здесь порог может быть выбран таким образом, что отрицательный суммарный уровень генов будет соответствовать целевому гену с пониженной экспрессией, а положительный суммарный уровень генов будет соответствовать целевому гену с повышенной экспрессией. Кроме того, полученные для генов суммарные значения можно преобразовать с использованием, например одного из вышеуказанных преобразований (нечеткого, дискретного и т.д.) до их объединения со "вторым (верхним) слоем".

После определения уровня TF элемента путем оценки "двухслойной" модели, определенный уровень TF элемента может быть пороговым для выведенной активности клеточного сигнального пути, как указано выше.

Все описанные выше модели со ссылкой на US 61/745839, соответствующую РСТ/IB2013/061066, далее по тексту обозначены как "(псевдо-)линейные модели".

Целевые гены соответствующих путей предпочтительно можно выбрать, используя способы, описанные в разделах "Пример 2: Выбор целевых генов" и "Пример 3: Сравнение списка отобранных свидетельств с широким списком, полученным на основании литературных источников" в US 61/745839, соответствующей PCT/IB2013/061066, а обучение вероятностной модели можно осуществлять, используя способы, описанные в разделе “Пример 4: Обучение и применение Байесовской сети” в US 61/745839, соответствующей PCT/IB2013/061066. Выбор целевого(ых) гена(ов), определенного в прилагаемой формуле изобретения, также полезен для определения активности приведенных в качестве примера пути Wnt, пути ER, пути АР и/или пути AR, используя этот последний подход.

Далее, приводится краткий обзор выбора целевых генов соответствующих путей согласно способам, описанным в разделах “Пример 2: Выбор целевых генов” и "Пример 3: Сравнение списка отобранных свидетельств с широким списком, полученным на основании литературных источников" в US 61/745839, соответствующей PCT/IB2013/061066, и обучения вероятностной модели согласно способам, описанным в разделе “Пример 4: Обучение и применение Байесовской сети” в US 61/745839, соответствующей PCT/IB2013/061066.

Выбор целевых генов согласно примеру 2US 61/745839, соответствующей PCT/IB2013/061066

Фактор транскрипции (TF) представляет собой белковый комплекс (то есть, сочетание белков, связанных вместе в определенной структуре) или белок, который способен регулировать транскрипцию целевых генов путем связывания со специфическими ДНК-последовательностями, тем самым контролируя транскрипцию генетической информации из ДНК в РНК. мРНК получают непосредственно за счет этого действия транскрипционного комплекса, обозначенного в настоящем описании "непосредственно вовлеченным целевым геном". Пути активации также могут привести ко вторичной транскрипции генов, обозначенных "опосредованно вовлеченными целевыми генами". В дальнейшем, предпочтительными являются (псевдо)линейные модели, содержащие или состоящие из непосредственно вовлеченных целевых генов, в виде прямых связей между активностью пути и уровнем мРНК, однако различие между непосредственно и опосредованно вовлеченными целевыми генами не всегда очевидно. В данном документе представлен способ выбора непосредственно вовлеченных целевых генов с помощью функции оценки, основанной на имеющихся литературных данных. Тем не менее, случайный выбор опосредованно вовлеченных целевых генов не может быть исключен из-за ограниченной информации и биологических вариаций и неопределенностей.

Конкретные целевые гены мРНК пути отбирали из научной литературы, используя систему ранжирования, в которой научному свидетельству, описанному для конкретного целевого гена, присваивали рейтинг, в зависимости от типа научных экспериментов, в которых было получено данное свидетельство. Хотя некоторое экспериментальное свидетельство является простым предположением о гене, являющемся целевым геном, как, например, увеличение мРНК на микрочипе эмбриона, для которого, как известно, путь HH является активным, другое свидетельство может быть очень весомым, как, например, комбинация идентифицированного сайта связывания фактора транскрипции пути и нахождение этого сайта в анализе иммунопреципитации хроматина (ChIP) после стимуляции конкретного пути в клетке и увеличения мРНК после конкретной стимуляции пути в клеточной линии.

В научной литературе можно идентифицировать несколько типов экспериментов для нахождения конкретных целевых генов пути, например, (без ограничения):

1. ChIP эксперименты, в которых показано прямое связывание фактора транскрипции пути с его сайтом связывания на геноме. Пример: В результате использования метода иммунопреципитации хроматина (ChIP) были определены предполагаемые функциональные сайты связывания фактора транскрипции TCF4 в ДНК клеточных линий толстой кишки с и без активного пути Wnt в виде подмножества сайтов связывания, распознанных исключительно, основываясь на нуклеотидной последовательности. Предполагаемая функциональность была идентифицирована как ChIP-полученное свидетельство того, что фактор транскрипции, как было найдено, связывается с ДНК-связывающим сайтом.

2. Анализ сдвига электрофоретической подвижности (EMSA), который показал in vitro связывание фактора транскрипции с фрагментом ДНК, содержащим определенную последовательность связывания. По сравнению с основанным на ChIP свидетельством, свидетельство, основанное на EMSA, является менее сильным, поскольку оно не может быть переведено в in vivo ситуацию.

3. Стимуляция пути и измерение профилей мРНК на микрочипе или при помощи РНК секвенирования, используя клеточные линии с индуцируемыми путями, и измерение профилей мРНК, измеренных в нескольких временных точках после индукции, в присутствии циклогексимида, который ингибирует трансляцию в белок, при этом предполагается, что таким образом индуцированные мРНК являются прямыми целевыми генами.

4. Аналогично 3, но с применением количественной ПЦР для измерения количества мРНК.

5. Идентификация сайтов связывания фактора транскрипции в геноме с помощью подхода биоинформатики. Примеры пути Wnt: Используя ДНК-связывающие последовательности фактора транскрипции Tcf4-бета катенина, была запущена компьютерная программа на последовательность генома человека, и были определены потенциальные сайты связывания как в промоторных областях генов, так и в других геномных областях.

6. Аналогично 3 только в отсутствие циклогексимида.

7. Аналогично 4 только в отсутствие циклогексимида.

8. Создание профиля экспрессии мРНК для образцов конкретных тканей или клеток, для которых известно, что путь является активным, однако в отсутствие условия надлежащего отрицательного контроля.

В простейшем случае можно присвоить 1 балл каждой потенциальной целевой мРНК для каждого из этих экспериментальных подходов, в которых была идентифицирована указанная целевая мРНК.

В качестве альтернативы, баллы могут присваиваться инкрементно, т.е. один способ дает один балл, второй способ добавляет второй балл и т.д. Используя такую относительную стратегию ранжирования, можно составить список наиболее надежных целевых генов.

Кроме того, ранжирование может быть использовано иным способом для идентификации целевых генов, которые вероятнее всего представляют собой непосредственно вовлеченные целевые гены, путем присваивания самого высокого балла способу, который обеспечивает наилучшее свидетельство для in vivo непосредственно вовлеченного целевого гена, в приведенном выше списке это будет означать 8 баллов для экспериментального подхода 1), 7 для 2), и далее по убыванию до одного балла для экспериментального подхода 8). Такой список можно назвать "общим списком целевых генов".

Несмотря на биологические вариации и неопределенности, изобретатели предположили, что непосредственно вовлеченные целевые гены вероятнее всего будут индуцированы не зависящим от типа ткани способом. Список этих целевых генов можно назвать "отобранным на основании свидетельств списком целевых генов". Этот отобранный целевой список использовали для построения вычислительных моделей, которые могут быть применены к образцам, полученным из разных тканей и/или источников клеток.

"Общий список целевых генов" может содержать гены, которые более специфичны для той или иной ткани, и может быть потенциально использован для оптимизации и повышения чувствительности и специфичности модели для применения к образцам, полученным из конкретной ткани, таким как образцы рака молочной железы.

Ниже приведен пример того, как для пути ER был произведен выбор отобранного на основе свидетельств списка целевых генов.

Для выбора целевых генов ER, используемых в качестве входных данных для описанных здесь (псевдо-)линейных моделей, были использованы следующие три критерия:

1. Промоторная/энхансерная область гена содержит мотив элемента ответа на эстроген (ERE):

а. Должно быть показано, что мотив ERE является чувствительным к эстрогену, например, с помощью анализа временной трансфекции, в котором специфический ERE мотив связан с геном-репортером, и

b. наличие мотива ERE должно быть подтверждено, например, с помощью анализа обогащенного мотива промоторной/энхансерной области гена.

2. ER (дифференциально) связывается in vivo с изучаемой промоторной/энхансерной областью гена, продемонстрированной, например, в ChIP/CHIP эксперименте или анализе иммунопреципитации хроматина:

a. доказано, что ER связывается с промоторной/энхансерной областью гена, когда путь ER является активным, и

b. (предпочтительно) не связывается (или слабо связывается) с промоторной/энхансерной областью гена, когда путь ER является неактивным.

3. Осуществляется дифференциальная транскрипция гена, когда путь ER является активным, что продемонстрировано, например,

a. кратным обогащением мРНК исследуемого гена методом ПЦР в реальном времени или в экспериментах с микрочипами, или

b. демонстрацией с помощью анализа иммунопреципитации того, что РНК Pol II связывается с промоторной областью гена.

Выбор был сделан путем определения в качестве целевых генов ER таких генов, для которых было собрано достаточное количество хорошо задокументированных экспериментальных свидетельств о том, что выполнены все три упомянутые выше критерии. Подходящим экспериментом для сбора сведений о дифференциальном связывании ER является сравнение результатов, например, ChIP/CHIP эксперимента в клеточной линии рака, которая является чувствительной к эстрогену (например, клеточной линии MCF-7) при воздействии или без воздействия на нее эстрогена. То же самое относится к сбору сведений о транскрипции мРНК.

Вышеизложенное представляет собой обсуждение общего подхода и более конкретного примера процедуры выбора целевых генов, которая был использована для выбора нескольких целевых генов на основании из свидетельств, найденных с помощью указанного выше подхода. Списки целевых генов, используемых в (псевдо-)линейных моделях для приведенных в качестве примера путей, а именно путей Wnt, ER, HH и AR, показаны в таблице 1, таблице 2, таблице 3 и таблице 4, соответственно.

Целевые гены пути ER, использованные для описанных здесь (псевдо-)линейных моделей пути ER (показаны в таблице 2), содержат выбор целевых генов, исходя из их оценки, сделанной на основании описанных в литературе свидетельств; в этот короткий список были добавлены только целевые гены с наибольшими доказательственными баллами (предпочтительные целевые гены по изобретению). Полный список целевых генов ER, в том числе указанных генов с наибольшими доказательственными баллами, показан в таблице 5.

Дополнительный этап выбора или ранжирования целевых генов путей Wnt, ER, HH и AR, показанный в таблице 1, таблице 2, таблице 3 и таблице 4, выполняли путем комбинации полученного из литературы доказательственного балла с отношениями шансов, вычисленных с применением наборов обучающих данных, связывающих узлы набора данных с соответствующими узлами целевых генов. Отношения шансов вычисляли, используя значение отсечки, например медиану всех обучающих образцов, если используется одинаковое количество активных и пассивных обучающих образцов; каждое значение, превышающее значение отсечки, объявляется высоким, а значение, которое ниже значения отсечки, объявляется низким. Это делается для обучающих образцов, для которых известно, что путь является активным или пассивным. Затем для конкретного целевого гена или набора проб можно рассчитано отношение шансов следующим образом:

f(активный, низкий) = n(активный, низкий)/(n(активный, низкий) + n(активный, высокий)) (3)

f(пассивный, низкий) = n(пассивный, низкий)/(n(пассивный, низкий) + n(пассивный, высокий))

Отношение шансов = f(пассивный, низкий)/(1 - f(пассивный, низкий)) * (1 - f(активный, низкий))/f(активный, низкий),

где n(активный, низкий) представляет собой количество обучающих выборок, для которых известно, что они имеют активный путь и которые, как было найдено, имеют уровень экспрессии ниже значения отсечки, n(пассивный, низкий) представляет собой количество обучающих выборок, для которых известно, что они имеют пассивный путь и которые, как было найдено, имеют уровень экспрессии ниже значения отсечки, и так далее; f(активный, низкий) и f(пассивный, низкий) представляет собой долю образцов, относительно которых известно, что они имеют активный или пассивный путь, соответственно, и для которых было найдено, чтобы они имеют уровень экспрессии ниже значения отсечки.

Альтернативно, чтобы избежать неопределенных отношений шансов (деление на ноль), можно добавить, например, псевдоотсчет для расчета указанной доли, например:

f(активный, низкий)псевдо = (n(активный, низкий) + 1)/(n(активный, низкий) + n(активный, высокий) + 2) (4)

f(пассивный, низкий)псевдо = (n(пассивный, низкий) + 1)/(n(пассивный, низкий) + n(пассивный, высокий) + 2)

Альтернативно, можно также заменить абсолютное количество образцов с доказательной активностью, предполагая некоторую неопределенность (шум) в настройках измерения, и вычислить для каждого обучающего образца вероятность значения "низкий" или "высокий", предполагая, например, нормальное распределение (так называемое "мягкое свидетельство"). Затем можно вычислить доли, следуя описанным выше вычислениям.

f(активный, низкий)мягкий = (Σp(активный, низкий) + 1)/( Σp(активный, низкий) + Σp(активный, высокий) + 2) (5)

f(пассивный, низкий)мягкий = (Σp(пассивный, низкий) + 1)/( Σp(пассивный, низкий) + Σp(пассивный, высокий) + 2),

где р(активный, низкий) и р(пассивный, низкий) представляют собой для каждого образца вероятность того, что он находится ниже значения отсечки, исходя из предположения о наличии стандартного распределения со средним значением, равным измеренному уровню экспрессии соответствующего обучающего образца, и стандартным отклонением, равным оценке неопределенности, связанной с измерением уровня экспрессии, например, 0,25 по шкале log2. Эти вероятности суммируются по всем образцам и затем добавляется псевдоотсчет.

Отношение шансов представляет собой оценку важности целевого гена, позволяющей сделать вывод об активности путей. В общем случае, можно ожидать, что уровень экспрессии целевого гена с более высоким отношением шансов, вероятно, будет более информативным относительно общей активности пути по сравнению с целевыми генами с более низкими отношениями шансов. Однако из-за сложности клеточных сигнальных путей следует понимать, что между целевыми генами могут существовать более сложные взаимосвязи, и активность пути, например, с учетом уровней экспрессии различных комбинаций целевых генов с низкими отношениями шансов, может быть более доказательной, чем с учетом отдельно взятых целевых генов с более высокими отношениями шансов. В описанном здесь моделировании Wnt, ER, HH и АР было найдено, что целевые гены, показанные в таблице 6, таблица 7, таблице 8 и таблице 9, имеют более высокую доказательную силу для предсказания активности путей Wnt, Er, HH и Аr по сравнению с целевыми генами с более низким рейтингом (таким образом, целевые гены, приведенные в таблицах 6-9 являются особенно предпочтительными согласно настоящему изобретению). Тем не менее, учитывая относительную легкость получения уровней экспрессии для больших наборов генов с помощью методов сбора данных, таких как микрочипы,, предполагается использовать некоторые или все целевые гены, приведенные в таблице 6, таблица 7, таблице 8 и таблице 9 и необязательно дополнительно использовать один, два, несколько или все дополнительные целевые гены рангов, показанных в таблице 1, таблице 2, таблице 3 и таблице 4, в описанных (псевдо-)линейных моделях.

Таблица 1
Отобранный на основании свидетельств список целевых генов пути Wnt, использованный в (псевдо-)линейных моделях, и соответствующих наборов проб, использованных для измерения уровня экспрессии мРНК целевых генов
Целевой ген Набор проб Целевой ген Набор проб
ADRA2C 206128_at HNF1A 210515_at
ASCL2 207607_at 216930_at
229215_at IL8 202859_x_at
AXIN2 222695_s_at 211506_s_at
222696_at KIAA1199 1554685_a_at
224176_s_at 212942_s_at
224498_x_at KLF6 1555832_s_at
BMP7 209590_at 208960_s_at
209591_s_at 208961_s_at
211259_s_at 211610_at
211260_at 224606_at
CCND1 208711_s_at LECT2 207409_at
208712_at LEF1 210948_s_at
214019_at 221557_s_at
CD44 1557905_s_at 221558_s_at
1565868_at LGR5 210393_at
204489_s_at 213880_at
204490_s_at MYC 202431_s_at
209835_x_at 244089_at
210916_s_at NKD1 1553115_at
212014_x_at 229481_at
212063_at 232203_at
216056_at OAT 201599_at
217523_at PPARG 208510_s_at
229221_at REG1B 205886_at
234411_x_at RNF43 218704_at
234418_x_at SLC1A2 1558009_at
COL18A1 209081_s_at 1558010_s_at
209082_s_at 208389_s_at
DEFA6 207814_at 225491_at
DKK1 204602_at SOX9 202935_s_at
EPHB2 209588_at 202936_s_at
209589_s_at SP5 235845_at
210651_s_at TBX3 219682_s_at
211165_x_at 222917_s_at
EPHB3 1438_at 225544_at
204600_at 229576_s_at
FAT1 201579_at TCF7L2 212759_s_at
FZD7 203705_s_at 212761_at
203706_s_at 212762_s_at
GLUL 200648_s_at 216035_x_at
215001_s_at 216037_x_at
217202_s_at 216511_s_at
217203_at 236094_at
242281_at TDGF1 206286_s_at
ZNRF3 226360_at

Таблица 2
Отобранный на основании свидетельств список целевых генов пути ER, использованный в (псевдо-)линейных моделях, и соответствующих наборов проб, использованных для измерения уровня экспрессии мРНК целевых генов. “Наибольшие дискриминантные наборы проб” подчеркнуты
Целевой ген Набор проб Целевой ген Набор проб
AP1B1 205423_at RARA 1565358_at
ATP5J 202325_s_at 203749_s_at
COL18A1 209081_s_at 203750_s_at
209082_s_at 211605_s_at
COX7A2L 201256_at 216300_x_at
CTSD 200766_at SOD1 200642_at
DSCAM 211484_s_at TFF1 205009_at
237268_at TRIM25 206911_at
240218_at 224806_at
EBAG9 204274_at XBP1 200670_at
204278_s_at 242021_at
ESR1 205225_at GREB1 205862_at
211233_x_at 210562_at
211234_x_at 210855_at
211235_s_at IGFBP4 201508_at
211627_x_at MYC 202431_s_at
215551_at 244089_at
215552_s_at SGK3 227627_at
217163_at 220038_at
217190_x_at WISP2 205792_at
207672_at ERBB2 210930_s_at
HSPB1 201841_s_at 216836_s_at
KRT19 201650_at 234354_x_at
228491_at CA12 203963_at
NDUFV3 226209_at 204508_s_at
226616_s_at 204509_at
NRIP1 202599_s_at 210735_s_at
202600_s_at 214164_x_at
PGR 208305_at 215867_x_at
228554_at 241230_at
PISD 202392_s_at CDH26 232306_at
PRDM15 230553_at 233391_at
230777_s_at 233662_at
231931_at 233663_s_at
234524_at CELSR2 204029_at
236061_at 36499_at
PTMA 200772_x_at
200773_x_at
208549_x_at
211921_x_at

Таблица 3
Отобранный на основании свидетельств список целевых генов пути HH, использованный в (псевдо-)линейных моделях, и соответствующих наборов проб, использованных для измерения уровня экспрессии мРНК целевых генов
Целевой ген Набор проб Целевой ген Набор проб
GLI1 206646_at CTSL1 202087_s_at
PTCH1 1555520_at TCEA2 203919_at
208522_s_at 238173_at
209815_at 241428_x_at
209816_at MYLK 1563466_at
238754_at 1568770_at
PTCH2 221292_at 1569956_at
HHIP 1556037_s_at 202555_s_at
223775_at 224823_at
230135_at FYN 1559101_at
237466_s_at 210105_s_at
SPP1 1568574_x_at 212486_s_at
209875_s_at 216033_s_at
TSC22D1 215111_s_at PITRM1 205273_s_at
235315_at 239378_at
243133_at CFLAR 208485_x_at
239123_at 209508_x_at
CCND2 200951_s_at 209939_x_at
200952_s_at 210563_x_at
200953_s_at 210564_x_at
231259_s_at 211316_x_at
H19 224646_x_at 211317_s_at
224997_x_at 211862_x_at
IGFBP6 203851_at 214486_x_at
TOM1 202807_s_at 214618_at
JUP 201015_s_at 217654_at
FOXA2 210103_s_at 235427_at
214312_at 237367_x_at
40284_at 239629_at
MYCN 209756_s_at 224261_at
209757_s_at IL1R2 205403_at
211377_x_at 211372_s_at
234376_at S100A7 205916_at
242026_at S100A9 203535_at
NKX2_2 206915_at CCND1 208711_s_at
NKX2_8 207451_at 208712_at
RAB34 1555630_a_at 214019_at
224710_at JAG2 209784_s_at
MIF 217871_s_at 32137_at
GLI3 1569342_at FOXM1 202580_x_at
205201_at FOXF1 205935_at
227376_at FOXL1 216572_at
FST 204948_s_at 243409_at
207345_at
226847_at
BCL2 203684_s_at
203685_at
207004_at
207005_s_at

Таблица 4
Отобранный на основании свидетельств список целевых генов пути AR, использованный в (псевдо-)линейных моделях, и соответствующих наборов проб, использованных для измерения уровня экспрессии мРНК целевых генов
Целевой ген Набор проб Целевой ген Набор проб
ABCC4 1554918_a_at LCP1 208885_at
1555039_a_at LRIG1 211596_s_at
203196_at 238339_x_at
APP 200602_at NDRG1 200632_s_at
211277_x_at NKX3_1 209706_at
214953_s_at 211497_x_at
AR 211110_s_at 211498_s_at
211621_at NTS 206291_at
226192_at PLAU 205479_s_at
226197_at 211668_s_at
CDKN1A 1555186_at PMEPA1 217875_s_at
202284_s_at 222449_at
CREB3L4 226455_at 222450_at
DHCR24 200862_at PPAP2A 209147_s_at
DRG1 202810_at 210946_at
EAF2 1568672_at PRKACB 202741_at
1568673_s_at 202742_s_at
219551_at 235780_at
ELL2 214446_at KLK3 204582_s_at
226099_at 204583_x_at
226982_at PTPN1 202716_at
FGF8 208449_s_at 217686_at
FKBP5 204560_at SGK1 201739_at
224840_at TACC2 1570025_at
224856_at 1570546_a_at
GUCY1A3 221942_s_at 202289_s_at
227235_at 211382_s_at
229530_at TMPRSS2 1570433_at
239580_at 205102_at
IGF1 209540_at 211689_s_at
209541_at 226553_at
209542_x_at UGT2B15 207392_x_at
211577_s_at 216687_x_at
KLK2 1555545_at
209854_s_at
209855_s_at
210339_s_at

Таблица 5
Символы генов для целевых генов ER, для которых из литературных источников было выявлено значимое свидетельство (= длинный список целевых генов ER)
Символ гена Символ гена Символ гена Символ гена
AP1B1 SOD1 MYC ENSA
COX7A2L TFF1 ABCA3 KIAA0182
CTSD TRIM25 ZNF600 BRF1
DSCAM XBP1 PDZK1 CASP8AP2
EBAG9 GREB1 LCN2 CCNH
ESR1 IGFBP4 TGFA CSDE1
HSPB1 SGK3 CHEK1 SRSF1
KRT19 WISP2 BRCA1 CYP1B1
NDUFV3 ERBB2 PKIB FOXA1
NRIP1 CA12 RET TUBA1A
PGR CELSR2 CALCR GAPDH
PISD CDH26 CARD10 SFI1
PRDM15 ATP5J LRIG1 ESR2
PTMA COL18A1 MYB MYBL2
RARA CCND1 RERG

Таблица 6
Короткий список целевых генов Wnt, полученный на основании доказательственного балла, основанного на литературных источниках, и отношении шансов
Целевой ген
KIAA1199
AXIN2
CD44
RNF43
MYC
TBX3
TDGF1
SOX9
ASCL2
IL8
SP5
ZNRF3
EPHB2
LGR5
EPHB3
KLF6
CCND1
DEFA6
FZD7

Таблица 7
Короткий список целевых генов ER, полученный на основании доказательственного балла, основанного на литературных источниках, и отношении шансов
Целевой ген
CDH26
SGK3
PGR
GREB1
CA12
XBP1
CELSR2
WISP2
DSCAM
ERBB2
CTSD
TFF1
NRIP1

Таблица 8
Короткий список целевых генов HH, полученный на основании доказательственного балла, основанного на литературных источниках, и отношении шансов
Целевой ген
GLI1
PTCH1
PTCH2
IGFBP6
SPP1
CCND2
FST
FOXL1
CFLAR
TSC22D1
RAB34
S100A9
S100A7
MYCN
FOXM1
GLI3
TCEA2
FYN
CTSL1

Таблица 9
Короткий список целевых генов AR, полученный на основании доказательственного балла, основанного на литературных источниках, и отношении шансов
Целевой ген
KLK2
PMEPA1
TMPRSS2
NKX3_1
ABCC4
KLK3
FKBP5
ELL2
UGT2B15
DHCR24
PPAP2A
NDRG1
LRIG1
CREB3L4
LCP1
GUCY1A3
AR
EAF2

Сравнение отобранного на основании свидетельств списка и широкого списка, полученного на основании литературных источников, согласно примеру 3 US 61/745839, соответствующей PCT/IB2013/061066ю

Список целевых генов Wnt, созданный на основании свидетельств из литературных источников согласно описанному в настоящем документе способу (таблица 1), сравнивали с другим списком целевых генов, который был создан согласно процедуре, не описанной выше. Альтернативный список представляет собой компиляцию генов, полученных из множества разных данных, полученных благодаря использованию различных экспериментальных подходов в изучении целевых генов Wnt, опубликованных в трех открытых источниках лабораториями, известными экспертам в области молекулярной биологии и изучения пути Wnt. Альтернативный список представляет собой комбинацию генов, указанных в таблице S3 у Hatzis др. (Hatzis Р, 2008), в тексте и Таблице S1A у de Sousa e Melo (de Sousa E Melo F, 2011) и в списке целевых генов, собранном и поддерживаемом Roel Nusse, пионером в области изучения передачи сигналов Wnt (Nusse, 2012). В результате комбинации этих трех источников был получен список из 124 генов (= широкий список, полученный на основании литературных источников, см. таблицу 10). Здесь обсуждается вопрос эффективности предсказания активности Wnt в клинических образцах с помощью алгоритма, полученного из этого альтернативного списка, а именно, выполняется ли этот прогноз с такой же или более высокой эффективностью по сравнению с моделью, построенной на основе существующего списка генов (= отобранный на основании свидетельств список, таблица 1).

Таблица 10
Альтернативный список целевых генов Wnt (= широкий список, полученный на основании литературных источников)
Целевой ген Ссылка Целевой ген Ссылка
ADH6 de Sousa e Melo et al. L1CAM Nusse
ADRA2C Hatzis et al. LBH Nusse
APCDD1 de Sousa e Melo et al. LEF1 Hatzis et al., de Sousa e Melo
et al., Nusse
ASB4 de Sousa e Melo et al. LGR5 de Sousa e Melo et al., Nusse
ASCL2 Hatzis et al., de Sousa e Melo
et al.
LOC283859 de Sousa e Melo et al.
ATOH1 Nusse MET Nusse
AXIN2 Hatzis et al., de Sousa e Melo
et al., Nusse
MMP2 Nusse
BIRC5 Nusse MMP26 Nusse
BMP4 Nusse MMP7 Nusse
BMP7 Hatzis et al. MMP9 Nusse
BTRC Nusse MRPS6 Hatzis et al.
BZRAP1 de Sousa e Melo et al. MYC Hatzis et al., Nusse
SBSPON de Sousa e Melo et al. MYCBP Nusse
CCL24 de Sousa e Melo et al. MYCN Nusse
CCND1 Nusse NANOG Nusse
CD44 Nusse NKD1 de Sousa e Melo et al.
CDH1 Nusse NOS2 Nusse
CDK6 Hatzis et al. NOTUM de Sousa e Melo et al.
CDKN2A Nusse NRCAM Nusse
CLDN1 Nusse NUAK2 Hatzis et al.
COL18A1 Hatzis et al. PDGFB Hatzis et al.
CTLA4 Nusse PFDN4 Hatzis et al.
CYP4X1 de Sousa e Melo et al. PLAUR Nusse
CYR61 Nusse POU5F1 Nusse
DEFA5 de Sousa e Melo et al. PPARD Nusse
DEFA6 de Sousa e Melo et al. PROX1 de Sousa e Melo et al.
DKK1 de Sousa e Melo et al., Nusse PTPN1 Hatzis et al.
DKK4 de Sousa e Melo et al. PTTG1 Nusse
DLL1 Nusse REG3A de Sousa e Melo et al.
DPEP1 de Sousa e Melo et al. REG4 de Sousa e Melo et al.
EDN1 Nusse RPS27 Hatzis et al.
EGFR Nusse RUNX2 Nusse
EPHB2 Hatzis et al., de Sousa e Melo
et al., Nusse
SALL4 Nusse
EPHB3 Hatzis et al., Nusse SLC1A1 de Sousa e Melo et al.
ETS2 Hatzis et al. SLC7A5 Hatzis et al.
FAT1 Hatzis et al. SNAI1 Nusse
FGF18 Nusse SNAI2 Nusse
FGF20 Nusse SNAI3 Nusse
FGF9 Nusse SIK1 Hatzis et al.
FLAD1 Hatzis et al. SOX17 Nusse
AK122582 Hatzis et al. SOX2 de Sousa e Melo et al.
FN1 Nusse SOX4 Hatzis et al.
FOSL1 Nusse SOX9 Nusse
FOXN1 Nusse SP5 Hatzis et al., de Sousa e
Melo et al.
FST Nusse SP8 Hatzis et al.
FZD2 de Sousa e Melo et al. TCF3 Nusse
FZD7 Nusse TDGF1 Hatzis et al.
GAST Nusse TIAM1 Nusse
GMDS Hatzis et al. TNFRSF19 Nusse
GREM2 Nusse TNFSF11 Nusse
HES6 Hatzis et al. TRIM29 de Sousa e Melo et al.
HNF1A Nusse TSPAN5 de Sousa e Melo et al.
ID2 Nusse TTC9 de Sousa e Melo et al.
IL22 de Sousa e Melo et al. VCAN Nusse
IL8 Nusse VEGFA Nusse
IRX3 de Sousa e Melo et al. VEGFB Nusse
IRX5 de Sousa e Melo et al. VEGFC Nusse
ISL1 Nusse WNT10A Hatzis et al.
JAG1 Nusse WNT3A Nusse
JUN Nusse ZBTB7C de Sousa e Melo et al.
KIAA1199 de Sousa e Melo et al. PATZ1 Hatzis et al.
KLF4 Hatzis et al. ZNRF3 Hatzis et al.

Следующий этап заключался в поиске наборов проб матрицы Affymetrix® GeneChip Human Genome U133 Plus 2.0, которая соответствует этим генам. Этот процесс проводили с использованием пакета Bioconductor языка программирования R и отбора вручную для определения релевантности набора проб с применением геномного браузера UCSC, аналогично описанным здесь (псевдо)линейным моделям, тем самым удаляя, например, наборы проб, расположенные на противоположных нитях или находящиеся за пределами экзона гена. Для двух из 124 генов отсутствовали наборы проб, доступные на этом микроматричном чипе и, следовательно, они не могли быть включены в (псевдо)линейную модель, это гены LOC283859 и WNT3A. Было найдено, что 287 наборов проб соответствуют оставшимся 122 генам (таблица 11).

Таблица 11
Наборы проб, связанные с целевыми генами Wnt в широком списке генов, полученном на основании литературных источников
Условное обозначение гена Набор проб Условное обозначение гена Набор проб Условное обозначение гена Набор проб
ADH6 207544_s_at FAT1 201579_at PFDN4 205360_at
214261_s_at FGF18 206987_x_at 205361_s_at
ADRA2C 206128_at 211029_x_at 205362_s_at
APCDD1 225016_at 211485_s_at PLAUR 210845_s_at
ASB4 208481_at 231382_at 211924_s_at
217228_s_at FGF20 220394_at 214866_at
217229_at FGF9 206404_at POU5F1 208286_x_at
235619_at 239178_at PPARD 208044_s_at
237720_at FLAD1 205661_s_at 210636_at
237721_s_at 212541_at 37152_at
ASCL2 207607_at AK122582 235085_at 242218_at
229215_at FN1 1558199_at PROX1 207401_at
ATOH1 221336_at 210495_x_at 228656_at
AXIN2 222695_s_at 211719_x_at PTPN1 202716_at
222696_at 212464_s_at 217686_at
224176_s_at 214701_s_at 217689_at
224498_x_at 214702_at PTTG1 203554_x_at
BIRC5 202094_at 216442_x_at REG3A 205815_at
202095_s_at FOSL1 204420_at 234280_at
210334_x_at FOXN1 207683_at REG4 1554436_a_at
BMP4 211518_s_at FST 204948_s_at 223447_at
BMP7 209590_at 207345_at RPS27 200741_s_at
209591_s_at 226847_at RUNX2 216994_s_at
211259_s_at FZD2 210220_at 221282_x_at
211260_at 238129_s_at 232231_at
BTRC 1563620_at FZD7 203705_s_at 236858_s_at
204901_at 203706_s_at 236859_at
216091_s_at GAST 208138_at SALL4 229661_at
222374_at GMDS 204875_s_at SLC1A1 206396_at
224471_s_at 214106_s_at 213664_at
BZRAP1 205839_s_at GREM2 220794_at SLC7A5 201195_s_at
SBSPON 214725_at 235504_at SNAI1 219480_at
235209_at 240509_s_at SNAI2 213139_at
235210_s_at HES6 226446_at SNAI3 1560228_at
CCL24 221463_at 228169_s_at SIK1 208078_s_at
CCND1 208711_s_at HNF1A 210515_at 232470_at
208712_at 216930_at SOX17 219993_at
214019_at ID2 201565_s_at 230943_at
CD44 1557905_s_at 201566_x_at SOX2 213721_at
204489_s_at 213931_at 213722_at
204490_s_at IL22 221165_s_at 228038_at
209835_x_at 222974_at SOX4 201416_at
210916_s_at IL8 202859_x_at 201417_at
212014_x_at 211506_s_at 201418_s_at
212063_at IRX3 229638_at 213668_s_at
217523_at IRX5 210239_at SOX9 202935_s_at
229221_at ISL1 206104_at 202936_s_at
CDH1 201130_s_at JAG1 209097_s_at SP5 235845_at
201131_s_at 209098_s_at SP8 237449_at
208834_x_at 209099_x_at 239743_at
CDK6 207143_at 216268_s_at TCF3 209151_x_at
214160_at JUN 201464_x_at 209152_s_at
224847_at 201465_s_at 209153_s_at
224848_at 201466_s_at 210776_x_at
224851_at KIAA1199 1554685_a_at 213730_x_at
231198_at 212942_s_at 213811_x_at
235287_at KLF4 220266_s_at 215260_s_at
243000_at 221841_s_at 216645_at
CDKN2A 207039_at L1CAM 204584_at TDGF1 206286_s_at
209644_x_at 204585_s_at TIAM1 206409_at
211156_at LBH 221011_s_at 213135_at
CLDN1 218182_s_at LEF1 210948_s_at TNFRSF19 223827_at
222549_at 221557_s_at 224090_s_at
COL18A1 209081_s_at 221558_s_at TNFSF11 210643_at
209082_s_at LGR5 210393_at 211153_s_at
CTLA4 221331_x_at 213880_at TRIM29 202504_at
231794_at MET 203510_at 211001_at
234362_s_at 211599_x_at 211002_s_at
236341_at 213807_x_at TSPAN5 209890_at
CYP4X1 227702_at 213816_s_at 213968_at
CYR61 201289_at MMP2 1566678_at 225387_at
210764_s_at 201069_at 225388_at
DEFA5 207529_at MMP26 220541_at TTC9 213172_at
DEFA6 207814_at MMP7 204259_at 213174_at
DKK1 204602_at MMP9 203936_s_at VCAN 204619_s_at
DKK4 206619_at MRPS6 224919_at 204620_s_at
DLL1 224215_s_at MYC 202431_s_at 211571_s_at
227938_s_at MYCBP 203359_s_at 215646_s_at
DPEP1 205983_at 203360_s_at 221731_x_at
EDN1 218995_s_at 203361_s_at VEGFA 210512_s_at
222802_at MYCN 209756_s_at 210513_s_at
EGFR 1565483_at 209757_s_at 211527_x_at
1565484_x_at 211377_x_at 212171_x_at
201983_s_at 234376_at VEGFB 203683_s_at
201984_s_at NANOG 220184_at VEGFC 209946_at
210984_x_at NKD1 1553115_at WNT10A 223709_s_at
211550_at 229481_at 229154_at
211551_at 232203_at ZBTB7C 217675_at
211607_x_at NOS2 210037_s_at ZBTB7C 227782_at
EPHB2 209588_at NOTUM 228649_at PATZ1 209431_s_at
209589_s_at NRCAM 204105_s_at 211391_s_at
210651_s_at 216959_x_at 210581_x_at
211165_x_at NUAK2 220987_s_at 209494_s_at
EPHB3 1438_at PDGFB 204200_s_at ZNRF3 226360_at
204600_at 216061_x_at
ETS2 201328_at 217112_at
201329_s_at

Затем была построена (псевдо-)линейная модель, аналогичная описанной модели "все наборы проб", используя метод "черное и белое" расчета весовых параметров согласно тому, как описано в настоящем документе. Аналогично описанию (псевдо)линейной модели Wnt, основанной на отобранном на основании свидетельств списке, веса связанные с ребрами между наборами проб и соответствующими им генами, оба отобранный на основании свидетельств список и широкий список, полученный на основании литературных источников, получали в результате обучения, используя непрерывные, обработанные при помощи fRMA данные для 32 образцов нормальной толстой кишки и 32 образцов аденомы из набора данных GSE8671 из базы данных Gene Expression Omnibus (см. http://www.ncbi.nlm.nih.gov/geo/, дата последнего обращения 13 июля 2011).

Затем обученные (псевдо-)линейные модели тестировали на различных наборах данных для того, чтобы сделать вывод об оценке активности пути Wnt.

Из тестов можно сделать заключение, что модель, созданная для широкого списка, полученного на основании литературных источников, как правило, предсказывала более экстремальные степени активности для активной (положительный уровень активности) или пассивной передачи сигналов Wnt. Кроме того, альтернативная модель предсказывала аналогичные результаты для наборов данных для рака толстой кишки (GSE20916, GSE4183, GSE15960), но которые превышали результаты для ожидаемых образцов с предсказанной активной передачей сигналов Wnt при раке молочной железы (GSE12777) и для наборов данных образцов медуллобластомы (GSE10327).

В заключение, широкий список целевых генов, полученный на основании литературных источников, позволяет практически так же хорошо предсказать активность Wnt в раке толстой кишки, с одной стороны, но, с другой стороны, дает более худшее предсказание (больше ложных срабатываний) для других видов рака. Это может быть результатом альтернативного списка целевых генов, которые слишком сильно смещены в сторону клеток толстой кишки, в частности, которые, таким образом, являются в высокой степени тканеспецифичным; de Sousa E Melo et al. и Hatzis et al. изучали в основном колоректальный рак, хотя также могут быть включены целевые гены, которые не являются специфичными для Wnt. Кроме того, целевые гены Wnt, которые не являются специфичными для прямой кишки. Кроме того, случайно включенные в эти списки целевые гены, которые не являются специфичными для Wnt, могут быть причиной более худшего предсказания активности Wnt для других видов рака. Альтернативный список может содержать более опосредованно регулируемые целевые гены, что может сделать этот список более тканеспецифичным. Исходный список подобран таким образом, чтобы он содержал целевые гены, которые, наиболее вероятно, представляют собой гены, чувствительные к Wnt во всех тканях, тем самым уменьшая тканевую специфичность.

Обучение и использование математической модели в соответствии с примером 4 US 61/745839, соответствующей РСТ/IB2013/061066.

Перед использованием (псевдо)линейных моделей, описанных здесь в качестве иллюстрации, для того, чтобы сделать вывод об активности пути в тестируемом образце, необходимо определить веса, указывающие знак и величину корреляции между узлами и порогом, чтобы назвать узел "присутствующий" или "отсутствующий". Для априорного заполнения весов и порога можно использовать экспертные знания, но обычно модели обучают, используя репрезентативный набор обучающих выборок, относительно которых предпочтительно известна реальная ситуация, например, данные экспрессии для набора проб в образцах с известным имеющимся комплексом фактора транскрипции (= активный путь) или отсутствующим комплексом фактора транскрипции (= пассивный путь). Тем не менее, получение обучающих образцов из многих различных видов рака, о которых известно, что статус активности принадлежит тому пути, который предназначен для моделирования, является плохо реализуемым на практике. В результате имеющиеся обучающие наборы состоят из ограниченного числа образцов, как правило, только одного вида рака. В этой работе описан способ определения параметров, необходимых для классификации тестовых образцов, как имеющих активный или пассивный путь.

В данной области техники известно множество обучающих алгоритмов (например, регрессия), которые учитывают топологию модели и изменяют параметры модели, в данном случае вес и порог, с тем, чтобы оптимизировать выходные данные модели, в данном случае взвешенную линейную оценку. В настоящем документе демонстрированы два иллюстративных способа, которые могут быть использованы для вычисления весов непосредственно из уровней экспрессии без необходимости оптимизации алгоритма.

Предпочтительно, обучение (псевдо-)линейных моделей путей Wnt, ER, НН и AR осуществляется с применением общедоступных данных, которые можно получить из базы данных Gene Expression Omnibus (http://www.ncbi.nlm.nih.gov/geo/, см. выше).

Первый способ, определенный здесь как способ "черное и белое", сводится к тройной системе с весовыми коэффициентами, представляющими собой элемент (-1, 0, 1). В контексте биологии, -1 и 1 соответствовали бы генам или пробам, которые имеют пониженную и повышенную активность пути, соответственно. Если в отношении пробы или гена не может быть статистически показано, какую он имеет активность, пониженную или повышенную, ему присваивается вес, равный 0. В данном случае использован левосторонний и правосторонний, t-критерий с двумя образцами для уровней экспрессии образцов с активным путем относительно уровней экспрессии образцов с пассивным путем, чтобы определить, имеет ли проба или ген повышенный или пониженный уровень экспрессии, учитывая используемые обучающие данные. В случаях, когда среднее значение активных образцов статистически выше, чем у пассивных образцов, т.е. значение р ниже определенной пороговой величины, например 0,3, то набор проб или целевой ген определяется как имеющий повышенный уровень экспрессии. И наоборот, в тех случаях, когда среднее значение активных образцов статистически ниже, чем у пассивных образцов, такой набор проб или целевой ген определяется как имеющий пониженный уровень экспрессии при активации пути. В случае, если самая низкая (левосторонняя или правосторонняя) величина р превышает вышеупомянутый порог, вес такой пробы или гена определяется равным 0.

В другом предпочтительном варианте используется альтернативный способ получения весов и порога(ов). Этот альтернативный способ основан на логарифме (например, по основанию е) отношения шансов и, в этой связи, называется веса "логарифма отношения шансов". Отношение шансов для каждой пробы или гена рассчитывается на основании количества положительных и отрицательных обучающих образцов, для которых уровень пробы/гена выше и ниже соответствующего порога, например, медианы всех обучающих образцов (уравнение 3). Для того, чтобы избежать деления на ноль может быть добавлен псевдоотсчет (уравнение 4). Дальнейшее оптимизация заключается в подсчете образцов выше/ниже порога, в некотором смысле, более вероятностным методом, исходя из предположения, что уровни пробы/гена имеют, например, нормальное распределение вокруг его наблюдаемого значения с некоторым определенным стандартным отклонением (например, 0,25 по шкале 2-log), и подсчета вероятностной меры выше и ниже порога (уравнение 5).

Альтернативно, можно использовать известные в данной области алгоритмы оптимизации, такие как регрессия, чтобы определить веса и порог(и) описанных здесь (псевдо-)линейных моделей.

Особое внимание следует обратить на способ определения параметров для (псевдо-)линейных моделей для получения хорошей генерализации. Альтернативно, можно использовать другие методы машинного обучения, такие как байесовские сети, которые как известно в этой области, обеспечивают хорошую генерализацию благодаря использованию особых мер во время процедуры обучения.

Предпочтительно, обучение (псевдо-)линейных моделей путей Wnt, ER, НН и AR осуществляется с помощью общедоступных данных, которые можно получить из базы данных Gene Expression Omnibus (http://www.ncbi.nlm.nih.gov/geo/). В качестве примера, модели обучали с помощью таких общедоступных данных.

Особо следует отметить, что в соответствии с WO 2013/011479 А2 и US 61/745839, соответствующей РСТ/IB2013/061066, порядок ранга целевых генов ER, определенных в прилагаемой формуле изобретения, немного изменен из-за добавления новых свидетельств, полученных на основании литературных источников. Целевые гены ER выбирали и ранжировали аналогично тому, как описано в примере 3 US 61/745839, соответствующей РСТ/IB2013/061066. Гены ранжировали путем объединения доказательственного балла, полученного на основании литературных источников, и индивидуальных способностей каждого гена быть дифференцированным между активным и неактивным путем в модели Affymetrix. Это ранжирование основано на линейной комбинации взвешенных ложноположительных и ложноотрицательных результатов, полученных для каждого гена при обучении модели с помощью обучающего набора образцов клеточных линий MCF7, истощенной по эстрогену, которая впоследствии оставалась истощенной или получала 1 нМ эстроген в течение 24 часов (GSE35428), путем тестирования модели с применением обучающего набора и двух других обучающих наборов, в которых клетки MCF7 были истощены по эстрогену и оставались далее истощенными или получали 10 нМ или 25 нМ эстроген (GSE11352 и GSE8597, соответственно).

(Следует отметить, что комбинация взвешенных ложноположительных и ложноотрицательных результатов (вместо отношения шансов) была использована для учета различных экспериментальных условий, использованных в различных наборах. Различные веса устанавливали в соответствии с учетом мнения авторов настоящего изобретения о том, что ложноположительные (отрицательные) результаты являются следствием модели, а не различий в условиях проведения экспериментов с образцом. Например, во всех экспериментах образцы клеточной линии MCF7 были изначально истощены по эстрогену в течение какого-то промежутка времени до получения эстрогена или дополнительного истощения еще в течение 24 часов. Более короткое время истощения может привести к тому, что путь все еще остается активным, несмотря на истощение по эстрогену, в этом случае ложные результаты будут иметь меньший вес, чем в случае истощения в течение такого же промежутка времени и тестовых и обучающих образцов.)

Пример 2. Определение степени риска

В общем случае, можно разработать много разных формул для определения степени риска, которая указывает на риск возникновения клинического события в течение определенного промежутка времени, при этом степень риска основана, по меньшей мере, частично, на комбинации выведенных активностей двух или более клеточных сигнальных путей в ткани и/или клетках и/или жидкости организма субъекта, то есть:

MPS = F(P1, … ,PN) + X, (6),

где MPS представляет собой степень риска (термин "MPS" используется здесь в виде аббревиатуры термина "степень для множества путей" (“Multi-Pathway Score”), обозначающего степень риска, полученную на основании выведенных активностей двух или более клеточных сигнальных путей), где Pi представляет собой степень активности клеточного сигнального пути i, N представляет собой общее число рассматриваемых клеточных сигнальных путей, и Х является плейсхолдером для возможных дальнейших факторов или параметров, которые могут быть использованы в уравнении. Более конкретно, такая формула может представлять собой полином определенной степени при заданных переменных или линейной комбинацией переменных. Весовые коэффициенты и степени в таком полиноме могут быть установлены на основании экспертных знаний, но, как правило, для получения оценок для весовых коэффициентов и степеней в уравнении (6) используется обучающий набор данных с известной реальной ситуацией, например, данные по выживанию. Выведенные активности объединяют, используя уравнение (6), и затем получают MPS. После этого весовые коэффициенты и оценочную функцию оптимизируют таким образом, чтобы высокий MPS коррелировал с более длинным периодом времени, прошедшим до возникновения клинического события, и наоборот. Оптимизацию корреляции оценочной функции с данными возникновения события можно осуществлять, используя множество методов анализа, например, при помощи критерия пропорциональных рисков Кокса (используемого в настоящем описании в качестве иллюстрации), логарифмического рангового критерия, метода оценки Каплана-Мейера в сочетании со стандартными способами оптимизации, такими как метод сопряженных градиентов или ручной подгонкой.

В этом примере, клиническое событие представляет собой рак, в частности, рак молочной железы, а выведенная активность пути Wnt, пути ER (эстрогенный рецептор), пути HH (Hedgehog) и пути AR (андрогенный рецептор) рассматривается согласно тому, как подробно описано в опубликованной международной заявке на патент WO 2013/011479 А2 ("Оценка активности клеточных сигнальных путей с применением вероятностного моделирования экспрессии целевых генов") или в неопубликованной предварительной заявке на патент US 61/745839, соответствующей неопубликованной международной заявке на патент РСТ/IB2013/061066 ("Оценка активности клеточных сигнальных путей с применением линейной комбинации(ий) экспрессии целевых генов").

Формула, которая используется в настоящем описании в качестве примера, учитывает активность пути Wnt, пути ER и пути HH. Авторы настоящего изобретения исходили из наблюдений, полученных при изучении биологии рака, а также в виде корреляций, найденных в общедоступных наборах проб, между выживаемостью и активностью путей Wnt, ER, и НН. Предполагается, что пути раннего развития, такие как Wnt и Hedgehog, играют определенную роль в метастазировании раковых клеток, которые возвращаются к фенотипу, более похожему на стволовые клетки, и которые называются раковыми стволовыми клетками. Действительно, авторы изобретения считают, что существует достаточное количество указаний на то, что пути раннего развития, такие как путь Wnt, являются важными в метастазировании рака, способствуя началу деления метастатических раковых клеток в месте оседания в другом органе или ткани. Метастаз связан с плохим прогнозом и представляет собой форму рецидива рака, таким образом, активность путей раннего развития, таких как пути Wnt и HH, в раковых клетках, согласно ожиданиям авторов изобретения, будет давать плохой прогноз, в то время как пассивность пути ER, по-видимому, будет коррелировать с плохим результатом у больных раком молочной железы. Предполагаемая роль путей Wnt и Hedgehog в прогрессировании и метастазировании рака основана на доклинических исследованиях, и не была показана для субъектов, поскольку отсутствуют способы для измерения их активности.

Эти наблюдения авторов настоящего изобретения, полученные из биологических исследований и клинических корреляций, согласно которым активность Wnt и HH может играть определенную роль в рецидиве рака, а активность ER,

по-видимому, связана с хорошим клиническим результатом, объединены в приведенной ниже в качестве примера формуле

MPS = -α · PER + β · max(PWnt, PHH), (7)

где PER, PWnt и PHH означают выведенную активность пути ER, пути Wnt и пути HH, соответственно (например, в пределах от 0 до 1), и α и β представляют собой неотрицательные, предпочтительно положительные, постоянные масштабирующие коэффициенты. В этом примере α и β выбраны в качестве иллюстрации равными 1, а вероятности путей Wnt, ER и HH, находящихся в активном состоянии, были использованы как выведенные методом, описанным более подробно в опубликованной международной заявке на патент WO 2013/011479 А2 ("Оценка активности клеточных сигнальных путей с применением вероятностного моделирования экспрессии целевых генов"). В используемой здесь модели байесовской сети пути ER, Wnt и HH включают А) узел верхнего уровня для уровня представляющего интерес фактора транскрипции, В) уровень узлов, представляющих наличие представляющих интерес целевых генов (таблица 2, таблица 1 и таблица 3 в WO 2013/011479 А2, соответственно) и С) уровень узлов, представляющих наборы проб, связанные с представляющими интерес целевыми генами (таблица 2, таблица 1 и таблица 3 в WO 2013/011479 А2, соответственно). Априорная вероятность присутствующего или отсутствующего элемента TF устанавливается, равной 0,5. Условные вероятности между уровнями А и В тщательно подбирались вручную согласно тому, как описано в WO 2013/011479 А2, следующим образом: (а) отсутствующий TF/сниженный уровень экспрессии целевого гена: 0,95, (ii) отсутствующий TF/повышенный уровень экспрессии целевого гена: 0,05, (iii) присутствующий TF/сниженный уровень экспрессии целевого гена: 0,30, и (iv) присутствующий TF/повышенный уровень экспрессии целевого гена: 0,70, при этом условные вероятности между уровнями B и C были получены в результате обучения с применением датах, полученных из GSE8597, GSE8671 и GSE7553, соответственно.

В качестве обучающих данных, для пути ER использовали GSE8597, для пути Wnt использовали GSE8671 и для пути HH использовали GSE7553. Для того, чтобы сделать вывод, учитывали следующие целевые гены: GREB1, PGR, XBP1, CA12, SOD1, CTSD, IGFBP4, TFF1, SGK3, NRIP1, CELSR2, WISP2, AP1B1, RARA, MYC, DSCAM, EBAG9, COX7A2L, ERBB2, PISD, KRT19, HSPB1, TRIM25, PTMA, COL18A1, CDH26, NDUFV3, PRDM15, ATP5J и ESR1 для пути ER; KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6, FZD7, NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A и LECT2 для пути Wnt; и GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN, CTSL1, BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 и TOM1 для пути HH.

Полученный MPS находился в пределах от -1, что указывало на низкий риск рецидива клинического случая, в данном случае рака, либо местного или отдаленного, в частности, рака молочной железы, в течение определенного промежутка времени, до +1 для пациентов с высоким риском рецидива.

Следует отметить, что, хотя в дальнейшем используется MPS, вычисленный по уравнению (7), в другом подходящем способе вычисления степени риска (MPS) на основании выведенной активности путей Wnt, ER, и HH используется следующая приведенная в качестве примера формула:

MPS = -α · PER + β · PWnt + γ · PHH, (8)

где PER, PWnt и PHH означают выведенную активность пути ER, пути Wnt и пути HH, соответственно (например, в пределах от 0 до 1), и α, β и γ представляют собой неотрицательные постоянные масштабирующие коэффициенты.

Два способа для квантования такого прогностического значения, используемого в настоящем описании в качестве примера, представляют собой модели пропорциональных рисков Кокса и графики Каплан-Мейера в сочетании с логарифмическим ранговым критерием:

Первый способ подходит для модели рисков, в которой используются данные по выживанию с одной или несколькими ковариатами. Вкратце, такая модель рисков объясняет разброс в выживаемости (клиническое событие) среди населения, исходя из (численного) значения ковариат. В результате фитирования каждой включенной ковариате будет присвоен уровень риска (HR), который количественно выражает связанный риск возникновения клинического события, исходя из значения ковариаты, например, HR, равный двум, соответствует увеличенному в два раза риску возникновения представляющего интерес клинического события для пациентов с увеличением значения указанной ковариаты на единицу. Более подробно, значение HR, равное единице, означает, что это ковариата не влияет на выживаемость, в то время как для HR < 1, увеличение числа ковариаты означает более низкий риск, а уменьшение числа ковариаты означает более высокий риск, и для HR > 1, увеличение числа ковариаты означает более высокий риск, а уменьшение числа ковариаты означает более низкий риск. Наряду с уровнями риска, приводятся 95% доверительный интервал и значения р (т.е. односторонняя вероятность того, что уровень риска значительно меньше или больше единицы). Все ковариаты масштабируются между нулем и единицей для обеспечения непосредственного прямого сравнения уровней рисков.

Последний способ включает построение кривой Каплана-Мейера, которая представляет собой вероятность выживания клинического события в виде функции от времени. Например, путем построения кривых Каплана-Мейера для различных групп риска в популяции, используя иллюстративный прогностический тест, можно визуализировать качество выделения риска приведенного в качестве примера клинического события. Это качество можно дополнительно квантировать с помощью логарифмического рангового критерия, который вычисляет вероятность (значение р), при котором две функции выживания равны.

Для стратификации пациентов по степени риска, в качестве примера используется следующий алгоритм: пациенты, у которых MPS меньше -0,1, коррелируют с вероятностью высокой активности пути ER и, таким образом, обозначены, как имеющие низкий риск рецидива, тогда как MPS больше +0,1 связан высокой активностью с высокого риска пути Wnt и/или пути НН и, таким образом, коррелирует с высоким риском рецидива. Пациенты с МПС между -0.1 и +0.1 классифицируются как имеющие промежуточный риск развития рецидива, поскольку эта группа включает пациентов с активным путем с низкий риском, таким как путь ER, а также активацию сигнальных путей с высоким риском, таких как Wnt или НН, либо пациентов, у которых отсутствуют пути, относительно которых был сделан вывод о том, что они могут запустить рост опухоли. Пороги -0,1 и +0,1 основаны на анализе распределения оценок MPS, полученных из нескольких баз данных, включающих 1294 различных пациентов с раком молочной железы, опубликованных в базах данных Gene Expression Omnibus (GSE6532, GSE9195, GSE20685, GSE20685 и GSE21653; см. http://www.ncbi.nlm.nih.gov/geo/, дата последнего обращения - 13 февраля 2013) и ArrayExpress (Е-MTAB-365, см. http://www.ebi.ac.uk/arrayexpress/experiments/, дата последнего обращения - 13 февраля 2013), как можно видеть на фиг. 1.

В качестве контрольного теста использовали активности отдельных путей и тест Oncotype DX® для рака молочной железы из Genomic Health, в отношении которого было показано, что он является хорошим прогностическим фактором рецидива и согласуется с другими прогностическими факторами для рака молочной железы, основанными на экспрессии генов. Тест Oncotype DX® выдает оценку риска или рецидива (RS) в интервале от 0 до 100, которая рассчитывается на основании комбинации уровней экспрессии, измеренных для панели генов. RS оптимизирован по отношению к 10-летней выживаемости пациентов с раком молочной железы без метастазов в лимфоузлах при положительном ER, отрицательном HER2 (окрашивания белка или FISH) (см. Paik, S., et al.: “A multi-gene assay to predict recurrence of Tamoxifen-treated, node-negative breast cancer,” The New England Journal of Medicine, 351(27), (2004), стр. 2817-2826; Fan, C., et al.: “Concordance among gene-expression-based predictors for breast cancer,” The New England Journal of Medicine, 355(6), (2006), стр. 560-569). RS рассчитывали, используя данные экспрессии, полученные на микрочипах, представленные в упомянутых выше базах данных, в соответствии с процедурой, опубликованной Fan et al. (см. Fan, C., et al. (2006)), и пациентов затем делили на пациентов с низким риском, промежуточным риском и высоким риском в соответствии с алгоритмом стратификации риска Oncotype DX®.

Результаты

(i) Данные по Erasmus

Все 204 пациента в группе GSE12276, полученной из базы данных Gene Expression Omnibus (см. http://www.ncbi.nlm.nih.gov/geo/, дата последнего обращения 13 февраля 2013), имели рецидив (медиана времени до рецидива: 21 месяц, диапазон: 0-115 месяцев), что делает ее хорошим набором данных для изучения прогностической ценности оценки активности пути и полученной из нее MPS относительно риска рецидива с тем, чтобы определить возможность отделения случаев ранних рецидивов от случаев поздних рецидивов.

Одномерные модели пропорциональных рисков Кокса были подстроены с применением путей Wnt, ER, HH и AR, а также нормированных значений (т.е., значений между 0 и 1) для RS и MPS, см. таблицу 12 ниже. Одномерный анализ показывает, что как RS, так и MPS имеют уровень риска значительно превышающее 1, в то время как PER имеет уровень риска значительно ниже 1. Многомерный анализ, который включает в себя комбинацию RS либо с PER, либо с MPS, дает в результате два важных прогностических фактора (р<0,05). При этом комбинация MPS и PER приводит к потере значимости одного из прогностических факторов (MPS: р>0,05), что объясняется тем, что PER также является элементом степени для множества путей. Следовательно, многомерный анализ с использованием RS, MPS и PER также нелогичен.

Таблица 12
Пропорциональные уровни риска Кокса для всех пациентов в GSE12276
HR HR 95% CI p
Одномерный RS (нормализованный) 2,66 1,81 3,93 <0,01
PWnt 1,18 0,79 1,77 0,21
PER 0,42 0,28 0,64 <0,01
PHH 0,78 0,51 1,21 0,14
PAR 0,98 0,46 2,06 0,48
MPS (нормализованный) 2,09 1,26 3,47 <0,01
Многомерный RS (нормализованный) 2,50 1,68 3,72 <0,01
MPS (нормализованный) 1,66 0,98 2,80 0,03
Многомерный RS (нормализованный) 2,18 1,41 3,35 <0,01
PER 0,61 0,39 0,96 0,017
Многомерный MPS (нормализованный) 0,87 0,40 1,86 0,35
PER 0,39 0,22 0,71 <0,01
Многомерный RS (нормализованный) 2,22 1,43 3,46 <0,01
MPS (нормализованный) 1,18 0,54 2,58 0,34
PER 0,68 0,35 1,31 0,12

В заключение, одномерный анализ показал, что оценка возникновения рецидивов (RS) по Oncotype DX® из Genomic Health имеет более сильную предсказательную мощность в отношении рецидива, чем основанные на пути прогностические факторы PWnt, PHH и PAR, что не является неожиданным, поскольку RS был специально оптимизирован для прогнозирования рецидива, в то время как PWnt, PHH и PAR нацелены на предсказание активности пути. Тем не менее, PER и полученный из него MPS в комбинации с PWnt и PHH также являются сильными, значимыми прогностическими факторами возникновения рецидива. При этом, объединение RS либо с PER, либо с MPS приводит к улучшенной стратификации рисков, превосходящей отдельные прогностические факторы (незначимые, p≈0,14). К тому же, это также означает, что оценка возникновения рецидивов по Oncotype DX® (RS) и степень для множества путей (MPS) являются взаимодополняющими прогностическими факторами рецидива, и обе рассматривают различные механизмы, лежащие в основе роста опухолей.

Принимая во внимание то, что только 71 пациентов оказались пригодными для проведения теста Oncotype DX® на рак молочной железы (т.е., пациенты, которые были ER положительными с отсутствием метастазов в лимфатических узлах с неизвестным статусом HER2) из того же набора данных, было отмечено, что RS и PER остаются по-прежнему сильными прогностическими факторами возникновения рецидива (р<0,05); см. таблицу 13 ниже. С другой стороны, следует отметить, что MPS больше не является значимым прогностическим фактором, что, скорее всего, является результатом более однородной группы пациентов (только с несколькими Wnt- и HH-активными опухолями). Поразительным оказалось то, что самым сильным прогностическим фактором в прогнозе рецидива у ER положительных (окрашивание белка) пациентов без метастазов в лимфатических узлах является PER, а не оценка рецидива по Oncotype DX® (RS).

Таблица 13
Пропорциональные уровни риска Кокса для ER положительных пациентов без метастазов в лимфатических узлах в GSE12276
HR HR 95% CI p
Одномерный RS (нормализованный) 1,78 0,98 3,26 0,03
PWnt 0,54 0,25 1,17 0,058
PER 0,48 0,26 0,89 <0,01
PHH 0,68 0,32 1,44 0,16
PAR 1,40 0,35 5,69 0,32
MPS (нормализованный) 1,59 0,68 3,68 0,14
Многомерный RS (нормализованный) 1,19 0,55 2,60 0,33
PER 0,54 0,25 1,17 0,060

(ii) Клинические данные Гая (Guy)

Набор данных GSE12276 Erasmus имеет уклон в сторону рецидива, поскольку он включает только пациентов с рецидивами, возникшими при последующем наблюдении. Для изучения прогностической ценности предсказаний на основании пути были использованы более релевантные, с клинической точки зрения, наборы пациентов, которые получены в клинике Гая: GSE6532 и GSE9195 (в общей сложности, 164 пациента). Пациенты в этих наборах данных были диагностированы как имеющие положительную опухоль ER и после операции получали адъюванту гормональную терапию в течение 5 лет.

Прямое сравнение оценки рецидива (RS) по Oncotype DX® с MPS (см. таблицу 14) показывает, что оба теста примерно одинаково хорошо предсказывают риск возникновения рецидива (HR: 4,41 (1,93-10,091) против 6,43 (1,66-24,90)). Предсказательная мощность обоих тестов остается значимой и после объединения в многомерном анализе. Это подтверждает результаты, полученные в наборе данных Erasmus GSE12276; оценка возникновения рецидивов (RS), полученная в результате теста Oncotype DX® для рака молочной железы, и MPS являются взаимодополняющими прогностическими факторами возникновения рецидива и оба рассматривают различные механизмы, лежащие в основе роста опухоли. Объединение этих двух тестов дополнительно улучшает прогноз безрецидивной выживаемости, как можно видеть на Фиг.2 (обратите внимание, что на Фиг.2.А показан срез из Фиг.2.В, увеличенный по оси времени) и ниже в таблице 14.

Таблица 14
Пропорциональные уровни риска Кокса для всех пациентов в GSE6532 и GSE9195
HR HR 95% CI p
Одномерный RS (нормализованный) 4,41 1,93 10,09 <0,01
MPS (нормализованный) 6,43 1,66 24,90 <0,01
Многомерный RS (нормализованный) 3,99 1,71 9,29 <0,01
MPS 4,57 1,19 17,47 0,026

(iii) Данные Cartes d’Identité des Tumeurs

Чтобы продемонстрировать, что MPS также применим для всей популяции пациентов с первичным раком молочной железы, например, базальными видами HER2-амплифицируемого рака молочной железы, он был применен к другому набору образцов пациентов (n=537, ER +/-, HER +/-, PGR +/-, другой степени, и т.д., средняя продолжительность наблюдения 65±(SD), 40 месяцев), полученному из общедоступной базы данных E-MTAB-365 через ArrayExpress. Это привело к хорошему разделению по выживаемости при высоком риске и промежуточном риске по сравнению с пациентами с низким риском (как при р<0,01), как можно видеть на фиг.3 (обратите внимание, что на фиг.3.A показан срез из фиг.3.B, увеличенный по оси времени), и HR, равный 2,72 (1,25-5,92, p<0,01).

(iv) Данные из онкоцентра Koo Foundation Sun-Yat-Sen

MPS был протестирован на другой когорте пациентов, состоящей из другой группы пациентов, больных раком молочной железы (n=327, GSE20685, ER+/-, HER +/-, PGR +/-, с метастазами и без и т.д.). Это привело к HR, равном 3,53 (1,34-9,30, р<0,01) и хорошему разделению на группы пациентов с низким, промежуточным и высоким рисками, см. Фиг.4 (обратите внимание, что на Фиг.4.A показан срез Фиг.4.В, увеличенный по оси времени).

(v) Данные, полученные из института Institut Paoli-Calmattes

Следующий прогностический фактор рецидива MPS был применен к группе, состоящей из 266 пациентов с раком молочной железы, которые были прооперированы в Институте Paoli-Calmattes. У пациентов наблюдался разный набор видов рака молочной железы: ER+/-, HER +/-, PGR +/-, с метастазами и без, степени 1/2/3, KI67 +/- и P53 +/-. Микрочипы этих образцов общедоступны в виде набора данных GSE21653. HR MPS было значимым при 2,8 (1,20-6,51, р<0,01), причем разделение риска на кривых выживаемости Каплана-Мейера с низким риском и высоким риском было также значимым (р = 0,017), Фиг.5 (обратите внимание, что на Фиг.5.A показан срез Фиг.5.В, увеличенный по оси времени).

Пример 3. Разработка анализа

Вместо применения, например, упомянутых байесовской или (псевдо)линейной моделей, ко входным данным мРНК, полученным из микрочипов или секвенирования РНК, в клинической практике может оказаться полезной разработка специального анализа для выполнения измерений образцов, например, на интегрированной платформе с применением количественной ПЦР для определения уровня мРНК целевых генов, которые являются частью MPS. Последовательности РНК/ДНК раскрытых целевых генов можно затем использовать для определения того, какие праймеры и пробы выбрать на такой платформы.

Проверка такого специализированного анализа MPS может быть выполнена с помощью байесовской или (псевдо)линейной модели, основанной на микрочипах, используемой в качестве референсной модели, чтобы оценить, дает ли разработанный анализ аналогичные результаты на проверочной выборке. Далее специализированный анализ также может быть разработан для создания и калибровки аналогичной байесовской или (псевдо)линейной модели, используя данные секвенирования мРНК в качестве входных измерений.

Пример 4. Применение CDS

Ссылаясь на фиг.6 (схематично показывающую систему поддержки принятия клинических решений (CDS), выполненную с возможностью определения степени риска, который указывает на риск возникновения клинического события в течение определенного промежутка времени, как описано в настоящем документе), система 10 поддержки принятия клинических решений (CDS) реализована в виде соответствующим образом сконфигурированного компьютера 12. Компьютер 12 может быть сконфигурирован для работы в качестве системы 10 CDS путем выполнения соответствующей программы, блоков программы или других инструкций, хранящихся на не меняющаяся во времени среда (не показан), такая как жесткий диск или другая магнитная запоминающая среда, оптический диск или другая оптическая запоминающая среда, запоминающее устройство с произвольным доступом (RAM), постоянное запоминающее устройство (ROM), флэш-память или другая электронная запоминающая среда, сетевой сервер или т.п.Хотя иллюстративная система 10 CDS реализована на иллюстративном компьютере 12, в более общем случае система CDS может быть реализована с помощью цифрового процессорного устройства или устройства, содержащего цифровой процессор, сконфигурированный с возможностью выполнения методов поддержки принятия клинических решений, как изложено в настоящем описании. Например, цифровое процессорное устройство может представлять собой мобильное устройство (например, персональный электронный помощник или смартфон, исполняющий приложения CDS), ноутбук, настольный компьютер, планшетный компьютер или устройство, удаленный сервер или так далее. Компьютер 12 или другое цифровое процессорное устройство обычно включает в себя или соединено в рабочем состоянии с устройством 14 отображения, на котором для медицинского персонала отображается информация, содержащая рекомендации по принятию клинических решений. Компьютер 12 или другое цифровое процессорное устройство также обычно включает в себя или соединено в рабочем состоянии с одним или несколькими устройствами ввода пользовательских данных, например, иллюстративной клавиатурой 16 или мышью, трекболом, сенсорной панелью, сенсорным экраном (возможно интегрированным с устройством 14 отображения), или другим устройством ввода указательного типа, с помощью которого медицинский персонал может вводить информацию, такую как операционные команды для управления системой 10 CDS, данные для использования в системе 10 CDS и т.д.

Система CDS 10 принимает в качестве входной информации, относящейся к субъекту (например, пациент лежит в больнице или проходит амбулаторное лечение у онколога, врача или другого медицинского персонала, или пациент проходит обследование на наличие рака или для постановки какого-либо другого медицинского диагноза, который известен, или диагноза на подозрение на определенный тип рака, такой как рак толстой кишки, рак молочной железы или рак печени, или т.п.). В системе 10 CDS применяются различные алгоритмы анализа данных такой входной информации для получения рекомендаций для принятия клинических решений, которые предоставляются медицинскому персоналу через устройство 14 отображения (или с помощью синтезатора голоса или другого устройства, предоставляющего воспринимаемые человеком выходные данные). В некоторых вариантах осуществления эти алгоритмы могут включать применение клинических рекомендаций к пациенту. Клинические рекомендации представляют собой хранящийся набор стандартных или "канонических" рекомендаций по лечению, как правило, созданный на основе рекомендаций группы медицинских экспертов и, возможно, отформатированный в виде клинической "блок-схемы", для облегчения навигации по клиническим рекомендациям. В различных вариантах осуществления алгоритмы обработки данных CDS 10 могут дополнительно или альтернативно включать в себя различные алгоритмы диагностических или клинических испытаний, которые выполняются на входной информации для извлечения рекомендаций по принятию клинических решений, такие как методы машинного обучения, раскрытые здесь.

В раскрытых здесь иллюстративных системах CDS (например, системе 10 CDS) алгоритмы анализа данных CDS включают в себя один или более алгоритмов диагностических или клинических испытаний, которые выполняются на входной геномной и/или протеомной информации, полученной из одной или нескольких медицинских лабораторий 18. Эти лаборатории могут быть располагаться различным образом "на месте", то есть, в больнице или в другом месте, где субъект проходит медицинское обследование и/или лечение, или "за пределами", например, специализированные и централизованные лаборатории, которые принимают (по почте или используя другие службы доставки) образцы ткани и/или клеток, и/или жидкости организма субъекта, полученные от субъекта (например, образец, полученный из пораженного раком участка или из участка с подозрением на наличие рака, или из метастатической опухоли, или из полости тела, жидкость которого заражена раковыми клетками (например, плевральной или брюшной полости или полости мочевого пузыря), или из других жидкостей организма, содержащих раковые клетки, и т.д., предпочтительно с помощью биопсии или другой процедуры извлечения образца). Клетки, из которых был извлечен образец также могут быть опухолевыми клетками из гематологических злокачественных опухолей (таких как лейкемия или лимфома). В некоторых случаях образец клеток также может представлять собой циркулирующие опухолевые клетки, т.е., опухолевые клетки, которые могут попадать в кровоток и могут быть извлечены с помощью подходящего способа выделения, например, с помощью афереза или обычного забора крови из вены. Помимо крови, жидкость организма, из которой извлекают образец, может представлять собой мочу, содержимое желудочно-кишечного тракта или экссудат.

Извлеченный образец обрабатывается в лаборатории для получения геномной или протеомной информации. Например, извлеченный образец может быть обработан с помощью микрочипа (также называемого в данной области техники как генный чип, ДНК чип, биочип или т.п.) или путем обработки методом количественной полимеразной цепной реакции (кПЦР) для измерения доказательной геномной или протеомной информации, такой как уровни экспрессии представляющих интерес генов, например, в виде уровня матричной рибонуклеиновой кислоты (мРНК), которая транскрибируется с гена, или в виде уровня белка, который транслируется с мРНК, транскрибируемой с гена. В качестве другого примера, извлеченный образец может быть обработан в лаборатории путем секвенирования гена для получения последовательностей дезоксирибонуклеиновой кислоты (ДНК), или получения последовательности РНК, вариации количества копий, метилирования т.п.Другие рассматриваемые подходы измерения включают иммуногистохимию (IHC), цитологическое исследование, флуоресценцию гибридизации in situ (FISH), метод близкого лигирования т.д., выполняемые на слайде с патологией. Другая информация, которая может быть получена путем обработки микрочипов, с помощью масс-спектрометрии, секвенирования генов или других лабораторных методов исследования, включает в себя информацию о метилировании. Также возможны различные комбинации таких геномных и/или протеомных измерений.

В некоторых вариантах осуществления медицинские лаборатории 18 выполняют ряд стандартных методов сбора данных из извлеченного образца ткани и/или клеток и/или жидкости организма субъекта для получения большого количества геномных и/или протеомных данных. Например, методы сбора стандартизованных данных могут генерировать (необязательно выровненную) последовательность ДНК одной или нескольких хромосом или хромосомных участков, или всего генома ткани и/или клеток и/или жидкости организма. Применение стандартного микрочипа позволяет получить тысячи или десятки тысяч элементов данных, таких как уровень экспрессии для большого числа генов, различные данные по метилированию и т.д. Аналогично, для измерения уровня экспрессии выбранных генов можно использовать измерения, основанные на ПЦР. Это множество геномных и/или протеомных данных, или выбранных групп этих данных вводятся в систему 10 CDS для обработки с тем, чтобы разработать клинически полезную информацию для составления рекомендаций для принятия клинических решений.

Раскрытые системы CDS и связанные с ними способы относятся к обработке геномных и/или протеомных данных для оценки активности различных клеточных сигнальных путей и определения степени риска, которая указывает на риск возникновения клинического события (например, рака) в течение определенного промежутка время. Тем не менее, следует понимать, что раскрытые системы CDS (например, система 10 CDS) необязательно могут дополнительно включать в себя различные дополнительные возможности, такие как создание рекомендаций для принятия клинических решений в соответствии с сохраненным клиническим руководством, основанным на различных данных о пациенте, таких как данные мониторинга жизненно важных показателей, данные анамнеза, демографические данные пациента (например, пол, возраст и т.д.), данные пациента по медицинской визуализации и т.д. Альтернативно, в некоторых вариантах осуществления возможности системы 10 CDS могут быть ограничены только выполнением анализа геномных и/или протеомных данных для оценки активности клеточных сигнальных путей и определения степени риска, который указывает на риск возникновения клинического события (например, рак) в течение определенного промежутка времени, как описано здесь.

Вновь ссылаясь на пример, показанный на Фиг.6, система 10 CDS делает вывод об активности 22 двух или более клеточных сигнальных путей, в данном случае пути Wnt, пути ER и пути HH, в ткани и/или клетках и/или жидкости организма субъекта, исходя из, по меньшей мере, без ограничения, уровней 20 экспрессии одного или более целевых генов клеточных сигнальных путей, измеренных в извлеченном образце ткани и/или клеток, и/или жидкости организма субъекта. Описанные здесь примеры относятся к путям Wnt, ER, AR и НН, приведенным в качестве иллюстративных клеточных сигнальных путей. Эти пути представляют интерес в различных областях онкологии, поскольку потеря регуляции этих путей может быть причиной развития рака. Существует около 10-15 релевантных сигнальные путей, и каждый вид рака возникает в результате нарушения регуляции, по меньшей мере, одного доминантного пути. Не ограничиваясь какой-либо конкретной теорией, эти пути регулируют клеточную пролиферацию, и, как следствие, потеря регуляции этих путей в раковых клетках может привести к тому, что путь будет "всегда" иметь повышенную активность, таким образом, ускоряя пролиферацию раковых клеток, что, в свою очередь, проявится как рост, инвазия или метастазирование (распространение) рака.

Измерение уровней экспрессии мРНК для генов, кодирующих регуляторные белки клеточного сигнального пути, такие как промежуточный белок, который является частью каскада белков, формирующего клеточный сигнальный путь, является косвенной мерой уровня экспрессии регуляторного белка и может сильно коррелировать или не коррелировать с фактическим уровнем экспрессии регуляторного белка (что проявляется в значительно меньшей степени в отношении общей активности клеточного сигнального пути). Клеточный сигнальный путь непосредственно регулирует транскрипцию целевых генов, следовательно, уровни экспрессии мРНК, транскрибированной с целевых генов, являются прямым результатом такой регуляторной активности. Таким образом, система 10 CDS делает вывод об активности двух или более клеточных сигнальных путей (в данном случае пути Wnt, пути ER и пути HH) на основе, по меньшей мере, уровней экспрессии одного или нескольких целевых генов (уровня мРНК или белка в качестве суррогатного измерения) этих клеточных сигнальных путей. Это гарантирует, что система 10 CDS делает вывод об активности пути, основываясь на непосредственной информации, предоставленной измеренными уровнями экспрессии целевого(ых) гена(ов).

Выведенные активности, в этом примере, PWnt, PER и PHH, т.е. выведенные активности пути Wnt, пути ER и пути HH, затем используются для определения 24 степени риска, который указывает на риск возникновения клинического события, в этом примере рака, в частности рака молочной железы, в течение определенного промежутка времени, о чем подробно описано в настоящей заявке. Степень риска основана, по меньшей мере, частично, на комбинации выведенных активностей. Например, степень риска может быть "Степенью множества путей" (MPS) вычисленной согласно тому, как подробно описано со ссылкой на уравнение (7).

На основании определенной MPS, система 10 CDS, в этом примере, определяет 26 субъекта, по меньшей мере, в одну из множества групп риска, связанных с различными указанными рисками возникновения клинического события в течение определенного промежутка времени, и/или принимает решение 28 о лечении, рекомендованном для пациента, основываясь, по меньшей мере, частично, на указанном риске возникновения клинического события в течение определенного промежутка времени.

Определение MPS и/или классификация риска для конкретного пациента по системе CDS или независимая реализация MPS и классификация рисков, как описано в данном документе, позволяет онкологу, врачу или другому медицинскому персоналу, принимающему участие в постановке диагноза или в лечении, или мониторинге/наблюдении пациента адаптировать лечение с тем, чтобы улучшить шансы пациента на долгосрочное выживание, при этом сведя к минимуму развитие нежелательных побочных эффектов, особенно эффектов, вызванных агрессивной химиотерапией и/или таргетной терапией и/или иммунотерапией и/или лучевой терапией и/или хирургическим вмешательством. Таким образом, например, больные с низким риском рецидива рака, т.е., больные с низким MPS и/или классифицированные как имеющие низкий риск, согласно алгоритму стратификации риска, как описано в настоящем документе, в настоящее время, как правило, проходят курс лечения только на основе гормональной терапии или комбинации гормональной терапии, например, антиэстрогеном и/или ингибиторами ароматазы, и менее токсичного химиотерапевтического агента. С другой стороны, пациенты с промежуточным или высоким риском рецидива рака, то есть пациенты с MPS от среднего до высоких значений и/или классифицированные как имеющие промежуточный или высокий риск, согласно алгоритму стратификации риска, как описано в настоящем документе, в настоящее время, как правило, проходят курс лечения с применением более агрессивной химиотерапии, например, режимы терапии на основе антрациклина и/или таксана. Кроме того, MPS, возможно, в комбинации с результатами других тестов, полученными для пациента, такими как PER, PWnt, PHH, PAR и/или другого прогностического (например, дополняющего диагностического) теста, может улучшить процесс принятия решения относительно лечения пациента с использованием целевых средств, таких как тамоксифен, трастузумаб, бевацизумаб и/или других лекарственных препаратов (например иммунотерапии), которые в настоящее время не являются частью основного протокола лечения конкретного рака у пациента и/или других вариантов лечения, таких как лучевая терапия, например брахитерапии и/или другого времени лечения, например, до и/или после первичного лечения.

Следует отметить, что вместо непосредственного использования определенной оценки риска (MPS) в качестве показателя риска возникновения клинического события (например, рака) в течение определенного промежутка времени, можно сконфигурировать систему 10 CDS таким образом, чтобы она объединяла степень риска и/или, по меньшей мере, одну из выведенных активностей с оценкой одной или нескольких дополнительных степеней риска, полученных из одного или нескольких дополнительных прогностических тестов для получения объединенной степени риска, где объединенная степень риска показывает риск возникновения клинического события в течение определенного промежутка времени. Один или несколько дополнительных прогностических тестов могут содержать, в частности, тест Oncotype DX® для рака молочной железы, тест Mammostrat® для рака молочной железы, тест MammaPrint® для рака молочной железы, тест BluePrintTM для рака молочной железы, тест CompanDx® для рака молочной железы, тест IndexSM (HOXB13/IL17BR) для рака молочной железы, тест OncotypeDX® для рака толстой кишки и/или пролиферативный тест, выполняемый для измерения экспрессии гена/белка Ki67.

Пример 5. Набор и инструменты анализа для определения степени риска

Набор целевых генов, которые, как было найдено, лучше всего указывают на активность конкретного пути с использованием микрочипа/анализа секвенирования РНК, используя, например, байесовский модель или (псевдо)линейную модель, может быть переведен, например, в мультиплексный количественный ПЦР анализ или специализированные биочипы, предназначенные для ткани, клеток или образца жидкости организма. Выбор последовательности гена, как описано здесь, может быть использован для выбора, например, набора проб-праймеров для ПЦР в реальном времени или олигонуклеотидов для разработки микрочипов. Для разработки такого одобренного FDA теста на активность пути и определение степени риска, требуется разработка стандартизированного набора тестов, который должен быть клинически подтвержден в клинических испытаниях для получения одобрения регулирующих органов.

Пример 6. Сравнение степеней риска

На Фиг.7 показан график, демонстрирующий результаты экспериментов, содержащих две степени риска, определенные разными способами. В частности, первая степень риска (MPS) была рассчитана в соответствии с уравнением (8), а вторая степень риска была рассчитана в соответствии с уравнением (7). Первая степень риска был оптимизирована для образцов рака молочной железы путем присвоения логарифмов уровней риска, определенных на образцах рака молочной железы (GSE6532 и GSE9195), которые дали в результате следующие значения: α=log(1/0,36), β=log(3,67) и γ=log(2,29). Значения α и β второй степени риска были выбраны в качестве примера равными 1. Эксперимент проводили на наборах данных GSE21653, GSE20685 и Е-TABM-365 и определяли долю больных, у которых наблюдали рецидив через 10 лет после включения (отбора проб) в виде функции соответствующей степени риска (где степени риска масштабировали таким образом, чтобы их легко можно было сравнить). Всего в полученном списке было 1130 пациентов среди которых 1005 пациентов имели полный комплект данных по выживанию. Пунктирная кривая показывает результаты для первой степени риска, рассчитанной по уравнению (8), а сплошная кривая показывает результаты для второй степени риска, рассчитанной по уравнению (7).

На этих графиках видно, что вторая степень риска, вычисленная по уравнению (7) (сплошная кривая), дает монотонно возрастающий риск, а первая степень риска, вычисленная по уравнению (8) (пунктирная кривая), является ровной при высоких степенях риска (даже кажется, что слегка падает вниз). Это означает, что на верхнем конце первой степени риска, вычисленной по уравнению (8), нельзя определить риск пациента, в то время как используя вторую степень риска, вычисленную по уравнению (7), риск постоянно увеличивается с увеличением степени риска.

Кроме того, на графике также видно, что вторая степень риска, вычисленная по уравнению (7) (сплошная кривая), позволяет лучше распознать пациентов с высоким риском (0,84 против 0,78), но также обеспечивает более точное определение пациентов с низким уровнем риска (0,43 против 0,45), чем в случае первой степени риска, вычисленной по уравнению (8) (пунктирная кривая).

В общем случае, очевидно, что хотя примеры, относящиеся к пути Wnt, пути ER, пути AR и/или пути HH, предусмотрены в качестве иллюстративных примеров, описанные здесь подходы для анализа клеточных сигнальных путей могут быть легко применены к другим клеточным сигнальным путям, помимо указанных путей, например, для путей межклеточной передачи сигналов с рецепторами в клеточной мембране и путей внутриклеточной передачи сигналов с рецепторами внутри клетки. Дополнительно: В настоящей заявке описано несколько предпочтительных вариантов. После прочтения и осмысления предшествующего подробного описания специалисты могут признать наличие возможности для модификаций и изменений. Предполагается, что настоящая заявка включает все такие модификации и изменения в той части, в которой они входят в объем прилагаемой формулы изобретения или ее эквивалентов.

Изучив чертежи, описание и прилагаемую формулу изобретения, специалисты в данной области смогут понять и осуществить на практике другие модификации описанных вариантов осуществления описанного в заявке изобретения.

В формуле изобретения слово “содержит” не исключает другие элементы и стадии, а формы единственного числа не исключают множественное число.

Один блок или устройство может выполнять функции нескольких блоков, указанных в формуле изобретения. Сам факт того, что определенные меры перечислены в различных взаимно зависящих пунктах не указывает на то, что сочетание этих мер нельзя использовать для получения преимуществ.

Вычисления, подобные определению степени риска, выполненные одним или несколькими блоками или устройствами, могут быть выполнены любым другим количеством блоков или устройств.

Компьютерная программа может храниться/распространяться на подходящий носитель, такой как оптический носитель или твердотельный носитель, поставляемый вместе с или как часть другого аппаратного средства, но также может распространяться в других формах, таких как через Интернет или другие проводные или беспроводные телекоммуникационные системы.

Любые ссылки в формуле изобретения не следует толковать как ограничение объема.

Настоящая заявка относится в основном к конкретному способу определения оценки риска, которая указывает на риск возникновения клинического события в течение определенного промежутка времени, причем степень риска основана, по меньшей мере, частично, на комбинации выведенных активностей двух или более клеточных сигнальных путей в ткани и/или клетках и/или жидкости организма субъекта. Настоящая заявка также относится к устройству, содержащему цифровой процессор, сконфигурированный для выполнения таких методов, не меняющийся во времени запоминающей среде, хранящей инструкции, которые исполняются цифровым процессорным устройством для выполнения таких методов, и к компьютерной программе, содержащей средство программного кода для обеспечения осуществления цифровым процессорным устройством таких методов.

Литература:

de Sousa E Melo F, C. S. (2011). Methylation of cancer-stem-cell-associated Wnt target genes predicts poor prognosis in colorectal cancer patients. Cell Stem Cell., 476-485.

Hatzis P, v. d. (2008). Genome-wide pattern of TCF7L2/TCF4 chromatin occupancy in colorectal cancer cells. Mol Cell Biol., 2732-2744.

Nusse, R. (2012, May 1). Wnt target genes. Retrieved from The Wnt homepage: http://www.stanford.edu/group/nusselab/cgi-bin/wnt/target_genes.

Söderberg O, G. M. (2006). Direct observation of individual endogenous protein complexes in situ by proximity ligation. Nat Methods., 995-1000

van de Wetering M, S. E.-P.-F. (2002). The beta-catenin/TCF-4 complex imposes a crypt progenitor phenotype on colorectal cancer cells. Cell, 241-250.


МЕДИЦИНСКИЙ ПРОГНОЗ И ПРЕДСКАЗАНИЕ РЕЗУЛЬТАТОВ ЛЕЧЕНИЯ, ИСПОЛЬЗУЯ АКТИВНОСТИ МНОЖЕСТВА КЛЕТОЧНЫХ СИГНАЛЬНЫХ ПУТЕЙ
МЕДИЦИНСКИЙ ПРОГНОЗ И ПРЕДСКАЗАНИЕ РЕЗУЛЬТАТОВ ЛЕЧЕНИЯ, ИСПОЛЬЗУЯ АКТИВНОСТИ МНОЖЕСТВА КЛЕТОЧНЫХ СИГНАЛЬНЫХ ПУТЕЙ
МЕДИЦИНСКИЙ ПРОГНОЗ И ПРЕДСКАЗАНИЕ РЕЗУЛЬТАТОВ ЛЕЧЕНИЯ, ИСПОЛЬЗУЯ АКТИВНОСТИ МНОЖЕСТВА КЛЕТОЧНЫХ СИГНАЛЬНЫХ ПУТЕЙ
МЕДИЦИНСКИЙ ПРОГНОЗ И ПРЕДСКАЗАНИЕ РЕЗУЛЬТАТОВ ЛЕЧЕНИЯ, ИСПОЛЬЗУЯ АКТИВНОСТИ МНОЖЕСТВА КЛЕТОЧНЫХ СИГНАЛЬНЫХ ПУТЕЙ
МЕДИЦИНСКИЙ ПРОГНОЗ И ПРЕДСКАЗАНИЕ РЕЗУЛЬТАТОВ ЛЕЧЕНИЯ, ИСПОЛЬЗУЯ АКТИВНОСТИ МНОЖЕСТВА КЛЕТОЧНЫХ СИГНАЛЬНЫХ ПУТЕЙ
МЕДИЦИНСКИЙ ПРОГНОЗ И ПРЕДСКАЗАНИЕ РЕЗУЛЬТАТОВ ЛЕЧЕНИЯ, ИСПОЛЬЗУЯ АКТИВНОСТИ МНОЖЕСТВА КЛЕТОЧНЫХ СИГНАЛЬНЫХ ПУТЕЙ
МЕДИЦИНСКИЙ ПРОГНОЗ И ПРЕДСКАЗАНИЕ РЕЗУЛЬТАТОВ ЛЕЧЕНИЯ, ИСПОЛЬЗУЯ АКТИВНОСТИ МНОЖЕСТВА КЛЕТОЧНЫХ СИГНАЛЬНЫХ ПУТЕЙ
Источник поступления информации: Роспатент

Showing 1-10 of 1,727 items.
20.09.2015
№216.013.7dbe

Вытяжная решетка

Настоящее изобретение относится к вытяжной решетке (10, 20, 30, 40). Вытяжная решетка выполнена в виде структуры, содержащей решетку расположенных с интервалами дефлекторов (15), которые образуют множество отдельных нелинейных каналов воздушного потока сквозь решетку. Решетка выполнена таким...
Тип: Изобретение
Номер охранного документа: 0002563787
Дата охранного документа: 20.09.2015
10.11.2015
№216.013.8b1d

Устройство для использования в блендере

Устройство для использования в блендере содержит установленное с возможностью вращения приспособление (10) для перемещения в пищевом продукте, подлежащем обработке при помощи блендера, и кожух (20) приспособления для частичного закрытия приспособления (10). Кожух (20) приспособления имеет форму...
Тип: Изобретение
Номер охранного документа: 0002567220
Дата охранного документа: 10.11.2015
20.12.2015
№216.013.9b53

Передача длины элемента кадра при кодировании аудио

Изобретение относится к кодированию аудиосигнала, в частности к передаче длины элемента кадра. Технический результат - повышение точности кодирования аудиосигнала. Для этого элементы кадра, которые должны быть сделаны доступными для пропуска, могут быть переданы более эффективно посредством...
Тип: Изобретение
Номер охранного документа: 0002571388
Дата охранного документа: 20.12.2015
20.01.2016
№216.013.a12a

Волновод

Изобретение относится к волноводу, который может быть деформирован в требуемую форму и зафиксирован в этой форме за счет полимеризации материала. Деформируемый волновод содержит гибкую подложку волновода и полимеризуемую часть, при этом полимеризуемая часть встроена в гибкую подложку...
Тип: Изобретение
Номер охранного документа: 0002572900
Дата охранного документа: 20.01.2016
27.02.2016
№216.014.c091

Широкополосная магнитно-резонансная спектроскопия в сильном статическом (b) магнитном поле с использованием переноса поляризации

Использование: для исследования объекта методом магнитного резонанса. Сущность изобретения заключается в том, что контроллер магнитного резонанса (MR), генерирующий статическое (B) магнитное поле 5 тесла или выше, сконфигурирован для управления MR-сканером для осуществления последовательности...
Тип: Изобретение
Номер охранного документа: 0002576342
Дата охранного документа: 27.02.2016
10.03.2016
№216.014.cac5

Магнитный резонанс, использующий квазинепрерывное рч излучение

Использование: для МР визуализации по меньшей мере части тела пациента. Сущность изобретения заключается в том, что воздействуют на часть тела последовательностью визуализации, содержащей по меньшей мере один РЧ импульс, причем РЧ импульс передают в направлении части тела через узел РЧ-катушки,...
Тип: Изобретение
Номер охранного документа: 0002577254
Дата охранного документа: 10.03.2016
20.02.2016
№216.014.ce92

Устройство для очистки газа

Изобретение относится к области очистки газа. Согласно изобретению предложено устройство для очистки газа, имеющее высокую эффективность очистки газа при любой относительной влажности. Это устройство содержит проход для потока газа; гидрофильный носитель, проницаемый для потока газа и...
Тип: Изобретение
Номер охранного документа: 0002575426
Дата охранного документа: 20.02.2016
20.02.2016
№216.014.cfae

Кодер аудио и декодер, имеющий гибкие функциональные возможности конфигурации

Изобретение относится к кодированию аудио-файлов с высоким качеством и низкой частотой следования битов. Технический результат заключается в оптимизации настроек конфигурации для всех канальных элементов одновременно. Технический результат достигается за счет считывания данных конфигурации для...
Тип: Изобретение
Номер охранного документа: 0002575390
Дата охранного документа: 20.02.2016
20.02.2016
№216.014.cfb2

Магнитно-резонансная спектроскопия с автоматической коррекцией фазы и в0 с использованием перемеженного эталонного сканирования воды

Использование: для исследования объекта посредством методики магнитного резонанса. Сущность изобретения заключается в том, что выполняется последовательность магнитного резонанса (MR), включающая в себя применение подготовительной подпоследовательности MR (S), обеспечивающей подавление сигнала...
Тип: Изобретение
Номер охранного документа: 0002575874
Дата охранного документа: 20.02.2016
20.06.2016
№217.015.0383

Матрица vcsel с повышенным коэффициентом полезного действия

Изобретение относится к лазерной технике. Матрица VCSEL содержит несколько VCSEL, расположенных рядом друг с другом на общей подложке (1). Каждый VCSEL образован, по меньшей мере, из верхнего зеркала (5, 14), активной области (4), слоя для инжекции тока (3) и нелегированного нижнего...
Тип: Изобретение
Номер охранного документа: 0002587497
Дата охранного документа: 20.06.2016
+ добавить свой РИД