×
26.10.2019
219.017.db7a

СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МОДИФИКАЦИИ ЦЕЛЕВОГО ЛОКУСА

Вид РИД

Изобретение

Юридическая информация Свернуть Развернуть
№ охранного документа
0002704283
Дата охранного документа
25.10.2019
Краткое описание РИД Свернуть Развернуть
Аннотация: Изобретение относится к биотехнологии и молекулярной биологии. Предложены способы и композиции для модификации одного или более целевых локусов в клетке. Такие способы включают обеспечение клетки, содержащей первый полинуклеотид, кодирующий первый селективный маркер, функционально связанный с первым активным в клетке промотором, причем первый полинуклеотид дополнительно содержит первый сайт распознавания для первого нуклеазного агента. В клетку вводят первый нуклеазный агент, причем первый нуклеазный агент индуцирует одно- или двухцепочечный разрыв на первом сайте распознавания. В клетку дополнительно вводят первый нацеливающий вектор, содержащий первую полинуклеотидную вставку, фланкированную первым и вторым гомологичными плечами, которые соответствуют первому и второму целевым сайтам, расположенным достаточно близко к первому сайту распознавания. Затем идентифицируют по меньшей мере одну клетку, содержащую в своем геноме первую полинуклеотидную вставку, интегрированную в целевой локус. Изобретение может быть использовано в медицине. 35 з.п. ф-лы, 3 ил., 2 табл.
Реферат Свернуть Развернуть

ПЕРЕКРЕСТНАЯ ССЫЛКА НА СМЕЖНЫЕ ЗАЯВКИ

Настоящая заявка испрашивает преимущество по предварительной заявке на патент США №62/008,832, поданной 6 июня 2014 г., и предварительной заявке на патент США №62/017,916, поданной 27 июня 2014 г., каждая из которых полностью включена в настоящий документ путем ссылки.

ОБЛАСТЬ ИЗОБРЕТЕНИЯ

Способы и композиции относятся к области молекулярной биологии. В частности, предложены способы и композиции для модификации целевого локуса в клетке.

КАК ТЕКСТОВЫЙ ФАЙЛ ЧЕРЕЗ EFS WEB

Официальная копия списка последовательностей представлена в электронном виде через EFS-Web в виде файла со списком последовательностей в формате ASCII с наименованием 461003SEQLIST.TXT, созданного 5 июня 2015 г., имеющего размер 5 Кб и поданного одновременно со спецификацией. Список последовательностей, содержащийся в данном документе в формате ASCII, является частью спецификации и полностью включен в настоящий документ путем ссылки.

ПРЕДПОСЫЛКИ СОЗДАНИЯ ИЗОБРЕТЕНИЯ

Гомологичная рекомбинация с использованием нацеливающих векторов, специально разработанных для добавления, удаления или замены конкретной нуклеотидной последовательности в геномном локусе, является популярным подходом к достижению желаемой геномной модификации в клетке. Для повышения эффективности гомологичной рекомбинации в целевом локусе можно использовать нуклеазу, специально сконструированную для введения одно- или двухцепочечного разрыва в целевом локусе, в комбинации с нацеливающим вектором.

Несмотря на то что за последние два десятилетия отмечался существенный прогресс в области нацеленных модификаций посредством гомологичной рекомбинации, по-прежнему остаются трудности в достижении приемлемой эффективности нацеливания с использованием нацеливающих векторов. Необходимы способы достижения нацеленных модификаций с улучшенной эффективностью и продуктивностью.

ИЗЛОЖЕНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

Предложены способы и композиции для модификации одного или более целевых локусов в клетке.

В некоторых вариантах осуществления предложены способы модификации целевого локуса в клетке, которые включают: (а) обеспечение клетки, содержащей целевой локус, который содержит первый полинуклеотид, кодирующий первый селективный маркер, функционально связанный с первым активным в клетке промотором, причем первый полинуклеотид дополнительно содержит первый сайт распознавания для первого нуклеазного агента, (b) введение в клетку (i) первого нуклеазного агента, при этом первый нуклеазный агент индуцирует одно- или двухцепочечный разрыв на первом сайте распознавания; и (ii) первого нацеливающего вектора, содержащего первую полинуклеотидную вставку, фланкированную первым и вторым гомологичными плечами, соответствующими первому и второму целевым сайтам, расположенным достаточно близко к первому сайту распознавания; и (с) идентификацию по меньшей мере одной клетки, содержащей первую полинуклеотидную вставку, интегрированную в целевой локус.

В некоторых вариантах осуществления способ модификации целевого локуса в клетке включает: (а) обеспечение клетки, содержащей первый целевой локус, который содержит первый полинуклеотид, кодирующий первый селективный маркер, функционально связанный с первым промотором, причем первый полинуклеотид дополнительно содержит первый сайт распознавания для первого нуклеазного агента, (b) введение в клетку: (i) одной или более экспрессионных конструкций, кодирующих первый нуклеазный агент, который функционально связан с активным в клетке промотором, при этом первый нуклеазный агент индуцирует одно- или двухцепочечный разрыв на первом сайте распознавания в первом полинуклеотиде, тем самым нарушая экспрессию или активность первого селективного маркера; и (ii) первого нацеливающего вектора, содержащего первую полинуклеотидную вставку, которая содержит второй полинуклеотид, кодирующий второй селективный маркер, функционально связанный со вторым промотором, при этом первая нуклеотидная вставка фланкирована первым и вторым гомологичными плечами, соответствующими первому и второму целевым сайтам, расположенным в первом целевом локусе; и (с) идентификацию модифицированной клетки, содержащей первую нуклеотидную вставку в первом целевом локусе, при этом модифицированная клетка обладает активностью второго селективного маркера, но не обладает активностью первого селективного маркера, и при этом первый и второй селективные маркеры являются разными.

В одном варианте осуществления целевой локус находится в геноме клетки. В другом варианте осуществления целевой локус расположен в векторе в клетке. В одном варианте осуществления одно- или двухцепочечный разрыв на первом сайте распознавания нарушает активность первого селективного маркера. В дополнительном варианте осуществления этап идентификации (с) включает культивирование клеток в условиях, позволяющих идентифицировать клетки, не обладающие активностью первого селективного маркера. В одном варианте осуществления первый полинуклеотид, содержащий первый селективный маркер, фланкирован первым целевым сайтом и вторым целевым сайтом. В одном варианте осуществления этап идентификации (с) включает идентификацию по меньшей мере одной клетки, содержащей первую полинуклеотидную вставку, интегрированную в первый и второй целевые сайты. В одном варианте осуществления первая полинуклеотидная вставка содержит: (а) первый интересующий полинуклеотид; и (b) второй полинуклеотид, кодирующий второй селективный маркер, функционально связанный со вторым активным в клетке промотором, причем второй полинуклеотид содержит второй сайт распознавания для второго нуклеазного агента.

В одном варианте осуществления способ дополнительно включает (а) введение в клетку, содержащую первую полинуклеотидную вставку, интегрированную в целевой локус, (i) второго нуклеазного агента, причем второй нуклеазный агент индуцирует одно- или двухцепочечный разрыв на втором сайте распознавания; и (ii) второго нацеливающего вектора, содержащего вторую полинуклеотидную вставку, фланкированную третьим и четвертым гомологичными плечами, соответствующими третьему и четвертому целевым сайтам, расположенным достаточно близко ко второму сайту распознавания; и (b) идентификацию по меньшей мере одной клетки, содержащей вторую полинуклеотидную вставку, интегрированную в целевой локус. В одном варианте осуществления одно- или двухцепочечный разрыв на втором сайте распознавания нарушает активность второго селективного маркера. В одном варианте осуществления этап идентификации (b) включает культивирование клетки в условиях, позволяющих идентифицировать клетки, не обладающие активностью второго селективного маркера. В одном варианте осуществления второй полинуклеотид, содержащий второй селективный маркер, фланкирован третьим целевым сайтом и четвертым целевым сайтом. В одном варианте осуществления этап идентификации (b) включает идентификацию по меньшей мере одной клетки, содержащей вторую полинуклеотидную вставку, интегрированную в третий и четвертый целевые сайты.

В одном варианте осуществления вторая полинуклеотидная вставка содержит: (а) второй интересующий полинуклеотид; и (b) третий полинуклеотид, кодирующий третий селективный маркер, функционально связанный с третьим активным в клетке промотором, причем третий полинуклеотид содержит третий сайт распознавания для третьего нуклеазного агента. В одном варианте осуществления первый нуклеазный агент отличается от второго нуклеазного агента. В одном варианте осуществления первый селективный маркер отличается от второго селективного маркера. В одном варианте осуществления первый и третий сайты распознавания нуклеазы идентичны друг другу и отличаются от второго сайта распознавания нуклеазы; и при этом первый и третий нуклеазные агенты идентичны друг другу и отличаются от второго нуклеазного агента. В одном варианте осуществления первый и третий селективные маркеры являются идентичными. В одном варианте осуществления один из первого, второго или третьего селективного маркера придает устойчивость к антибиотику. В одном варианте осуществления антибиотик представляет собой G418, гигромицин, бластицидин, неомицин или пуромицин. В одном варианте осуществления один из первого, второго или третьего селективного маркера функционально связан с индуцируемым промотором, и экспрессия селективного маркера является токсичной для клетки. В одном варианте осуществления первый, второй или третий селективный маркер содержит гипоксантингуанинфосфорибозилтрансферазу (HGPRT) или тимидинкиназу вируса простого герпеса (HSV-TK). В одном варианте осуществления указанная клетка представляет собой прокариотическую клетку. В одном варианте осуществления клетка представляет собой эукариотическую клетку. В одном варианте осуществления эукариотическая клетка представляет собой клетку млекопитающего. В одном варианте осуществления клетка млекопитающего представляет собой клетку не относящегося к человеку млекопитающего. В одном варианте осуществления клетка млекопитающего получена от грызуна. В одном варианте осуществления грызун представляет собой крысу или мышь.

В одном варианте осуществления клетка представляет собой плюрипотентную клетку. В одном варианте осуществления клетка млекопитающего представляет собой человеческую индуцированную плюрипотентную стволовую (ИПС) клетку. В одном варианте осуществления плюрипотентная клетка представляет собой не относящуюся к человеку эмбриональную стволовую (ЭС) клетку. В одном варианте осуществления плюрипотентная клетка представляет собой эмбриональную стволовую (ЭС) клетку мыши или эмбриональную стволовую (ЭС) клетку крысы. В одном варианте осуществления плюрипотентная клетка представляет собой гемопоэтическую стволовую клетку. В одном варианте осуществления плюрипотентная клетка представляет собой нейрональную стволовую клетку. В одном варианте осуществления клетка млекопитающего представляет собой фибробласт человека.

В одном варианте осуществления совместное использование первого нацеливающего вектора с первым нуклеазным агентом приводит к повышению эффективности нацеливания по сравнению с использованием только первого нацеливающего вектора. В одном варианте осуществления эффективность нацеливания первого нацеливающего вектора увеличивается по меньшей мере в 2 раза по сравнению с использованием только первого нацеливающего вектора.

В одном варианте осуществления первый или второй нуклеазный агент содержит экспрессионную конструкцию, содержащую нуклеотидную последовательность, кодирующую нуклеазный агент, и при этом нуклеиновая кислота функционально связана с четвертым активным в клетке промотором. В одном варианте осуществления первый или второй нуклеазный агент представляет собой мРНК, кодирующую нуклеазу. В одном варианте осуществления первый или второй нуклеазный агент представляет собой нуклеазу с «цинковыми пальцами» (ZFN). В одном варианте осуществления первый или второй нуклеазный агент представляет собой эффекторную нуклеазу, подобную активатору транскрипции (TALEN). В одном варианте осуществления первый или второй нуклеазный агент представляет собой мегануклеазу.

В одном варианте осуществления первый или второй нуклеазный агент содержит белок (Cas), ассоциированный с короткими палиндромными повторами, регулярно расположенными группами (CRISPR), и гидовую РНК (гРНК). В одном варианте осуществления гидовая РНК (гРНК) содержит (а) РНК коротких палиндромных повторов, регулярно расположенных группами (CRISPR) (крРНК), нацеленную на первый, второй или третий сайт распознавания; и (b) трансактивирующую РНК CRISPR (тракрРНК). В одном варианте осуществления первый или второй сайт распознавания непосредственно фланкирован последовательностью мотива, прилежащего к протоспейсеру (РАМ). В одном варианте осуществления интересующий геномный локус содержит нуклеотидную последовательность SEQ ID NO: 1. В одном варианте осуществления белок Cas представляет собой Cas9. В одном варианте осуществления гРНК содержит: (а) химерную РНК нуклеотидной последовательности SEQ ID NO: 2; или (b) химерную РНК нуклеотидной последовательности SEQ ID NO: 3. В одном варианте осуществления крРНК содержит SEQ ID NO: 4; SEQ ID NO: 5 или SEQ ID NO: 6. В одном варианте осуществления тракрРНК содержит SEQ ID NO: 7 или SEQ ID NO: 8.

В одном варианте осуществления первый, второй и/или третий сайт распознавания расположен в интроне, экзоне, промоторе, регуляторной области промотора или энхансерной области первого, второго или третьего селективного маркера. В одном варианте осуществления первый целевой сайт и второй целевой сайт непосредственно смежны с первым сайтом распознавания. В одном варианте осуществления первый целевой сайт и второй целевой сайт расположены на расстоянии от около 10 нуклеотидов до около 14 т.п.н. от первого сайта распознавания. В одном варианте осуществления третий целевой сайт и четвертый целевой сайт непосредственно смежны со вторым сайтом распознавания. В одном варианте осуществления третий целевой сайт и четвертый целевой сайт расположены на расстоянии от около 10 нуклеотидов до около 14 т.п.н. от второго сайта распознавания.

В одном варианте осуществления суммарная длина первого гомологичного плеча и второго гомологичного плеча составляет по меньшей мере около 10 т.п.н. В одном варианте осуществления суммарная длина третьего гомологичного плеча и четвертого гомологичного плеча составляет по меньшей мере около 10 т.п.н. В одном варианте осуществления длина первой полинуклеотидной вставки находится в диапазоне от около 5 т.п.н. до около 300 т.п.н. В одном варианте осуществления длина второй полинуклеотидной вставки находится в диапазоне от около 5 т.п.н. до около 300 т.п.н.

В одном варианте осуществления интеграция первой полинуклеотидной вставки в целевой локус приводит к нокауту, нокину, точечной мутации, перестановке доменов, перестановке экзонов, перестановке интронов, перестановке регуляторных последовательностей, перестановке генов или их комбинации. В одном варианте осуществления интеграция второй полинуклеотидной вставки в целевой локус приводит к нокауту, нокину, точечной мутации, перестановке доменов, перестановке экзонов, перестановке интронов, перестановке регуляторных последовательностей, перестановке генов или их комбинации.

В одном варианте осуществления первая полинуклеотидная вставка содержит интересующий полинуклеотид, который представляет собой человеческий полинуклеотид. В одном варианте осуществления вторая полинуклеотидная вставка содержит интересующий полинуклеотид, который представляет собой человеческий полинуклеотид. В одном варианте осуществления первая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий область локуса Т-клеточного альфа-рецептора.

В одном варианте осуществления вторая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий область локуса Т-клеточного альфа-рецептора. В одном варианте осуществления первая или вторая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий по меньшей мере один генный сегмент вариабельной области и/или генный сегмент соединительной области локуса Т-клеточного альфа-рецептора. В одном варианте осуществления область локуса Т-клеточного альфа-рецептора получена от человека.

В одном варианте осуществления первая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий нереаранжированную нуклеотидную последовательность вариабельной области тяжелой цепи человеческого иммуноглобулина, функционально связанную с нуклеотидной последовательностью константной области тяжелой цепи не относящегося к человеку иммуноглобулина.

В одном варианте осуществления этап идентификации выполняют посредством анализа определения модификации аллеля (МОА). В одном варианте осуществления первая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий нуклеотидную последовательность, которая является гомологичной или ортологичной нуклеотидной последовательности в геноме клетки. В одном варианте осуществления вторая полинуклеотидная вставка содержит нуклеотидную последовательность, которая является гомологичной или ортологичной нуклеотидной последовательности в геноме клетки. В одном варианте осуществления первая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий экзогенную нуклеотидную последовательность. В одном варианте осуществления вторая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий экзогенную нуклеотидную последовательность.

В некоторых вариантах осуществления способы модификации целевого локуса в клетке включают: (а) обеспечение клетки, содержащей первый целевой локус, который содержит нуклеиновую кислоту, кодирующую первый селективный маркер, функционально связанный с первым промотором; (b) введение в клетку (i) одной или более экспрессионных конструкций, кодирующих белок Cas, и первой гидовой РНК (гРНК), каждая из которых функционально связана с активным в клетке промотором, причем белок Cas индуцирует одно- или двухцепочечный разрыв на первом целевом сайте гРНК в первой нуклеиновой кислоте, тем самым нарушая экспрессию или активность первого селективного маркера, и (ii) первого нацеливающего вектора, содержащего первую нуклеотидную вставку, которая содержит вторую нуклеиновую кислоту, кодирующую второй селективный маркер, функционально связанный со вторым промотором, при этом первая нуклеотидная вставка фланкирована первым и вторым гомологичными плечами, соответствующими первому и второму целевым сайтам, расположенным в первом целевом локусе; и (с) идентификацию модифицированной клетки, содержащей первую нуклеотидную вставку в первом целевом локусе, при этом модифицированная клетка обладает активностью второго селективного маркера, но не обладает активностью первого селективного маркера, и при этом первый и второй селективные маркеры являются разными. В одном варианте осуществления не происходит гибридизации первой гРНК с первой нуклеотидной вставкой. В одном варианте осуществления интересующий целевой локус расположен в геноме клетки. В другом варианте осуществления интересующий целевой локус расположен в векторе в клетке. В одном варианте осуществления этап идентификации (с) включает культивирование клетки в условиях, позволяющих идентифицировать модифицированную клетку, обладающую активностью второго селективного маркера, но не обладающую активностью первого селективного маркера.

В одном варианте осуществления способ дополнительно включает (d) введение в модифицированную клетку, содержащую первую нуклеотидную вставку в первом целевом локусе, (i) одной или более нуклеиновых кислот, кодирующих белок Cas, и второй гРНК, каждая из которых функционально связана с промотором, активным в модифицированной клетке, причем белок Cas индуцирует одно- или двухцепочечный разрыв на втором целевом сайте гРНК в первой нуклеотидной вставке, содержащей вторую нуклеиновую кислоту, тем самым нарушая экспрессию или активность второго селективного маркера, и (ii) второго нацеливающего вектора, содержащего вторую нуклеотидную вставку, которая содержит третью нуклеиновую кислоту, кодирующую третий селективный маркер, функционально связанный с третьим промотором, при этом вторая нуклеотидная вставка фланкирована третьим и четвертым гомологичными плечами, соответствующими третьему и четвертому целевым сайтам, расположенным во втором целевом локусе; и (е) идентификацию второй модифицированной клетки, содержащей вторую нуклеотидную вставку во втором целевом локусе, при этом вторая модифицированная клетка обладает активностью третьего селективного маркера, но не обладает активностью второго селективного маркера, при этом второй и третий селективные маркеры являются разными. В одном варианте осуществления первый и второй целевые локусы непосредственно смежны друг с другом. В другом варианте осуществления первый или второй целевой локус расположен на расстоянии от около 10 нуклеотидов до около 14 т.п.н., от около 10 нуклеотидов до около 100 нуклеотидов, от около 100 нуклеотидов до около 500 нуклеотидов, от около 500 нуклеотидов до около 1000 нуклеотидов, от около 1 т.п.н. до около 5 т.п.н., от около 5 т.п.н. до около 10 т.п.н. или от около 10 т.п.н. до около 14 т.п.н. от первого или второго целевого сайта гРНК. В одном варианте осуществления не происходит гибридизации второй гРНК со второй нуклеотидной вставкой. В одном варианте осуществления этап идентификации (е) включает культивирование модифицированной клетки в условиях, позволяющих идентифицировать вторую модифицированную клетку, обладающую активностью третьего селективного маркера, но не обладающую активностью второго селективного маркера.

В одном варианте осуществления способ дополнительно включает (f) введение во вторую модифицированную клетку, содержащую вторую нуклеотидную вставку во втором целевом локусе: (i) одной или более экспрессионных конструкций, кодирующих белок Cas, и третьей гРНК, каждая из которых функционально связана с промотором, активным во второй модифицированной клетке, причем белок Cas индуцирует одно- или двухцепочечный разрыв на третьем целевом сайте гРНК во второй нуклеотидной вставке, содержащей третью нуклеиновую кислоту, тем самым нарушая экспрессию или активность третьего селективного маркера, и (ii) третьего нацеливающего вектора, содержащего третью нуклеотидную вставку, которая содержит четвертую нуклеиновую кислоту, кодирующую четвертый селективный маркер, функционально связанный с четвертым промотором, при этом третья нуклеотидная вставка фланкирована пятым и шестым гомологичными плечами, соответствующими пятому и шестому целевым сайтам, расположенным в третьем целевом локусе; и (g) идентификацию третьей модифицированной клетки, содержащей третью нуклеотидную вставку в третьем целевом локусе, при этом третья модифицированная клетка обладает активностью четвертого селективного маркера, но не обладает активностью третьего селективного маркера, при этом третий и четвертый селективные маркеры являются разными. В одном варианте осуществления второй и третий целевые локусы непосредственно смежны друг с другом. В другом варианте осуществления второй или третий целевой локус расположен на расстоянии от около 10 нуклеотидов до около 14 т.п.н. от первого или второго целевого сайта гРНК.

В одном варианте осуществления первый, второй, третий или четвертый маркер придает устойчивость к антибиотику. В одном варианте осуществления антибиотик представляет собой G418, гигромицин, бластицидин, неомицин или пуромицин. В одном варианте осуществления первый, второй, третий или четвертый селективный маркер содержит гипоксантингуанинфосфорибозилтрансферазу (HGPRT) или тимидинкиназу вируса простого герпеса (HSV-TK). В одном варианте осуществления первая, вторая или третья гРНК содержит (i) нуклеотидную последовательность, которая гибридизуется с первым, вторым или третьим целевым сайтом гРНК, и (ii) трансактивирующую РНК CRISPR (тракрРНК). В одном варианте осуществления первый, второй или третий целевой локус расположен в непосредственной близости к первому, второму или третьему целевому сайту гРНК так, что одно- или двухцепочечный разрыв на целевом сайте гРНК способствует гомологичной рекомбинации нацеливающего вектора в целевом локусе. В одном варианте осуществления белок Cas представляет собой Cas9. В одном варианте осуществления первый, второй или третий целевой сайт гРНК непосредственно фланкирован последовательностью мотива, прилежащего к протоспейсеру (РАМ).

В одном варианте осуществления клетка представляет собой прокариотическую клетку. В другом варианте осуществления клетка представляет собой эукариотическую клетку. В одном варианте осуществления эукариотическая клетка представляет собой клетку млекопитающего. В одном варианте осуществления клетка млекопитающего представляет собой клетку-фибробласт. В одном варианте осуществления клетка млекопитающего представляет собой клетку-фибробласт человека. В одном варианте осуществления клетка млекопитающего представляет собой клетку не относящегося к человеку млекопитающего. В одном варианте осуществления клетка млекопитающего получена от грызуна. В одном варианте осуществления грызун представляет собой крысу, мышь или хомяка.

В одном варианте осуществления эукариотическая клетка представляет собой плюрипотентную клетку. В одном варианте осуществления плюрипотентная клетка представляет собой гемопоэтическую стволовую клетку или нейрональную стволовую клетку. В одном варианте осуществления плюрипотентная клетка представляет собой человеческую индуцированную плюрипотентную стволовую (ИПС) клетку. В одном варианте осуществления плюрипотентная клетка представляет собой эмбриональную стволовую (ЭС) клетку мыши или эмбриональную стволовую (ЭС) клетку крысы.

В одном варианте осуществления первый, второй или третий целевой сайт гРНК расположен в интроне, экзоне, промоторе или регуляторной области промотора в первой, второй или третьей нуклеиновой кислоте, которая кодирует первый, второй или третий селективный маркер. В одном варианте осуществления длина первого, второго или третьего нацеливающего вектора составляет по меньшей мере около 10 т.п.н. В одном варианте осуществления длина первой, второй или третьей нуклеотидной вставки находится в диапазоне от около 5 т.п.н. до около 300 т.п.н.

В одном варианте осуществления первая, вторая или третья нуклеотидная вставка содержит геномную область локуса Т-клеточного альфа-рецептора человека. В одном варианте осуществления геномная область содержит по меньшей мере один генный сегмент вариабельной области и/или генный сегмент соединительной области локуса Т-клеточного альфа-рецептора человека.

В одном варианте осуществления первый и третий селективные маркеры являются одинаковыми. В одном варианте осуществления первый и третий селективные маркеры являются одинаковыми, и второй и четвертый селективные маркеры являются одинаковыми. В одном варианте осуществления первая и третья гРНК являются одинаковыми.

Дополнительно предложены способы и композиции для модификации целевого локуса в клетке. Такие способы включают обеспечение клетки, содержащей целевой локус, который содержит первый полинуклеотид, кодирующий первый селективный маркер, функционально связанный с первым активным в клетке промотором, причем первый полинуклеотид дополнительно содержит первый сайт распознавания для первого нуклеазного агента. Первый нуклеазный агент вводят в клетку, в которой первый нуклеазный агент индуцирует одно- или двухцепочечный разрыв на первом сайте распознавания. В клетку дополнительно вводят первый нацеливающий вектор, содержащий первую полинуклеотидную вставку, фланкированную первым и вторым гомологичными плечами, которые соответствуют первому и второму целевым сайтам, расположенным достаточно близко к первому сайту распознавания. Затем идентифицируют по меньшей мере одну клетку, содержащую первую полинуклеотидную вставку, интегрированную в целевой локус.

Также предложены способы модификации целевого локуса в клетке, включающие: (а) обеспечение клетки, содержащей целевой локус, который содержит первый полинуклеотид, кодирующий первый селективный маркер, функционально связанный с первым активным в клетке промотором, причем первый полинуклеотид дополнительно содержит первый сайт распознавания для первого нуклеазного агента, (b) введение в клетку (i) первого нуклеазного агента, при этом первый нуклеазный агент индуцирует одно- или двухцепочечный разрыв на первом сайте распознавания; и (ii) первого нацеливающего вектора, содержащего первую полинуклеотидную вставку, фланкированную первым и вторым гомологичными плечами, соответствующими первому и второму целевым сайтам, расположенным достаточно близко к первому сайту распознавания; и (с) идентификацию по меньшей мере одной клетки, содержащей первую полинуклеотидную вставку, интегрированную в целевой локус. В одном варианте осуществления целевой локус находится в геноме клетки. В другом варианте осуществления целевой локус расположен в векторе в клетке. В одном варианте осуществления одно- или двухцепочечный разрыв на первом сайте распознавания нарушает активность первого селективного маркера. В дополнительном варианте осуществления этап идентификации (с) включает культивирование клеток в условиях, позволяющих идентифицировать клетки, не обладающие активностью первого селективного маркера. В одном варианте осуществления первый полинуклеотид, содержащий первый селективный маркер, фланкирован первым целевым сайтом и вторым целевым сайтом. В одном варианте осуществления этап идентификации (с) включает идентификацию по меньшей мере одной клетки, содержащей первую полинуклеотидную вставку, интегрированную в первый и второй целевые сайты. В одном варианте осуществления первая полинуклеотидная вставка содержит: (а) первый интересующий полинуклеотид; и (b) второй полинуклеотид, кодирующий второй селективный маркер, функционально связанный со вторым активным в клетке промотором, причем второй полинуклеотид содержит второй сайт распознавания для второго нуклеазного агента.

В одном варианте осуществления способ дополнительно включает (а) введение в клетку, содержащую первую полинуклеотидную вставку, интегрированную в целевой локус, (i) второго нуклеазного агента, причем второй нуклеазный агент индуцирует одно- или двухцепочечный разрыв на втором сайте распознавания; и (ii) второго нацеливающего вектора, содержащего вторую полинуклеотидную вставку, фланкированную третьим и четвертым гомологичными плечами, соответствующими третьему и четвертому целевым сайтам, расположенным достаточно близко ко второму сайту распознавания; и (b) идентификацию по меньшей мере одной клетки, содержащей вторую полинуклеотидную вставку, интегрированную в целевой локус. В одном варианте осуществления одно- или двухцепочечный разрыв на втором сайте распознавания нарушает активность второго селективного маркера. В одном варианте осуществления этап идентификации (b) включает культивирование клетки в условиях, позволяющих идентифицировать клетки, не обладающие активностью второго селективного маркера. В одном варианте осуществления второй полинуклеотид, содержащий второй селективный маркер, фланкирован третьим целевым сайтом и четвертым целевым сайтом. В одном варианте осуществления этап идентификации (b) включает идентификацию по меньшей мере одной клетки, содержащей вторую полинуклеотидную вставку, интегрированную в третий и четвертый целевые сайты. В одном варианте осуществления вторая полинуклеотидная вставка содержит: (а) второй интересующий полинуклеотид; и (b) третий полинуклеотид, кодирующий третий селективный маркер, функционально связанный с третьим активным в клетке промотором, причем третий полинуклеотид содержит третий сайт распознавания для третьего нуклеазного агента. В одном варианте осуществления первый нуклеазный агент отличается от второго нуклеазного агента. В одном варианте осуществления первый селективный маркер отличается от второго селективного маркера. В одном варианте осуществления первый и третий сайты распознавания нуклеазы идентичны друг другу и отличаются от второго сайта распознавания нуклеазы; и при этом первый и третий нуклеазные агенты идентичны друг другу и отличаются от второго нуклеазного агента. В одном варианте осуществления первый и третий селективные маркеры являются идентичными. В одном варианте осуществления один из первого, второго или третьего селективного маркера придает устойчивость к антибиотику. В одном варианте осуществления антибиотик представляет собой G418, гигромицин, бластицидин, неомицин или пуромицин. В одном варианте осуществления один из первого, второго или третьего селективного маркера функционально связан с индуцируемым промотором, и экспрессия селективного маркера является токсичной для клетки. В одном варианте осуществления первый, второй или третий селективный маркер содержит гипоксантингуанинфосфорибозилтрансферазу (HGPRT) или тимидинкиназу вируса простого герпеса (HSV-TK). В одном варианте осуществления указанная клетка представляет собой прокариотическую клетку. В одном варианте осуществления клетка представляет собой эукариотическую клетку. В одном варианте осуществления эукариотическая клетка представляет собой клетку млекопитающего. В одном варианте осуществления клетка млекопитающего представляет собой клетку не относящегося к человеку млекопитающего. В одном варианте осуществления клетка млекопитающего получена от грызуна. В одном варианте осуществления грызун представляет собой крысу или мышь. В одном варианте осуществления клетка млекопитающего представляет собой фибробласт человека.

В одном варианте осуществления клетка представляет собой плюрипотентную клетку. В одном варианте осуществления клетка млекопитающего представляет собой человеческую индуцированную плюрипотентную стволовую (ИПС) клетку. В одном варианте осуществления плюрипотентная клетка представляет собой не относящуюся к человеку эмбриональную стволовую (ЭС) клетку. В одном варианте осуществления плюрипотентная клетка представляет собой эмбриональную стволовую (ЭС) клетку мыши или эмбриональную стволовую (ЭС) клетку крысы. В одном варианте осуществления плюрипотентная клетка представляет собой гемопоэтическую стволовую клетку. В одном варианте осуществления плюрипотентная клетка представляет собой нейрональную стволовую клетку.

В одном варианте осуществления совместное использование первого нацеливающего вектора с первым нуклеазным агентом приводит к повышению эффективности нацеливания по сравнению с использованием только первого нацеливающего вектора. В одном варианте осуществления эффективность нацеливания первого нацеливающего вектора увеличивается по меньшей мере в 2 раза по сравнению с использованием только первого нацеливающего вектора.

В одном варианте осуществления первый или второй нуклеазный агент содержит экспрессионную конструкцию, содержащую нуклеотидную последовательность, кодирующую нуклеазный агент, и нуклеиновая кислота функционально связана с четвертым активным в клетке промотором. В одном варианте осуществления первый или второй нуклеазный агент представляет собой мРНК, кодирующую нуклеазу. В одном варианте осуществления первый или второй нуклеазный агент представляет собой нуклеазу с «цинковыми пальцами» (ZFN). В одном варианте осуществления первый или второй нуклеазный агент представляет собой эффекторную нуклеазу, подобную активатору транскрипции (TALEN). В одном варианте осуществления первый или второй нуклеазный агент представляет собой мегануклеазу.

В одном варианте осуществления первый или второй нуклеазный агент содержит белок (Cas), ассоциированный с короткими палиндромными повторами, регулярно расположенными группами (CRISPR), и гидовую РНК (гРНК). В одном варианте осуществления гидовая РНК (гРНК) содержит (а) РНК коротких палиндромных повторов, регулярно расположенных группами (CRISPR) (крРНК), нацеленную на первый, второй или третий сайт распознавания; и (b) трансактивирующую РНК CRISPR (тракрРНК). В одном варианте осуществления первый или второй сайт распознавания непосредственно фланкирован последовательностью мотива, прилежащего к протоспейсеру (РАМ). В одном варианте осуществления интересующий геномный локус содержит нуклеотидную последовательность SEQ ID NO: 1. В одном варианте осуществления белок Cas представляет собой Cas9. В одном варианте осуществления гРНК содержит: (а) химерную РНК нуклеотидной последовательности SEQ ID NO: 2; или (b) химерную РНК нуклеотидной последовательности SEQ ID NO: 3. В одном варианте осуществления крРНК содержит SEQ ID NO: 4; SEQ ID NO: 5 или SEQ ID NO: 6. В одном варианте осуществления тракрРНК содержит SEQ ID NO: 7 или SEQ ID NO: 8. В одном варианте осуществления первый, второй и/или третий сайт распознавания расположен в интроне, экзоне, промоторе, регуляторной области промотора или энхансерной области первого, второго или третьего селективного маркера. В одном варианте осуществления первый целевой сайт и второй целевой сайт непосредственно смежны с первым сайтом распознавания. В одном варианте осуществления первый целевой сайт и второй целевой сайт расположены на расстоянии от около 10 нуклеотидов до около 14 т.п.н. от первого сайта распознавания. В одном варианте осуществления третий целевой сайт и четвертый целевой сайт непосредственно смежны со вторым сайтом распознавания. В одном варианте осуществления третий целевой сайт и четвертый целевой сайт расположены на расстоянии от около 10 нуклеотидов до около 14 т.п.н. от второго сайта распознавания. В одном варианте осуществления суммарная длина первого гомологичного плеча и второго гомологичного плеча составляет по меньшей мере около 10 т.п.н. В одном варианте осуществления суммарная длина третьего гомологичного плеча и четвертого гомологичного плеча составляет по меньшей мере около 10 т.п.н. В одном варианте осуществления длина первой полинуклеотидной вставки находится в диапазоне от около 5 т.п.н. до около 300 т.п.н. В одном варианте осуществления длина второй полинуклеотидной вставки находится в диапазоне от около 5 т.п.н. до около 300 т.п.н. В одном варианте осуществления интеграция первой полинуклеотидной вставки в целевой локус приводит к нокауту, нокину, точечной мутации, перестановке доменов, перестановке экзонов, перестановке интронов, перестановке регуляторных последовательностей, перестановке генов или их комбинации. В одном варианте осуществления интеграция второй полинуклеотидной вставки в целевой локус приводит к нокауту, нокину, точечной мутации, перестановке доменов, перестановке экзонов, перестановке интронов, перестановке регуляторных последовательностей, перестановке генов или их комбинации. В одном варианте осуществления первая полинуклеотидная вставка содержит интересующий полинуклеотид, который представляет собой человеческий полинуклеотид. В одном варианте осуществления вторая полинуклеотидная вставка содержит интересующий полинуклеотид, который представляет собой человеческий полинуклеотид. В одном варианте осуществления первая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий область локуса Т-клеточного альфа-рецептора. В одном варианте осуществления вторая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий область локуса Т-клеточного альфа-рецептора. В одном варианте осуществления первая или вторая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий по меньшей мере один генный сегмент вариабельной области и/или генный сегмент соединительной области локуса Т-клеточного альфа-рецептора. В одном варианте осуществления область локуса Т-клеточного альфа-рецептора получена от человека. В одном варианте осуществления первая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий нереаранжированную нуклеотидную последовательность вариабельной области тяжелой цепи человеческого иммуноглобулина, функционально связанную с нуклеотидной последовательностью константной области тяжелой цепи не относящегося к человеку иммуноглобулина. В одном варианте осуществления этап идентификации выполняют посредством анализа определения модификации аллеля (МОА). В одном варианте осуществления первая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий нуклеотидную последовательность, которая является гомологичной или ортологичной нуклеотидной последовательности в геноме клетки. В одном варианте осуществления вторая полинуклеотидная вставка содержит нуклеотидную последовательность, которая является гомологичной или ортологичной нуклеотидной последовательности в геноме клетки. В одном варианте осуществления первая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий экзогенную нуклеотидную последовательность. В одном варианте осуществления вторая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий экзогенную нуклеотидную последовательность.

КРАТКОЕ ОПИСАНИЕ РИСУНКОВ

На Фиг. 1 представлена схема события геномного нацеливания, при котором на клетку, имеющую гетерозиготную модификацию локуса TCR-альфа на мышиной хромосоме 14, один аллель, которой гуманизирован аллелем А-neo TCR-альфа, содержащим кассету селекции неомицином, расположенную выше восьми человеческих вариабельных (V) сегментов гена и 61 человеческого соединительного (J) сегмента гена, оказывают целевое воздействие нацеливающим вектором аллеля B-hyg гуманизированного TCR-альфа, содержащим кассету селекции гигромицином и фрагмент из более чем 100 т.п.н., который содержит 11 дополнительных человеческих вариабельных сегментов гена. Электропорация нацеливающего вектора аллеля B-hyg и плазмид, экспрессирующих две половины пары нуклеазы с «цинковыми пальцами» (ZFN), которая оказывает целевое воздействие на кассету неомицина в аллеле А-neo TCR-альфа, обеспечивала создание модифицированного локуса TCR-альфа (аллель B-hyg), содержащего в направлении от 5' к 3' кассету гигромицина, 19 человеческих V-сегментов гена и 61 человеческий J-сегмент гена, расположенного выше эндогенной нуклеотидной последовательности константной области. Событие нацеливания обеспечивало точную вставку более чем 100 т.п.н. человеческой последовательности гена TCR-альфа в мышиный локус TCR-альфа.

На Фиг. 2 представлена схема события геномного нацеливания, при котором на клетку, имеющую гетерозиготную модификацию локуса TCR-альфа на мышиной хромосоме 14, один аллель которой гуманизирован аллелем B-hyg TCR-альфа, содержащим кассету селекции гигромицином, расположенную выше 19 человеческих V-сегментов гена и 61 человеческого J-сегмента гена, оказывают целевое воздействие нацеливающим вектором аллеля С-neo гуманизированного TCR-альфа, содержащим кассету селекции неомицином и фрагмент из более чем 100 т.п.н., который содержит 11 дополнительных человеческих вариабельных сегментов гена. Электропорация нацеливающего вектора аллеля С-neo и плазмид, экспрессирующих две половины пары нуклеазы с «цинковыми пальцами» (ZFN), которая оказывает целевое воздействие на кассету гигромицина в аллеле B-hyg TCR-альфа, обеспечивала создание модифицированного локуса TCR-альфа (аллель С-neo), содержащего в направлении от 5' к 3' кассету неомицина, 30 человеческих V-сегментов гена и 61 человеческий J-сегмент гена, расположенного выше эндогенной нуклеотидной последовательности константной области. Событие нацеливания обеспечивало точную вставку более чем 100 т.п.н. человеческой последовательности гена TCR-альфа в мышиный локус TCR-альфа.

На Фиг. 3 представлена схема кассет селекции лекарственными средствами: neor которая кодирует неомицинфосфотрансферазу, и hygr, которая кодирует гигромицин-В-фосфотрансферазу. Положения сайтов распознавания (последовательности представлены ниже) для нуклеаз с «цинковыми пальцами» (ZFN, Фиг. 3А) Neo-ZFN(1,2) и Neo-ZFN(3,4), которые нацелены на neor и нуклеаз с «цинковыми пальцами» Hyg-ZFN(1,2) и Hyg-ZFN(3,4) (Фиг. 3В), которые нацелены на hyg, обозначены заштрихованными прямоугольниками выше или ниже жирных стрелок, представляющих кодирующие последовательности соответствующих фосфотрансфераз.

ПОДРОБНОЕ ОПИСАНИЕ

Далее представлено подробное описание настоящих изобретений со ссылками на прилагаемые рисунки, на которых указаны некоторые, но не все варианты осуществления изобретения. Действительно, эти изобретения могут быть осуществлены во многих различных формах и не должны быть истолкованы как ограничивающие варианты осуществления, изложенные в настоящем документе; скорее, эти варианты осуществления предложены для того, чтобы описание удовлетворяло применимым правовым требованиям. Для указания одинаковых элементов используются одинаковые числа.

Специалисту в данной области будут ясны многие модификации и другие варианты осуществления представленных в настоящем документе изобретений, имеющих преимущества идей, представленных в изобретениях ниже и связанных рисунках. Таким образом, следует понимать, что изобретение не должно быть ограничено конкретными описанными вариантами осуществления и что модификации и другие варианты осуществления включены в объем приложенных пунктов формулы изобретения. Хотя в настоящем документе используются конкретные термины, они применяются только в общем и описательном смысле, а не для целей ограничения.

I. Общее описание

Предложены способы и композиции для модификации целевого локуса, например геномного локуса, в клетке. В способах и композициях используются нуклеазные агенты и сайты распознавания нуклеазных агентов для усиления событий гомологичной рекомбинации полинуклеотидной вставки в целевой локус. Различные способы и композиции, предлагаемые в настоящем документе, стратегически обнаруживают сайт распознавания нуклеазного агента в полинуклеотиде, кодирующем селективный маркер, репортер или экзогенный белок (например, eGFP или человеческую последовательность в клетке мыши).

Дополнительно предложены способы, которые позволяют проводить последовательную модификацию (т.е. мозаичное заполнение) интересующих полинуклеотидов в целевом локусе (т.е. в геномном локусе). Как описано более подробно ниже, предложены способы последовательного мозаичного заполнения интересующими полинуклеотидами целевого локуса (т.е. геномного локуса), в которых в целевом локусе (т.е. геномном локусе) и различных нацеливающих векторах, используемых в способе, чередуется применение первого селективного маркера, содержащего первый сайт распознавания для первого нуклеазного агента, и второго селективного маркера, содержащего второй сайт распознавания для второго нуклеазного агента. Благодаря такому подходу, в способе не требуется постоянное снабжение нуклеазами, сконструированными для распознавания новых сайтов распознавания. Вместо этого в конкретных вариантах осуществления для целевого последовательного мозаичного заполнения необходимы только два нуклеазных агента и соответствующий сайт распознавания двух нуклеазных агентов. Кроме того, поскольку нуклеазные агенты нацелены на экзогенные последовательности (т.е. сайт распознавания внутри полинуклеотида, кодирующего селективный маркер) и поскольку эффективность и нецелевое влияние любого данного сайта распознавания будут предварительно подтверждены, неспецифическое расщепление эндогенной геномной последовательности может быть сведено к минимуму с одновременным увеличением временной и экономической эффективности процесса мозаичного заполнения.

II. Система нацеленной интеграции

Предложены способы и композиции для модификации целевого локуса в клетке. В системе используются нуклеазные агенты, сайты распознавания для нуклеазных агентов, целевой локус, селективные маркеры, нацеливающие векторы и полинуклеотидные вставки. Каждый из этих компонентов описан более подробно ниже.

А. Нуклеазные агенты и сайты распознавания для нуклеазных агентов

Термин «сайт распознавания для нуклеазного агента» включает последовательность ДНК, в которой нуклеазный агент индуцирует одно- или двухцепочечный разрыв. Сайт распознавания для нуклеазного агента может быть эндогенным (или нативным) по отношению к клетке, или сайт распознавания может быть экзогенным по отношению к клетке. В конкретных вариантах осуществления сайт распознавания является экзогенным по отношению к клетке и, таким образом, не встречается в геноме клетки в природе. В еще дополнительных вариантах осуществления сайт распознавания является эндогенным по отношению к клетке и интересующим полинуклеотидам, которые необходимо разместить в целевом локусе. В дополнительных вариантах осуществления экзогенный или эндогенный сайт распознавания присутствует в геноме клетки-хозяина только один раз. В конкретных вариантах осуществления идентифицирован эндогенный или нативный сайт, который присутствует в геноме только один раз. Впоследствии такой сайт может быть использован для конструирования нуклеазных агентов, которые будут создавать на эндогенном сайте распознавания одно- или двухцепочечный разрыв.

Длина сайта распознавания может изменяться и, например, включает сайты распознавания для пары нуклеаз с «цинковыми пальцами» (ZFN) длиной около 30-36 п.н. (т.е. около 15-18 п.н. для каждой ZFN), для эффекторной нуклеазы, подобной активатору транскрипции (TALEN), длиной около 36 п.н. или для гидовой РНК CRISPR/Cas9 длиной около 20 п.н.

В описанных в настоящем документе способах и композициях может использоваться любой нуклеазный агент, который индуцирует одно- или двухцепочечный разрыв в заданном сайте распознавания. Встречающийся в природе или нативный нуклеазный агент может использоваться при условии, что нуклеазный агент индуцирует в заданном сайте распознавания одно- или двухцепочечный разрыв. В альтернативном варианте осуществления может использоваться модифицированный или сконструированный нуклеазный агент.«Сконструированный нуклеазный агент» включает нуклеазу, сконструированную (модифицированную или производную) из ее нативной формы для того, чтобы она специфически распознавала и индуцировала одно- или двухцепочечный разрыв в заданном сайте распознавания. Таким образом, сконструированный нуклеазный агент может быть получен из нативного встречающегося в природе нуклеазного агента, или он может быть создан или синтезирован искусственно. Модификация нуклеазного агента может быть незначительной, например представлять собой модификацию одной аминокислоты в агенте расщепления белка или одного нуклеотида в агенте расщепления нуклеиновой кислоты. В некоторых вариантах осуществления сконструированная нуклеаза индуцирует одно- или двухцепочечный разрыв в сайте распознавания, причем сайт распознавания не является последовательностью, которая могла бы быть распознана нативным (не сконструированным или не модифицированным) нуклеазный агентом. Создание одно- или двухцепочечного разрыва в сайте распознавания или другой ДНК в настоящем документе может называться «разрезанием» или «расщеплением» сайта распознавания или другой ДНК.

Также представлены активные варианты и фрагменты сайтов распознавания, приведенных в качестве примера. Идентичность последовательности таких активных вариантов данному сайту распознавания составляет по меньшей мере 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, причем активные варианты сохраняют биологическую активность и, следовательно, могут распознаваться и расщепляться нуклеазный агентом последовательность-специфическим образом. Анализы измерения двухцепочечного разрыва сайта распознавания посредством нуклеазного агента известны в данной области (например, из публикации TaqMan® qPCR assay, Frendewey D. et al., Methods in Enzymology, 2010, 476: 295-307, которая включена в настоящий документ путем ссылки в полном объеме).

В конкретных вариантах осуществления сайт распознавания расположен внутри полинуклеотида, кодирующего селективный маркер. Такое положение может находиться в пределах кодирующей области селективного маркера или в пределах регуляторных областей, оказывающих влияние на экспрессию селективного маркера. Таким образом, сайт распознавания нуклеазного агента может быть расположен в интроне селективного маркера, промоторе, энхансере, регуляторной области или любой не кодирующей белок области полинуклеотида, кодирующего селективный маркер. В конкретных вариантах осуществления одно- или двухцепочечный разрыв на сайте распознавания нарушает активность селективного маркера. Известны методы анализа на наличие или отсутствие функционального селективного маркера.

В одном варианте осуществления нуклеазный агент представляет собой эффекторную нуклеазу, подобную активатору транскрипции (TALEN). TAL-эффекторные нуклеазы представляют собой класс последовательность-специфических нуклеаз, которые можно использовать для выполнения двухцепочечных разрывов на специфических целевых последовательностях в геноме прокариотического или эукариотического организма. TAL-эффекторные нуклеазы создают путем слияния нативного или сконструированного эффектора, подобного активатору транскрипции (TAL), или его функциональной части с каталитическим доменом эндонуклеазы, например FokI. Уникальный модульный TAL-эффекторный ДНК-связывающий домен обеспечивает конструирование белков с потенциально любой заданной специфичностью распознавания ДНК. Таким образом, для распознавания целевых сайтов со специфической ДНК могут быть сконструированы ДНК-связывающие домены TAL-эффекторных нуклеаз, и, таким образом, их можно использовать для двухцепочечных разрывов на заданных целевых последовательностях. См., WO 2010/079430; Morbitzer et al. (2010) PNAS 10.1073/pnas.1013133107; Scholze & Boch (2010) Virulence 1: 428-432; Christian et al. Genetics (2010) 186: 757-761; Li et al. (2010) Nuc. Acids Res. (2010) doi:10.1093/nar/gkq704; и Miller et al. (2011) Nature Biotechnology 29: 143-148; все из которых полностью включены в настоящий документ путем ссылки.

Примеры подходящих TAL-нуклеаз и способы получения подходящих TAL-нуклеаз описаны, например, в заявках на патент США №№2011/0239315 А1, 2011/0269234 А1, 2011/0145940 А1, 2003/0232410 А1, 2005/0208489 А1, 2005/0026157 А1, 2005/0064474 А1, 2006/0188987 А1 и 2006/0063231 А1 (каждая включена в настоящий документ путем ссылки). В различных вариантах осуществления сконструированы TAL-эффекторные нуклеазы, которые «выполняют разрез» в целевой нуклеотидной последовательности или возле нее, например, в интересующем локусе или интересующем геномном локусе, в котором целевая нуклеотидная последовательность находится на последовательности, подлежащей модификации посредством нацеливающего вектора, или возле нее. TAL-нуклеазы, подходящие для использования с различными способами и композициями, предложенными в настоящем документе, включают те, которые специфически разработаны для связывания на целевой нуклеотидной последовательности, подлежащей модификации посредством нацеливающих векторов, или возле нее, как описано в настоящем документе.

В одном варианте осуществления каждый мономер TALEN содержит 33-35 повторов TAL, которые распознают одну пару нуклеотидов с помощью двух гипервариабельных остатков. В одном варианте осуществления нуклеазный агент представляет собой химерный белок, содержащий ДНК-связывающий домен на основе TAL-повторов, функционально связанный с независимой нуклеазой. В одном варианте осуществления независимая нуклеаза представляет собой эндонуклеазу FokI. В одном варианте осуществления нуклеазный агент содержит первый ДНК-связывающий домен на основе TAL-повторов и второй ДНК-связывающий домен на основе TAL-повторов, причем каждый из первого и второго ДНК-связывающего домена на основе TAL-повторов функционально связан с субъединицей нуклеазы FokI, при этом первый и второй ДНК-связывающие домены на основе TAL-повторов распознают две смежные целевые последовательности ДНК в каждой цепи целевой последовательности ДНК, разделенные последовательностью спейсера различной длины (12-20 п.н.), и при этом субъединицы нуклеазы FokI димеризуются для создания активной нуклеазы, которая выполняет двухцепочечный разрыв на целевой последовательности.

Нуклеазный агент, используемый в различных способах и композициях, описанных в настоящем документе, может дополнительно содержать нуклеазу с «цинковыми пальцами» (ZFN). В одном варианте осуществления каждый мономер ZFN содержит 3 или более ДНК-связывающих доменов на основе «цинковых пальцев», причем каждый ДНК-связывающий домен на основе «цинковых пальцев» связывается с субсайтом из 3 п.н. В других вариантах осуществления ZFN представляет собой химерный белок, содержащий ДНК-связывающий домен на основе «цинковых пальцев», функционально связанный с независимой нуклеазой. В одном варианте осуществления независимая эндонуклеаза представляет собой эндонуклеазу FokI. В одном варианте осуществления нуклеазный агент содержит первую ZFN и вторую ZFN, причем каждая из первой ZFN и второй ZFN функционально связана с субъединицей нуклеазы FokI, при этом первая и вторая ZFN распознают две смежные целевые последовательности ДНК в каждой цепи целевой последовательности ДНК, разделенные спейсером длиной около 5 - 7 п.н., и при этом субъединицы нуклеазы FokI димеризуются для создания активной нуклеазы, которая выполняет двухцепочечный разрыв. См., например, US 20060246567; US 20080182332; US 20020081614; US 20030021776; WO/2002/057308 A2; US 20130123484; US 20100291048; WO/2011/017293 А2; и Gaj et al. (2013) Trends in Biotechnology, 31(7): 397-405, каждая из которых полностью включена в настоящий документ путем ссылки.

В еще одном варианте осуществления нуклеазный агент представляет собой мегануклеазу. Мегануклеазы были разделены на четыре семейства на основе консервативных мотивов последовательностей, семейства представляют собой LAGLIDADG, GIY-YIG, H-N-H и His-Cys box. Эти мотивы участвуют в координации ионов металлов и гидролизе фосфодиэфирных связей. Мегануклеазы отличаются своими длинными сайтами распознавания и допуском некоторых видов полиморфизма последовательностей в их ДНК-субстратах. Известны домены, структура и функция мегануклеазы, см., например, Guhan and Muniyappa (2003) Crit Rev Biochem Mol Biol 38: 199-248; Lucas et al., (2001) Nucleic Acids Res 29: 960-9; Jurica and Stoddard, (1999) Cell Mol Life Sci 55: 1304-26; Stoddard, (2006) Q Rev Biophys 38: 49-95; и Moure et al., (2002) Nat Struct Biol 9: 764. В некоторых примерах используют встречающийся в природе вариант и/или сконструированное производное мегануклеазы. Известны способы модификации кинетики, взаимодействий кофакторов, экспрессии, оптимальных условий и/или специфичности сайта распознавания и скрининга в отношении активности, см., например, Epinat et al., (2003) Nucleic Acids Res 31: 2952-62; Chevalier et al., (2002) Mol Cell 10: 895-905; Gimble et al., (2003) Mol Biol 334: 993-1008; Seligman et al., (2002) Nucleic Acids Res 30: 3870-9; Sussman et al., (2004) J Mol Biol 342: 31-41; Rosen et al., (2006) Nucleic Acids Res 34: 4791-800; Chames et al., (2005) Nucleic Acids Res 33: e178; Smith et al., (2006) Nucleic Acids Res 34: e149; Gruen et al., (2002) Nucleic Acids Res 30: e29; Chen and Zhao, (2005) Nucleic Acids Res 33: e154; WO 2005105989; WO 2003078619; WO 2006097854; WO 2006097853; WO 2006097784 и WO 2004031346.

Здесь может использоваться любая мегануклеаза, включая, без ограничений, I-SceI, I-SceII, I-SceIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-CeuI, I-CeuAIIP, I-CreI, I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, I-CrepsbIVP, I-TliI, I-PpoI, PI-PspI, F-SceI, F-SceII, F-SuvI, F-TevI, F-TevII, I-AmaI, I-AniI, I-ChuI, I-CmoeI, I-CpaI, I-CpaII, I-CsmI, I-CvuI, I-CvuAIP, I-DdiI, I-DdiII, I-DirI, I-DmoI, I-HmuI, I-HmuII, I-HsNIP, I-LlaI, I-MsoI, I-NaaI, I-NanI, I-NcIIP, I-NgrIP, I-NitI, I-NjaI, I-Nsp236IP, I-PakI, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-PorI, I-PorIIP, I-PbpIP, I-SpBetaIP, I-ScaI, I-SexIP, I-SneIP, I-SpomI, I-SpomCP, I-SpomIP, I-SpomIIP, I-SquIP, I-Ssp6803I, I-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3bP, I-TdeIP, I-TevI, I-TevII, I-TevIII, I-UarAP, I-UarHGPAIP, I-UarHGPA13P, I-VinIP, I-ZbiIP, PI-MtuI, PI-MtuHIP, PI-MtuHIIP, PI-PfuI, PI-PfuII, PI-PkoI, Pl-PkoII, PI-Rma43812IP, PI-SpBetaIP, PI-SceI, PI-TfuI, PI-TfuII, PI-ThyI, PI-TliI, PI-TliII или их любые активные варианты или фрагменты.

В одном варианте осуществления мегануклеаза распознает двухцепочечные последовательности ДНК, состоящие из 12-40 пар нуклеотидов. В одном варианте осуществления мегануклеаза распознает одну идеально соответствующую целевую последовательность в геноме. В одном варианте осуществления мегануклеаза представляет собой самонаводящуюся нуклеазу. В одном варианте осуществления самонаводящаяся нуклеаза принадлежит к семейству самонаводящихся нуклеаз LAGLIDADG. В одном варианте осуществления семейство самонаводящихся нуклеаз LAGLIDADG выбирают из I-SceI, I-CreI и I-Dmol.

Нуклеазные агенты могут дополнительно содержать рестрикционные эндонуклеазы, которые включают эндонуклеазы I типа, II типа, III типа и IV типа. Рестрикционные эндонуклеазы I типа и III типа распознают специфические сайты распознавания, но, как правило, осуществляют расщепление в разных положениях на расстоянии от сайта связывания нуклеазы, которые могут находиться на расстоянии сотен пар нуклеотидов от сайта расщепления (сайта распознавания). В системах II типа рестрикционная активность не зависит от метилазной активности, и расщепление обычно происходит в специфических сайтах в пределах сайта связывания или вблизи него. Большинство ферментов II типа разрезает палиндромные последовательности, однако ферменты IIa типа распознают непалиндромные сайты распознавания и осуществляют расщепление за пределами сайта распознавания, ферменты IIb типа разрезают последовательности дважды на двух сайтах за пределами сайта распознавания, а ферменты IIs типа распознают асимметричный сайт распознавания и осуществляют расщепление с одной стороны и на определенном расстоянии от сайта распознавания, составляющем около 1-20 нуклеотидов. Рестрикционные ферменты IV типа нацелены на метилированную ДНК. Рестрикционные ферменты дополнительно описаны и классифицированы, например, в базе данных REBASE (адрес веб-страницы: rebase.neb.com; Roberts et al., (2003) Nucleic Acids Res 31: 418-20), Roberts et al., (2003) Nucleic Acids Res 31: 1805-12 и Belfort et al., (2002) в Mobile DNA II, pp. 761-783, Eds. Craigie et al. (ASM Press, Washington, DC).

Нуклеазный агент, используемый в различных способах и композициях, может также содержать систему CRISPR/Cas. В таких системах может использоваться нуклеаза Cas9, которая в некоторых случаях является кодон-оптимизированной для требуемого типа клеток, в которых она должна экспрессироваться. В системе дополнительно используется слитая конструкция крРНК-тракрРНК, функционирующая с кодон-оптимизированной Cas9. Эту одинарную РНК часто называют гидовой РНК или гРНК. В пределах гРНК участок крРНК определяют как «целевую последовательность» для данного сайта распознавания, а тракрРНК часто называют «каркасом». Было продемонстрировано, что эта система функционирует в различных эукариотических и прокариотических клетках. Коротко говоря, выполняется вставка короткого фрагмента ДНК, содержащего целевую последовательность, в плазмиду экспрессии гидовой РНК. Плазмида экспрессии гРНК содержит целевую последовательность (в некоторых вариантах осуществления длиной приблизительно 20 нуклеотидов), вид последовательности тракрРНК (каркас), а также подходящий промотор, который является активным в клетке, и элементы, необходимые для соответствующего процессинга в эукариотических клетках. Многие из систем основаны на обычных, комплементарных олигонуклеотидах, которые ренатурируют с образованием двухцепочечной ДНК, после чего клонируют в плазмиду экспрессии гРНК. Затем экспрессионную кассету гРНК и экспрессионную кассету Cas9 вводят в клетку. См., например, публикации Mali Р et al. (2013) Science 2013 Feb 15; 339 (6121): 823-6; Jinek M et al. Science 2012 Aug 17; 337(6096): 816-21; Hwang WY et al. Nat Biotechnol 2013 Mar; 31(3): 227-9; Jiang W et al. Nat Biotechnol 2013 Mar; 31(3): 233-9; и Cong L et al. Science 2013 Feb 15; 339(6121): 819-23, каждая из которых полностью включена в настоящий документ путем ссылки.

В способах и композициях, описанных в настоящем документе, для модификации генома внутри клетки могут использоваться системы коротких палиндромных повторов, регулярно расположенных группами (CRISPR)/системы, ассоциированные с CRISPR (Cas), или компоненты таких систем. Системы CRISPR/Cas включают в себя транскрипты и другие элементы, участвующие в экспрессии или управлении активностью генов Cas. Система CRISPR/Cas может представлять собой систему I типа, II типа или III типа. В способах и композициях, описанных в настоящем документе, для сайт-направленного расщепления нуклеиновых кислот используются системы CRISPR/Cas посредством использования комплексов CRISPR (содержащих гидовую РНК (гРНК), образующую комплекс с белком Cas).

Некоторые системы CRISPR/Cas, используемые в способах, описанных в настоящем документе, не встречаются в природе. «Не встречающаяся в природе» система имеет признаки вмешательства человека, например, один или более компонентов системы изменены или мутированы по сравнению с их природным состоянием, при этом они по меньшей мере по существу не содержат по меньшей мере один другой компонент, с которым они естественно ассоциированы в природе, или они ассоциированы по меньшей мере с другим компонентом, с которым они не ассоциированы в природе. Например, в некоторых системах CRISPR/Cas используются не встречающиеся в природе комплексы CRISPR, которые содержат гРНК и белок Cas, не встречающиеся в природе вместе.

i. Эндонуклеазы, направляемые РНК Cas

Белки Cas обычно содержат по меньшей мере один домен распознавания или связывания РНК. Такие домены могут взаимодействовать с гидовыми РНК (гРНК, описаны более подробно ниже). Белки Cas могут также содержать нуклеазные домены (например, домены ДНКазы или РНКазы), ДНК-связывающие домены, геликазные домены, домены межбелковых взаимодействий, домены димеризации и другие домены. Нуклеазный домен обладает каталитической активностью в отношении расщепления нуклеиновых кислот. Расщепление включает разрушение ковалентных связей молекулы нуклеиновой кислоты. В результате расщепления могут образовываться тупые концы или ступенчатые концы, и расщепление может быть одноцепочечным или двухцепочечным.

Примеры белков Cas включают Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5e (CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8a1, Cas8a2, Cas8b, Cas8c, Cas9 (Csn1 или Csx12), Cas10, Cas10d, CasF, CasG, CasH, Csy1, Csy2, Csy3, Cse1 (CasA), Cse2 (CasB), Cse3 (CasE), Cse4 (CasC), Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 и Cu1966 и их гомологи или модифицированные варианты.

Белки Cas могут быть из системы CRISPR/Cas II типа. Например, белок Cas может быть белком Cas9 или может быть получен из белка Cas9. Белки Cas9 обычно имеют четыре общих основных мотива с консервативной архитектурой. Мотивы 1, 2 и 4 представляют собой RuvC-подобные мотивы, а мотив 3 представляет собой мотив HNH. Белок Cas9 может быть, например, получен из Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Staphylococcus aureus, Nocardiopsis dassonvillei, Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptomyces viridochromogenes, Streptosporangium roseum, Streptosporangium roseum, AlicyclobacHlus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireducens, Exiguobacterium sibiricum, Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Burkholderiales bacterium, Polaromonas naphthalenivorans, Polaromonas sp., Crocosphaera watsonii, Cyanothece sp., Microcystis aeruginosa, Synechococcus sp., Acetohalobium arabaticum, Ammonifex degensii, Caldicelulosiruptor becscii, Candidatus Desulforudis, Clostridium botulinum, Clostridium difficile, Finegoldia magna, Natranaerobius thermophilus, Pelotomaculum thermopropionicum, Acidithiobacillus caldus, Acidithiobacillus ferrooxidans, Allochromatium vinosum, Marinobacter sp., Nitrosococcus halophilus, Nitrosococcus watsoni, Pseudoalteromonas haloplanktis, Ktedonobacter racemifer, Methanohalobium evestigatum, Anabaena variabilis, Nodularia spumigena, Nostoc sp., Arthrospira maxima, Arthrospira platensis, Arthrospira sp., Lyngbya sp., Microcoleus chthonoplastes, Oscillatoria sp., Petrotoga mobilis, Thermosipho africanus или Acaryochloris marina. Дополнительные примеры представителей семейства Cas9 описаны в публикации WO 2014/131833, которая полностью включена в настоящий документ путем ссылки. Предпочтительным ферментом является белок Cas9 из S. pyogenes или его производное. Белку Cas9 из S. pyogenes в базе данных SwissProt присвоен номер доступа Q99ZW2.

Белки Cas могут являться белками дикого типа (т.е. встречающимися в природе), модифицированными белками Cas (т.е. вариантами белков Cas) или фрагментами белков Cas дикого типа или модифицированных белков Cas. Белки Cas могут также являться активными вариантами или фрагментами белков Cas дикого типа или модифицированных белков Cas. Идентичность последовательности таких активных вариантов или фрагментов белку Cas дикого типа или модифицированному белку Cas или его части может составлять по меньшей мере 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, причем активные варианты сохраняют способность разрезания на требуемом сайте расщепления и, следовательно, сохраняют активность, индуцирующую одно- или двухцепочечный разрыв. Анализы определения активности, индуцирующей одно- или двухцепочечный разрыв, известны и, как правило, измеряют общую активность и специфичность белка Cas на субстратах ДНК, содержащих сайт расщепления.

Белки Cas могут быть модифицированы для увеличения или уменьшения аффинности связывания нуклеиновых кислот, специфичности связывания нуклеиновых кислот и/или ферментативной активности. Белки Cas могут также быть модифицированы для изменения любого другого вида активности или свойства белка, например стабильности. Например, один или более нуклеазных доменов белка Cas могут быть изменены, удалены или инактивированы, или белок Cas может быть усечен, чтобы удалить домены, которые не являются необходимыми для функционирования белка, или для оптимизации (например, увеличения или уменьшения) активности белка Cas.

Некоторые белки Cas содержат по меньшей мере два нуклеазных домена, таких как домены ДНКазы. Например, белок Cas9 может содержать RuvC-подобный нуклеазный домен и HNH-подобный нуклеазный домен. Каждый из доменов RuvC и HNH может разрезать отличную цепь двухцепочечной ДНК, чтобы выполнить двухцепочечный разрыв в ДНК. См., например, публикацию Jinek et al. 2012) Science 337: 816-821, которая полностью включена в настоящий документ путем ссылки.

Один или оба нуклеазных домена могут быть удалены или подвергнуты мутации таким образом, чтобы прекратить их функционирование или уменьшить нуклеазную активность. При удалении или мутации одного из нуклеазных доменов полученный белок Cas (например, Cas9) может называться «никаза» и может производить одноцепочечный разрыв на последовательности распознавания РНК CRISPR в пределах двухцепочечной ДНК, но не двухцепочечный разрыв (т.е. он может расщеплять комплементарную цепь или некомплементарную цепь, но не обе). При удалении или мутации обоих нуклеазных доменов полученный белок Cas (например, Cas9) будет иметь пониженную способность расщеплять обе цепи двухцепочечной ДНК. Примером мутации, превращающей Cas9 в никазу, является мутация D10A (замена аспартата на аланин в положении 10 в Cas9) в домене RuvC белка Cas9 из S. pyogenes. Подобным образом мутация Н939А (замена гистидина на аланин в положении аминокислоты 839) или Н840А (замена гистидина на аланин в положении аминокислоты 840) в домене HNH Cas9 из S. pyogenes может превращать Cas9 в никазу. Другие примеры мутаций, превращающих Cas9 в никазу, включают соответствующие мутации Cas9 из S. thermophilus. См., например, публикации Sapranauskas et al. (2011) Nucleic Acids Research 39: 9275-9282 и WO 2013/141680, каждая из которых полностью включена в настоящий документ путем ссылки. Такие мутации могут быть созданы с использованием таких методов, как сайт-направленный мутагенез, ПЦР-опосредованный мутагенез или полный синтез гена. Примеры других мутаций, создающих никазы, можно найти, например, в публикациях WO/2013/176772 A1 и WO/2013/142578 A1, каждая из которых включена в настоящий документ путем ссылки.

Белки Cas также могут представлять собой гибридные белки. Например, белок Cas может быть слит с доменом расщепления, доменом эпигенетических модификаций, доменом транскрипционной активации или доменом транскрипционного репрессора. См. публикацию №WO 2014/089290, которая полностью включена в настоящий документ путем ссылки. Белки Cas также могут быть слиты с гетерологичным полипептидом, обеспечивающим повышенную или сниженную стабильность. Слитый домен или гетерологичный полипептид может быть расположен на N-конце, на С-конце или находиться внутри белка Cas.

Белок Cas может быть слит с гетерологичным полипептидом, который обеспечивает субклеточную локализацию. Такие гетерологичные пептиды включают в себя, например, сигнал ядерной локализации (NLS), например NLS SV40, для нацеливания на ядро, сигнал митохондриальной локализации для нацеливания на митохондрии, сигнал удержания ER и т.п. См., например, Lange et al. (2007) J. Biol. Chem. 282: 5101-5105. Такие сигналы субклеточной локализации могут быть расположены на N-конце, на С-конце или в других местах внутри белка Cas. NLS может содержать участок из основных аминокислот и может быть представлен одинарной последовательностью или двойной последовательностью.

Белки Cas также могут быть связаны с проникающим в клетку доменом. Например, проникающий в клетку домен может быть получен из белка TAT HIV-1, проникающего в клетку мотива TLM из вируса гепатита В человека, MPG, Рер-1, VP22, проникающего в клетку пептида из вируса простого герпеса или из последовательности пептида полиаргинина. См., например, публикацию WO 2014/089290, которая полностью включена в настоящий документ путем ссылки. Проникающий в клетку домен может быть расположен на N-конце, на С-конце или в других местах внутри белка Cas.

Белки Cas также могут содержать гетерологичный полипептид для простоты отслеживания или очистки, например флуоресцентный белок, метку очистки или эпитопную метку. Примеры флуоресцентных белков включают зеленые флуоресцентные белки (например, GFP, GFP-2, tagGFP, turboGFP, eGFP, Emerald, Azami Green, мономерный Azami Green, CopGFP, AceGFP, ZsGreenl), желтые флуоресцентные белки (например, YFP, eYFP, Citrine, Venus, YPet, PhiYFP, ZsYellowl), синие флуоресцентные белки (например, eBFP, eBFP2, Azurite, mKalamal, GFPuv, Sapphire, T-sapphire), голубые флуоресцентные белки (например, eCFP, Cerulean, CyPet, AmCyanl, Midoriishi-Cyan), красные флуоресцентные белки (mKate, mKate2, mPlum, мономерный DsRed, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-monomer, HcRed-Tandem, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred), оранжевые флуоресцентные белки (mOrange, mKO, Kusabira-Orange, мономерный Kusabira-Orange, mTangerine, tdTomato) и любые другие подходящие флуоресцентные белки. Примеры меток включают глутатион-S-трансферазу (GST), хитин-связывающий белок (СВР), мальтоза-связывающий белок, тиоредоксин (TRX), поли(NANP), метку тандемной аффинной очистки (ТАР), myc, AcV5, AU1, AU5, Е, ECS, Е2, FLAG, гемагглютинин (НА), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, гистидин (His), биотин-карбоксил-переносящий белок (BCCP) и калмодулин.

Белки Cas могут быть обеспечены в любом виде. Например, белок Cas может быть обеспечен в виде белка, такого как белок Cas, образующий комплекс с гРНК. В альтернативном варианте осуществления белок Cas может быть обеспечен в виде нуклеиновой кислоты, кодирующей белок Cas, например РНК (например, матричной РНК (мРНК)) или ДНК. Необязательно нуклеиновая кислота, кодирующая белок Cas, может быть кодон-оптимизированной для эффективной трансляции в белок в конкретной клетке или организме.

Нуклеиновые кислоты, кодирующие белки Cas, могут быть стабильно интегрированы в геном клетки и функционально связаны с активным в клетке промотором. В альтернативном варианте осуществления нуклеиновые кислоты, кодирующие белки Cas, могут быть функционально связаны с промотором в экспрессионной конструкции. Экспрессионные конструкции включают в себя любые нуклеотидные конструкции, которые способны управлять экспрессией гена или другой интересующей нуклеотидной последовательности (например, гена Cas) и которые могут переносить такую интересующую нуклеотидную последовательность в клетку-мишень. Промоторы, которые могут использоваться в экспрессионной конструкции, включают, например, промоторы, активные в плюрипотентной клетке крысы, эукариота, млекопитающего, не относящегося к человеку млекопитающего, человека, грызуна, мыши или хомяка. В других разделах настоящего документа описаны примеры других промоторов.

ii. Гидовые РНК (гРНК)

«Гидовая РНК», или «гРНК», включает в себя молекулу РНК, которая связывается с белком Cas и нацеливает белок Cas в специфическое местоположение внутри целевой ДНК. Гидовые РНК могут содержать два сегмента: «сегмент ДНК-нацеливания» и «белоксвязывающий сегмент». «Сегмент» представляет собой сегмент, часть или область молекулы, например непрерывный участок из нуклеотидов в РНК. Некоторые гРНК содержат две отдельные молекулы РНК: «РНК-активатор» и «РНК-нацеливатель». Другие гРНК представляют собой одинарные молекулы РНК (одинарный полинуклеотид РНК), которые также можно назвать «одномолекулярной гРНК», «одногидовой РНК» или «огРНК». См., например, публикации WO/2013/176772 A1, WO/2014/065596 A1, WO/2014/089290 A1, WO/2014/093622 A2, WO/2014/099750 A2, WO/2013142578 A1 и WO 2014/131833 А1, каждая из которых включена в настоящий документ путем ссылки. Термины «гидовая РНК» и «гРНК» включают как двухмолекулярные гРНК, так и одномолекулярные гРНК.

Примеры двухмолекулярных гРНК включают крРНК-подобную молекулу («РНК CRISPR», или «РНК-нацеливатель», или «крРНК», или «повтор крРНК») и соответствующую тракрРНК-подобную молекулу («транс-действующую РНК CRISPR», или «РНК-активатор», или «тракрРНК», или «каркас»). крРНК содержит оба сегмента (одноцепочечные) ДНК-нацеливания гРНК и участок нуклеотидов, который образует одну половину дуплекса дцРНК белоксвязывающего сегмента гРНК.

Соответствующая тракрРНК (РНК-активатор) содержит участок нуклеотидов, который образует другую половину дуплекса дцРНК белоксвязывающего сегмента гРНК. Участок нуклеотидов крРНК комплементарен участку нуклеотидов тракрРНК и гибридизуется с ним с образованием дуплекса дцРНК белоксвязывающего домена гРНК. Таким образом, можно сказать, что каждая крРНК имеет соответствующую тракрРНК.

крРНК и соответствующая тракрРНК гибридизуются с образованием гРНК. крРНК дополнительно обеспечивает одноцепочечный сегмент ДНК-нацеливания, который гибридизуется с последовательностью распознавания РНК CRISPR. Для использования для модификации внутри клетки может быть разработана точная последовательность данной молекулы крРНК или тракрРНК, которая будет специфичной для тех видов, в которых будут использоваться молекулы РНК. См., например, публикации Mali et al. (2013) Science 339: 823-826; Jinek et al. (2012) Science 337: 816-821; Hwang et al. (2013) Nat. Biotechnol. 31: 227-229; Jiangs al. (2013) Nat. Biotechnol. 31: 233-239; и Conget al. (2013) Science 339: 819-823, каждая из которых включена в настоящий документ путем ссылки.

Сегмент ДНК-нацеливания (крРНК) данной гРНК содержит нуклеотидную последовательность, которая является комплементарной последовательности в целевой ДНК. Сегмент ДНК-нацеливания гРНК взаимодействует с целевой ДНК последовательность-специфическим образом посредством гибридизации (т.е. спаривания нуклеотидов). Таким образом, нуклеотидная последовательность сегмента ДНК-нацеливания может изменяться и определяет место внутри целевой ДНК, с которым будет взаимодействовать гРНК и целевая ДНК. Сегмент ДНК-нацеливания обсуждаемой гРНК может быть модифицирован для гибридизации с любой заданной последовательностью внутри целевой ДНК. Встречающиеся в природе крРНК различаются в зависимости от системы Cas9 и организма, но часто содержат нацеливающий сегмент длиной от 21 до 72 нуклеотидов, фланкированный двумя прямыми повторами (DR) длиной от 21 до 46 нуклеотидов (см., например, WO 2014/131833). В случае S. pyogenes длина DR составляет 36 нуклеотидов, а длина нацеливающего сегмента составляет 30 нуклеотидов. DR, расположенный на 3'-конце, является комплементарным и гибридизуется с соответствующей тракрРНК, которая в свою очередь связывается с белком Cas9.

Сегмент ДНК-нацеливания может иметь длину от около 12 нуклеотидов до около 100 нуклеотидов. Например, сегмент ДНК-нацеливания может иметь длину от около 12 нуклеотидов (нт) до около 80 нт, от около 12 нт до около 50 нт, от около 12 нт до около 40 нт, от около 12 нт до около 30 нт, от около 12 нт до около 25 нт, от около 12 нт до около 20 нт или от около 12 нт до около 19 нт. В альтернативном варианте осуществления сегмент ДНК-нацеливания может иметь длину от около 19 нт до около 20 нт, от около 19 нт до около 25 нт, от около 19 нт до около 30 нт, от около 19 нт до около 35 нт, от около 19 нт до около 40 нт, от около 19 нт до около 45 нт, от около 19 нт до около 50 нт, от около 19 нт до около 60 нт, от около 19 нт до около 70 нт, от около 19 нт до около 80 нт, от около 19 нт до около 90 нт, от около 19 нт до около 100 нт, от около 20 нт до около 25 нт, от около 20 нт до около 30 нт, от около 20 нт до около 35 нт, от около 20 нт до около 40 нт, от около 20 нт до около 45 нт, от около 20 нт до около 50 нт, от около 20 нт до около 60 нт, от около 20 нт до около 70 нт, от около 20 нт до около 80 нт, от около 20 нт до около 90 нт или от около 20 нт до около 100 нт.

Нуклеотидная последовательность сегмента ДНК-нацеливания, являющаяся комплементарной нуклеотидной последовательности (последовательности распознавания РНК CRISPR) целевой ДНК, может иметь длину по меньшей мере около 12 нт. Например, последовательность ДНК-нацеливания (т.е. последовательность в пределах сегмента ДНК-нацеливания, являющаяся комплементарной последовательности распознавания РНК CRISPR в пределах целевой ДНК) может иметь длину по меньшей мере около 12 нт, по меньшей мере около 15 нт, по меньшей мере около 18 нт, по меньшей мере около 19 нт, по меньшей мере около 20 нт, по меньшей мере около 25 нт, по меньшей мере около 30 нт, по меньшей мере около 35 нт или по меньшей мере около 40 нт. В альтернативном варианте осуществления последовательность ДНК-нацеливания может иметь длину от около 12 нуклеотидов (нт) до около 80 нт, от около 12 нт до около 50 нт, от около 12 нт до около 45 нт, от около 12 нт до около 40 нт, от около 12 нт до около 35 нт, от около 12 нт до около 30 нт, от около 12 нт до около 25 нт, от около 12 нт до около 20 нт, от около 12 нт до около 19 нт, от около 19 нт до около 20 нт, от около 19 нт до около 25 нт, от около 19 нт до около 30 нт, от около 19 нт до около 35 нт, от около 19 нт до около 40 нт, от около 19 нт до около 45 нт, от около 19 нт до около 50 нт, от около 19 нт до около 60 нт, от около 20 нт до около 25 нт, от около 20 нт до около 30 нт, от около 20 нт до около 35 нт, от около 20 нт до около 40 нт, от около 20 нт до около 45 нт, от около 20 нт до около 50 нт или от около 20 нт до около 60 нт. В некоторых случаях последовательность ДНК-нацеливания может иметь длину около 20 нт.

тракрРНК могут быть любого вида (например, полноразмерные тракрРНК или активные частичные тракрРНК) и различной длины. Они могут включать в себя первичные транскрипты или подвергнутые процессингу формы. Например, тракрРНК (как часть одногидовой РНК или в виде отдельной молекулы в составе двухмолекулярной гРНК) может содержать или состоять из всей или части последовательности тракрРНК дикого типа (например, около или более чем около 20, 26, 32, 45, 48, 54, 63, 67, 85 или более нуклеотидов последовательности тракрРНК дикого типа). Примеры последовательностей тракрРНК дикого типа из S. pyogenes включают варианты из 171 нуклеотида, 89 нуклеотидов, 75 нуклеотидов и 65 нуклеотидов. См., например, публикацию Deltcheva et al. (2011) Nature 471: 602-607; WO 2014/093661, каждая из которых полностью включена в настоящее описание путем ссылки. Примеры тракрРНК в пределах одногидовых РНК (огРНК) включают сегменты тракрРНК, встречающиеся в пределах вариантов огРНК +48, +54, +67 и +85, где «+n» означает, что в огРНК включено до +n нуклеотидов тракрРНК дикого типа. См. публикацию US 8,697,359, полностью включенную в настоящий документ путем ссылки.

Процент комплементарности между последовательностью ДНК-нацеливания и последовательностью распознавания РНК CRISPR в пределах целевой ДНК может составлять по меньшей мере 60% (например, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100%). Процент комплементарности между последовательностью ДНК-нацеливания и последовательностью распознавания РНК CRISPR в пределах целевой ДНК может составлять по меньшей мере 60% на протяжении около 20 непрерывных нуклеотидов. В качестве примера, процент комплементарности между последовательностью ДНК-нацеливания и последовательностью распознавания РНК CRISPR в пределах целевой ДНК составляет 100% на протяжении 14 непрерывных нуклеотидов на 5'-конце последовательности распознавания РНК CRISPR в пределах комплементарной цепи целевой ДНК и всего 0% в оставшейся части. В таком случае можно считать, что длина последовательности ДНК-нацеливания составляет 14 нуклеотидов. В качестве другого примера, процент комплементарности между последовательностью ДНК-нацеливания и последовательностью распознавания РНК CRISPR в пределах целевой ДНК составляет 100% на протяжении семи непрерывных нуклеотидов на 5'-конце последовательности распознавания РНК CRISPR в пределах комплементарной цепи целевой ДНК и всего 0% в оставшейся части. В таком случае можно считать, что длина последовательности ДНК-нацеливания составляет 7 нуклеотидов.

Белоксвязывающий сегмент гРНК может содержать два участка нуклеотидов, которые комплементарны друг другу. Комплементарные нуклеотиды белоксвязывающего сегмента гибридизуются с образованием дуплекса двухцепочечной РНК (дцРНК). Белоксвязывающий сегмент обсуждаемой гРНК взаимодействует с белком Cas, и гРНК управляет связыванием белка Cas со специфической нуклеотидной последовательностью в пределах ДНК с помощью сегмента ДНК-нацеливания.

Гидовые РНК могут включать в себя модификации или последовательности, которые обеспечивают дополнительные желательные характеристики (например, модифицированную или регулируемую стабильность; субклеточное нацеливание, отслеживание с помощью флуоресцентной метки; сайт связывания для белка или белкового комплекса и т.п.). Примеры таких модификаций включают, например, 5'-кэп (например, 7-метилгуанилатный кэп (m7G)); 3'-полиаденилированный хвост (т.е. 3' поли(А) хвост); последовательность-рибопереключатель (например, для обеспечения регулируемой стабильности и/или регулируемой доступности белками и/или белковыми комплексами); последовательность контроля стабильности; последовательность, образующая дуплекс дцРНК (т.е. шпилька)); модификацию или последовательность, которая нацеливает РНК в субклеточное местоположение (например, ядро, митохондрии, хлоропласты и т.п.); модификацию или последовательность, которая обеспечивает отслеживание (например, прямая конъюгация с флуоресцентной молекулой, конъюгация с фрагментом, который способствует флуоресцентной детекции, последовательность, которая позволяет флуоресцентную детекцию и т.д.); модификацию или последовательность, которая обеспечивает сайт связывания для белков (например, белки, которые действуют на ДНК, включая активаторы транскрипции, репрессоры транскрипции, ДНК-метилтрансферазы, ДНК-деметилазы, гистонацетилтрансферазы, гистондеацетилазы и т.п.); и их комбинации.

Гидовые РНК могут быть обеспечены в любом виде. Например, гРНК может быть обеспечена в виде РНК, либо как две молекулы (отдельно крРНК и тракрРНК), либо как одна молекула (огРНК) и, необязательно, в виде комплекса с белком Cas. гРНК может быть обеспечена также в виде ДНК, кодирующей РНК. ДНК, кодирующая гРНК, может кодировать одну молекулу РНК (огРНК) или отдельные молекулы РНК (например, отдельно крРНК и тракрРНК). В последнем случае ДНК, кодирующая гРНК, может быть обеспечена как отдельные молекулы ДНК, кодирующие соответственно крРНК и тракрРНК.

ДНК, кодирующие гРНК, могут быть стабильно интегрированы в геном клетки и функционально связаны с активным в клетке промотором. В альтернативном варианте осуществления ДНК, кодирующие гРНК, могут быть функционально связаны с промотором в экспрессионной конструкции. Такие промоторы могут быть активными, например, в плюрипотентной клетке крысы, эукариота, млекопитающего, не относящегося к человеку млекопитающего, человека, грызуна, мыши или хомяка. В некоторых случаях промотор представляет собой промотор РНК-полимеразы III, такой как промотор U6 человека, промотор U6 полимеразы III крысы или промотор U6 полимеразы III мыши. В других разделах настоящего документа описаны примеры других промоторов.

В альтернативном варианте осуществления гРНК можно получать с помощью различных других способов. Например, гРНК можно получать посредством транскрипции in vitro с использованием, например, Т7 РНК-полимеразы (см., например, WO 2014/089290 и WO 2014/065596). Гидовые РНК могут также быть синтетическими молекулами, полученными путем химического синтеза.

iii. Последовательности распознавания РНК CRISPR

Термин «последовательность распознавания РНК CRISPR» включает нуклеотидные последовательности, присутствующие в целевой ДНК, с которой будет связываться сегмент ДНК-нацеливания гРНК, при условии существования достаточных условий для связывания. Например, последовательности распознавания РНК CRISPR включают последовательности, которым должна быть комплементарна сконструированная гидовая РНК, где гибридизация между последовательностью распознавания РНК CRISPR и последовательностью ДНК-нацеливания способствует образованию комплекса CRISPR. Полная комплементарность не является обязательным требованием при условии достаточной комплементарности, чтобы вызвать гибридизацию и способствовать образованию комплекса CRISPR. Последовательности распознавания РНК CRISPR также включают сайты расщепления для белков Cas, более подробно описанные ниже. Последовательность распознавания РНК CRISPR может содержать любой полинуклеотид, который может быть расположен, например, в ядре или цитоплазме клетки или внутри органеллы клетки, такой как митохондрия или хлоропласт.

На последовательность распознавания РНК CRISPR в пределах целевой ДНК может быть нацелен (т.е. может связывать, или гибридизовать, или быть комплементарным) белок Cas или гРНК. Подходящие условия связывания ДНК/РНК включают физиологические условия, обычно существующие в клетке. Другие подходящие условия связывания ДНК/РНК (например, условия в бесклеточной системе) известны в данной области (см., например, Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook et al., Harbor Laboratory Press 2001)). Цепь целевой ДНК, которая является комплементарной и гибридизуется с белком Cas или гРНК, можно назвать «комплементарной цепью», а цепь целевой ДНК, которая комплементарна «комплементарной цепи» (и, таким образом, не комплементарна белку Cas или гРНК), можно назвать «некомплементарной цепью» или «матричной цепью».

Белок Cas может расщеплять нуклеиновую кислоту на сайте внутри или за пределами нуклеотидной последовательности, присутствующей в целевой ДНК, с которой будет связываться сегмент ДНК-нацеливания гРНК. «Сайт расщепления» включает положение нуклеиновой кислоты, в котором белок Cas производит одноцепочечный разрыв или двухцепочечный разрыв. Например, образование комплекса CRISPR (содержащего гРНК, гибридизованную с последовательностью распознавания РНК CRISPR и образующую комплексы с белком Cas) может приводить к расщеплению одной или обеих цепей внутри или возле (например, на расстоянии в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар нуклеотидов от) нуклеотидной последовательности, присутствующей в целевой ДНК, с которой будет связываться сегмент ДНК-нацеливания гРНК. Если сайт расщепления находится за пределами нуклеотидной последовательности, с которой будет связываться сегмент ДНК-нацеливания гРНК, то сайт расщепления все еще считается находящимся в пределах «последовательности распознавания РНК CRISPR». Сайт расщепления может находиться на только одной цепи или на обеих цепях нуклеиновой кислоты. Сайты расщепления могут находиться в одном и том же положении на обеих цепях нуклеиновой кислоты (образуя тупые концы) или могут находиться на разных сайтах на каждой цепи (образуя ступенчатые концы). Ступенчатые концы можно получать, например, с использованием двух белков Cas, каждый из которых производит одноцепочечный разрыв на отличающемся сайте расщепления на каждой цепи, производя таким образом двухцепочечный разрыв. Например, первая никаза может создавать одноцепочечный разрыв на первой цепи двухцепочечной ДНК (дцДНК), а вторая никаза может создавать одноцепочечный разрыв на второй цепи дцДНК таким образом, что образуются нависающие последовательности. В некоторых случаях последовательность распознавания РНК CRISPR никазы на первой цепи разделена с последовательностью распознавания РНК CRISPR никазы на второй цепи по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 250, 500 или 1000 парами нуклеотидов.

Сайт-специфическое расщепление целевой ДНК белком Cas9 может происходить в местах, определенных как (i) комплементарностью спариваемых нуклеотидов между гРНК и целевой ДНК, так и (ii) наличием в целевой ДНК короткого мотива, называемого мотивом, прилежащим к протоспейсеру (РАМ). РАМ может фланкировать последовательность распознавания РНК CRISPR. Необязательно, последовательность распознавания РНК CRISPR может быть фланкирована РАМ. Например, сайт расщепления Cas9 может находиться на расстоянии от около 1 до около 10 или от около 2 до около 5 пар нуклеотидов (например, 3 пар нуклеотидов) выше или ниже последовательности РАМ. В некоторых случаях (например, когда используется Cas9 из S. pyogenes или близкородственный Cas9) последовательность РАМ некомплементарной цепи может представлять собой 5'-N1GG-3', где N1 является любым нуклеотидом ДНК и находится непосредственно на 3'-конце последовательности распознавания РНК CRISPR некомплементарной цепи целевой ДНК. По существу, последовательность РАМ комплементарной цепи будет представлять собой 5'-СС N2-3', где N2 является любым нуклеотидом ДНК и находится непосредственно на 5'-конце последовательности распознавания РНК CRISPR комплементарной цепи целевой ДНК. В некоторых таких случаях N1 и N2 могут быть комплементарными, и пара нуклеотидов N1- N2 может быть любой парой нуклеотидов (например, N1=C и N2=G; N1=G и N2=C; N1=A и N2=T, N1=T и N2=A).

Примеры последовательностей распознавания РНК CRISPR включают последовательность ДНК, комплементарную сегменту ДНК-нацеливания гРНК, или такую последовательность ДНК в дополнение к последовательности РАМ. Например, целевой мотив может представлять собой последовательность ДНК длиной 20 нуклеотидов, непосредственно предшествующую мотиву NGG, распознаваемому белком Cas (см., например, WO 2014/165825). Гуанин на 5'-конце может способствовать транскрипции РНК- полимеразы в клетках. Другие примеры последовательностей распознавания РНК CRISPR могут включать два гуаниннуклеотида на 5'-конце (например, GGN20NGG; SEQ ID NO: 21) для облегчения эффективной транскрипции Т7-полимеразой in vitro. См., например, WO 2014/065596.

Последовательность распознавания РНК CRISPR может представлять собой любую нуклеотидную последовательность, эндогенную или экзогенную по отношению к клетке. Последовательность распознавания РНК CRISPR может представлять собой последовательность, кодирующую генный продукт (например, белок), или некодирующую последовательность (например, регуляторную последовательность), или может включать в себя обе. В одном варианте осуществления целевая последовательность непосредственно фланкирована последовательностью мотива, прилежащего к протоспейсеру (РАМ). В одном варианте осуществления интересующий локус содержит нуклеотидную последовательность SEQ ID NO: 1. В одном варианте осуществления гРНК содержит третью нуклеотидную последовательность, кодирующую РНК коротких палиндромных повторов, регулярно расположенных группами (CRISPR) (крРНК), и трансактивирующую РНК CRISPR (тракрРНК). В другом варианте осуществления геном плюрипотентной клетки крысы содержит область целевой ДНК, комплементарную целевой последовательности. В некоторых таких способах белок Cas представляет собой Cas9. В некоторых вариантах осуществления гРНК содержит (а) химерную РНК нуклеотидной последовательности SEQ ID NO: 2; или (b) химерную РНК нуклеотидной последовательности SEQ ID NO: 3. В некоторых таких способах крРНК содержит последовательность, приведенную в SEQ ID NO: 4, SEQ ID NO: 5 или SEQ ID NO: 6. В некоторых таких способах тракрРНК содержит последовательность, приведенную в SEQ ID NO: 7 или SEQ ID NO: 8.

Также предложены активные варианты и фрагменты нуклеазных агентов (т.е. сконструированный нуклеазный агент). Идентичность последовательности таких активных вариантов нативному нуклеазному агенту может составлять по меньшей мере 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, причем активные варианты сохраняют способность разрезать заданный сайт распознавания и, таким образом, сохраняют активность индуцирования одно- или двухцепочечного разрыва. Например, любой из нуклеазных агентов, описанных в настоящем документе, может быть модифицирован из нативной последовательности эндонуклеазы и сконструирован для распознавания и индуцирования одно- или двухцепочечного разрыва на сайте распознавания, который не распознавался нативным нуклеазный агентом. Таким образом, в некоторых вариантах осуществления сконструированная нуклеаза обладает специфической способностью индуцировать одно- или двухцепочечный разрыв на сайте распознавания, который отличается от сайта распознавания соответствующего нативного нуклеазного агента. Анализы определения активности, индуцирующей одно- или двухцепочечный разрыв, известны и, как правило, измеряют общую активность и специфичность эндонуклеазы на субстратах ДНК, содержащих сайт распознавания.

Например, на Фиг. 3 показаны положения сайтов связывания ZFN и сайтов разрезания на кассетах селекции. Сайты являются следующими: Neo-ZFN(1,2): САЙТ СВЯЗЫВАНИЯ НУКЛЕАЗЫ/сайт разрезания (SEQ ID NO: 9); Neo-ZFN(3,4): САЙТ СВЯЗЫВАНИЯ НУКЛЕАЗЫ/сайт разрезания (SEQ ID NO: 10); Hyg-ZFN(1,2): САЙТ СВЯЗЫВАНИЯ НУКЛЕАЗЫ/сайт разрезания (SEQ ID NO: 11); и Hyg-ZFN(3,4): САЙТ СВЯЗЫВАНИЯ НУКЛЕАЗЫ/сайт разрезания (SEQ ID NO: 12).

Нуклеазный агент может быть введен в клетку любыми способами, известными в данной области. Полипептид, кодирующий нуклеазный агент, может быть непосредственно введен в клетку. В альтернативном варианте осуществления в клетку может быть введен полинуклеотид, кодирующий нуклеазный агент. Если в клетку вводят полинуклеотид, кодирующий нуклеазный агент, то нуклеазный агент может экспрессироваться внутри клетки временно, условно или конститутивно. Таким образом, полинуклеотид, кодирующий нуклеазный агент, может содержаться в экспрессионной кассете и быть функционально связанным с условным промотором, индуцируемым промотором, конститутивным промотором или тканеспецифическим промотором. Такие интересующие промоторы обсуждаются более подробно в других разделах настоящего документа. В альтернативном варианте осуществления нуклеазный агент вводят в клетку в качестве мРНК, кодирующей нуклеазный агент.

В конкретных вариантах осуществления полинуклеотид кодирующий нуклеазный агент, стабильно интегрирован в геном клетки и функционально связан с активным в клетке промотором. В других вариантах осуществления полинуклеотид, кодирующий нуклеазный агент, находится в том же нацеливающем векторе, который содержит полинуклеотидную вставку, хотя в других случаях полинуклеотид, кодирующий нуклеазный агент, находится в векторе или плазмиде, которая отделена от нацеливающего вектора, содержащего полинуклеотидную вставку.

Если нуклеазный агент вводят в клетку посредством введения полинуклеотида, кодирующего нуклеазный агент, то такой полинуклеотид, кодирующий нуклеазный агент, может быть модифицирован, чтобы заменить кодоны, имеющие более высокую частоту использования в интересующей клетке, по сравнению со встречающейся в природе полинуклеотидной последовательностью, кодирующей нуклеазный агент. Например, полинуклеотид, кодирующий нуклеазный агент, может быть модифицирован, чтобы заменить кодоны, имеющие более высокую частоту использования в данной интересующей прокариотической или эукариотической клетке, включая бактериальную клетку, дрожжевую клетку, человеческую клетку, не относящуюся к человеку клетку, клетку млекопитающего, клетку грызуна, клетку мыши, клетку крысы или любую другую интересующую клетку-хозяина по сравнению со встречающейся в природе полинуклеотидной последовательностью.

B. Селективные маркеры

В различных способах и композициях, предложенных в настоящем документе, используются нуклеазные агенты и их соответствующие сайты распознавания в комбинации с селективными маркерами. Как обсуждалось в настоящем документе, положение сайта распознавания в полинуклеотиде, кодирующем селективный маркер, обеспечивает эффективный способ, с помощью которого идентифицируют события интеграции на целевом локусе. Кроме того, в настоящем документе представлены различные способы, в которых чередующиеся селективные маркеры, имеющие сайт распознавания нуклеазы, используются для повышения эффективности и продуктивности интеграции множества интересующих полинуклеотидов в данный целевой локус.

В способах и композициях, описанных в настоящем документе, могут использоваться различные селективные маркеры. Такие селективные маркеры могут, например, придавать устойчивость к антибиотикам, таким как G418, гигромицин, бластицидин, неомицин или пуромицин. Такие селективные маркеры включают неомицинфосфотрансферазу (neor), гигромицин-В-фосфотрансферазу (hygr), пуромицин-N-ацетилтрансферазу (puror) и бластицидин-Б-дезаминазу (bsrr). В других вариантах осуществления селективный маркер функционально связан с индуцируемым промотором, и экспрессия селективного маркера является токсичной для клетки. Не имеющие ограничительного характера примеры таких селективных маркеров включают ксантин/гуанинфосфорибозилтрансферазу (gpt), гипоксантингуанинфосфорибозилтрансферазу (HGPRT) или тимидинкиназу вируса простого герпеса (HSV-TK).

Полинуклеотиды, кодирующие селективные маркеры, функционально связаны с активным в клетке промотором. Такие экспрессионные кассеты и их различные регуляторные компоненты обсуждаются более подробно в других разделах настоящего документа.

C. Целевой локус

Предложены различные способы и композиции, обеспечивающие интеграцию в целевой локус по меньшей мере одной полинуклеотидной вставки. Термин «целевой локус» означает любой сегмент или область ДНК, в которую желательно интегрировать полинуклеотидную вставку. В одном варианте осуществления целевой локус представляет собой геномный локус. Целевой локус может быть нативным по отношению к клетке или, в альтернативном варианте осуществления, может содержать гетерологичный или экзогенный сегмент ДНК. Такие гетерологичные или экзогенные сегменты ДНК могут включать в себя трансгены, экспрессионные кассеты, полинуклеотиды, кодирующие селективные маркеры, или гетерологичные или экзогенные области ДНК (т.е. гетерологичные или экзогенные области геномной ДНК). Целевой локус может содержать любую систему нацеленной интеграции, включая, например, сайт распознавания, селективный маркер, ранее интегрированные полинуклеотидные вставки, полинуклеотиды, кодирующие нуклеазные агенты, промоторы и т.п. В альтернативном варианте осуществления целевой локус может быть расположен внутри дрожжевой искусственной хромосомы (YAC), бактериальной искусственной хромосомы (ВАС), человеческой искусственной хромосомы или любой другой сконструированной геномной области, содержащейся в соответствующей клетке-хозяине. Таким образом, в конкретных вариантах осуществления целевой локус может содержать нативную, гетерологичную или экзогенную геномную нуклеотидную последовательность из прокариотической, эукариотической, дрожжевой, бактериальной клетки, клетки не относящегося к человеку млекопитающего, не относящейся к человеку клетки, от грызуна, человека, крысы, мыши, хомяка, кролика, свиньи, коровы, оленя, овцы, козы, курицы, кошки, собаки, хорька, примата (например, мартышки, макаки-резус), домашнего млекопитающего животного или сельскохозяйственного млекопитающего животного или любого другого интересующего организма или их комбинации.

Не имеющие ограничительного характера примеры целевого локуса включают геномный локус, который кодирует белок, экспрессируемый в В-клетке, геномный локус, который экспрессирует полипептид в незрелой В-клетке, геномный локус, который экспрессирует полипептид в зрелой В-клетке, локусы иммуноглобулина (Ig) или локусы Т-клеточного рецептора, включая, например, локус Т-клеточного альфа-рецептора. Такой локус может быть получен от птицы (например, курицы), не относящегося к человеку млекопитающего, грызуна, человека, крысы, мыши, хомяка, кролика, свиньи, коровы, оленя, овцы, козы, кошки, собаки, хорька, примата (например, мартышки, макаки-резус), домашнего млекопитающего животного, или сельскохозяйственного млекопитающего животного, или любого другого интересующего организма, или их комбинации.

В дополнительных вариантах осуществления при отсутствии одно- или двухцепочечного разрыва, индуцированного нуклеазный агентом, нельзя выполнить нацеливание на целевой локус с использованием стандартных способов, или нацеливание может быть только неверным или иметь очень низкую эффективность.

D. Нацеливающие векторы и полинуклеотидные вставки

Как указывалось выше, в предложенных в настоящем документе способах и композициях используется преимущество нуклеазных агентов и стратегического позиционирования сайтов распознавания для нуклеазного агента в пределах кассеты селекции в комбинации с событием гомологичной рекомбинации. В таких способах используется одно- или двухцепочечный разрыв на сайте распознавания в сочетании с гомологичной рекомбинацией, чтобы таким образом направлять интеграцию полинуклеотидной вставки в целевой локус. Термин «гомологичная рекомбинация» обычно используется для обозначения обмена ДНК-фрагментов между двумя ДНК-молекулами на сайтах кроссинговера в пределах областей гомологии.

i. Полинуклеотидная вставка

Термин «полинуклеотидная вставка» означает сегмент ДНК, который желательно интегрировать в целевой локус. В одном варианте осуществления полинуклеотидная вставка содержит один или более интересующих полинуклеотидов. В других вариантах осуществления полинуклеотидная вставка может содержать одну или более экспрессионных кассет. Данная экспрессионная кассета может содержать интересующий полинуклеотид, полинуклеотид, кодирующий селективный маркер и/или репортерный ген, наряду с различными регуляторными компонентами, влияющими на экспрессию. Не имеющие ограничительного характера примеры интересующих полинуклеотидов, селективных маркеров и репортерных генов (например, eGFP), которые могут быть включены в полинуклеотидную вставку, обсуждаются более подробно в других разделах настоящего документа.

В конкретных вариантах осуществления полинуклеотидная вставка может содержать геномную нуклеиновую кислоту. В одном варианте осуществления геномную нуклеиновую кислоту получают от мыши, человека, грызуна, не от человека, от крысы, хомяка, кролика, свиньи, коровы, оленя, овцы, козы, курицы, кошки, собаки, хорька, примата (например, мартышки, макаки-резус), домашнего млекопитающего животного, или сельскохозяйственного млекопитающего животного, или любого другого интересующего организма, или их комбинации.

В дополнительных вариантах осуществления полинуклеотидная вставка содержит условный аллель. В одном варианте осуществления условный аллель является многофункциональным аллелем, как описано в публикации US 2011/0104799, которая включена в настоящий документ путем ссылки в полном объеме. В конкретных вариантах осуществления условный аллель содержит: (а) запускающую последовательность в смысловой ориентации по отношению к транскрипции целевого гена и кассету селекции лекарственными средствами в смысловой или антисмысловой ориентации; (b) в антисмысловой ориентации интересующую нуклеотидную последовательность (NSI) и условный по инверсии модуль (COIN с использованием интрона, расщепляющего экзон, и обратимого модуля, подобного ловушке для генов; см., например, публикацию US 2011/0104799, которая включена в настоящий документ путем ссылки в полном объеме); и (с) поддающиеся рекомбинации блоки, которые рекомбинируются при воздействии первой рекомбиназы с образованием условного аллеля, в котором (i) отсутствует запускающая последовательность и DSC и (ii) содержится NSI в смысловой ориентации и COIN в антисмысловой ориентации.

Полинуклеотидная вставка может иметь длину от около 5 т.п.н. до около 200 т.п.н., от около 5 т.п.н. до около 10 т.п.н., от около 10 т.п.н. до около 20 т.п.н., от около 20 т.п.н. до около 30 т.п.н., от около 30 т.п.н. до около 40 т.п.н., от около 40 т.п.н. до около 50 т.п.н., от около 60 т.п.н. до около 70 т.п.н., от около 80 т.п.н. до около 90 т.п.н., от около 90 т.п.н. до около 100 т.п.н., от около 100 т.п.н. до около 110 т.п.н., от около 120 т.п.н. до около 130 т.п.н., от около 130 т.п.н. до около 140 т.п.н., от около 140 т.п.н. до около 150 т.п.н., от около 150 т.п.н. до около 160 т.п.н., от около 160 т.п.н. до около 170 т.п.н., от около 170 т.п.н. до около 180 т.п.н., от около 180 т.п.н. до около 190 т.п.н. или от около 190 т.п.и. до около 200 т.п.н.

В конкретных вариантах осуществления полинуклеотидная вставка содержит нуклеиновую кислоту, фланкированную целевыми последовательностями сайт-специфической рекомбинации. Общепризнано, что в то время как вся полинуклеотидная вставка может быть фланкирована такой целевой последовательностью сайт-специфической рекомбинации, любая область или отдельный интересующий полинуклеотид внутри полинуклеотидной вставки также может быть фланкирован такими сайтами. Термин «сайт рекомбинации» включает нуклеотидную последовательность, которая распознается сайт-специфической рекомбиназой и может служить в качестве субстрата для события рекомбинации. Термин «сайт-специфическая рекомбиназа» включает группу ферментов, которые могут способствовать рекомбинации между сайтами рекомбинации, когда два сайта рекомбинации физически разделены в пределах одной молекулы нуклеиновой кислоты или находятся на отдельных молекулах нуклеиновой кислоты. Примеры сайт-специфических рекомбиназ включают, без ограничений, рекомбиназы Cre, Flp и Dre. Сайт-специфическая рекомбиназа может быть введена в клетку с помощью любых средств, в том числе путем введения в клетку полипептида рекомбиназы или путем введения в клетку-хозяина полинуклеотида, кодирующего сайт-специфическую рекомбиназу. Полинуклеотид, кодирующий сайт-специфическую рекомбиназу, может быть расположен внутри полинуклеотидной вставки или внутри отдельного полинуклеотида. Сайт-специфическая рекомбиназа может быть функционально связана с активным в клетке промотором, включая, например, индуцируемый промотор, промотор, являющийся эндогенным по отношению к клетке, промотор, являющийся гетерологичным по отношению к клетке, клеточноспецифический промотор, тканеспецифический промотор или промотор, специфический для стадии развития. Целевые последовательности сайт-специфической рекомбинации, которые могут фланкировать полинуклеотидную вставку или любой интересующий полинуклеотид в полинуклеотидной вставке, могут включать в себя, без ограничений, последовательности loxP, lox511, lox2272, lox66, lox71, loxM2, lox5171, FRT, FRT11, FRT71, attp, att, FRT, rox и их комбинацию.

В других вариантах осуществления сайты сайт-специфической рекомбинации фланкируют полинуклеотид, кодирующий селективный маркер и/или репортерный ген, содержащийся внутри полинуклеотидной вставки. В таких случаях после интеграции полинуклеотидной вставки в целевой локус последовательности между сайтами сайт-специфической рекомбинации можно удалить.

В одном варианте осуществления полинуклеотидная вставка содержит полинуклеотид, кодирующий селективный маркер. Такие селективные маркеры включают, без ограничений, неомицинфосфотрансферазу (neor), гигромицин-В-фосфотрансферазу (hygr), пуромицин-N-ацетилтрансферазу (puror), бластицидин-S-дезаминазу (bsrr), ксантин/гуанинфосфорибозилтрансферазу (gpt) или тимидинкиназу вируса простого герпеса (HSV-k) или их комбинацию. В одном варианте осуществления полинуклеотид, кодирующий селективный маркер, функционально связан с активным в клетке промотором. Как указывалось выше, при последовательном мозаичном расположении интересующих полинуклеотидов в целевом локусе (т.е. геномном локусе) селективный маркер может содержать сайт распознавания для нуклеазного агента. В одном варианте осуществления полинуклеотид, кодирующий селективный маркер, фланкирован целевыми последовательностями сайт-специфической рекомбинации.

Полинуклеотидная вставка может дополнительно содержать репортерный ген, функционально связанный с промотором, причем репортерный ген кодирует репортерный белок, который выбирают из группы, состоящей из белков LacZ, mPlum, mCherry, tdTomato, mStrawberry, J-Red, DsRed, mOrange, mKO, mCitrine, Venus, YPet, усиленного желтого флуоресцентного белка (EYFP), Emerald, усиленного зеленого флуоресцентного белка (EGFP), CyPet, голубого флуоресцентного белка (CFP), Cerulean, T-Sapphire, люциферазы, щелочной фосфатазы и их комбинации. Такие репортерные гены могут быть функционально связаны с активным в клетке промотором. Такие промоторы могут представлять собой индуцируемый промотор, промотор, являющийся эндогенным по отношению к репортерному гену или клетке, промотор, являющийся гетерологичным по отношению к репортерному гену или клетке, клеточноспецифический промотор, тканеспецифический промотор или промотор, специфический для стадии развития.

ii. Нацеливающие векторы

Нацеливающие векторы используются для введения в целевой локус полинуклеотидной вставки. Нацеливающий вектор содержит полинуклеотидную вставку и дополнительно содержит вышележащее и нижележащее гомологичные плечи, которые фланкируют полинуклеотидную вставку. Гомологичные плечи, которые фланкируют полинуклеотидную вставку, соответствуют областям в пределах целевого локуса. Для удобства ссылки соответствующие области в пределах целевого локуса упоминаются в настоящем документе как «целевые сайты». Таким образом, в одном примере нацеливающий вектор может содержать первую полинуклеотидную вставку, фланкированную первым и вторым гомологичными плечами, которые соответствуют первому и второму целевым сайтам, расположенным достаточно близко к первому сайту распознавания внутри полинуклеотида, кодирующего селективный маркер. Как таковой, нацеливающий вектор тем самым помогает интеграции в целевой локус полинуклеотидной вставки посредством события гомологичной рекомбинации, которое происходит между гомологичными плечами и соответствующими целевыми сайтами, например, в пределах генома клетки.

Гомологичное плечо нацеливающего вектора может иметь любую длину, достаточную для стимуляции события гомологичной рекомбинации с соответствующим целевым сайтом, включая, например, длину 50-100 нуклеотидов, 100-1000 нуклеотидов или по меньшей мере 5-10, 5-15, 5-20, 5-25, 5-30, 5-35, 5-10, 5-45, 5-50, 5-55, 5-60, 5-65, 5-70, 5-75, 5-80, 5-85, 5-90, 5-95, 5-100, 100-200 или 200-300 тысяч пар нуклеотидов или более. Как описано более подробно ниже, в больших нацеливающих векторах могут использоваться нацеливающие плечи большей длины.

Целевые сайты в пределах целевого локуса, которые соответствуют вышележащему и нижележащему гомологичным плечам нацеливающего вектора, расположены «достаточно близко к сайту распознавания», расположенному в полинуклеотиде, кодирующем селективный маркер. Вышележащее и нижележащее гомологичные плечи нацеливающего вектора «расположены в достаточной близости» к сайту распознавания, причем расстояние является таким, чтобы способствовать возникновению события гомологичной рекомбинации между целевыми сайтами и гомологичными плечами при одно- или двухцепочечном разрыве на сайте распознавания. Таким образом, в конкретных вариантах осуществления целевые сайты, соответствующие вышележащему и/или нижележащему гомологичному плечу нацеливающего вектора, находятся на расстоянии в пределах по меньшей мере 1 нуклеотида от данного сайта распознавания, находятся на расстоянии в пределах по меньшей мере от 10 нуклеотидов до около 14 т.п.н. от данного сайта распознавания или находятся на расстоянии в пределах от около 10 нуклеотидов до около 100 нуклеотидов, от около 100 нуклеотидов до около 500 нуклеотидов, от около 500 нуклеотидов до около 1000 нуклеотидов, от около 1 т.п.н. до около 5 т.п.н., от около 5 т.п.н. до около 10 т.п.н. или от около 10 т.п.н. до около 14 т.п.н. от данного сайта распознавания. В конкретных вариантах осуществления сайт распознавания непосредственно смежен с по меньшей мере одним или обоими целевыми сайтами.

Пространственное отношение целевых сайтов, соответствующих гомологичным плечам нацеливающего вектора и сайту распознавания в пределах полинуклеотида, кодирующего селективный маркер, может изменяться. Например, целевые сайты могут быть расположены в направлении 5'-конца от сайта распознавания, оба целевых сайта могут быть расположены в направлении 3'-конца от сайта распознавания, или целевые сайты могут фланкировать сайт распознавания.

Гомологичное плечо и целевой сайт «соответствуют» или являются «соответствующими» друг другу, если две области имеют достаточную степень идентичности последовательности друг другу для того, чтобы действовать как субстраты для реакции гомологичной рекомбинации. Под «гомологичными» понимают последовательности ДНК, которые или являются идентичными, или имеют идентичность последовательности с соответствующей последовательностью. Идентичность последовательности между данным целевым сайтом и соответствующим гомологичным плечом, находящимся на нацеливающем векторе, может иметь любую степень идентичности последовательности, которая обеспечивает возникновение гомологичной рекомбинации. Например, степень идентичности последовательности между гомологичным плечом нацеливающего вектора (или его фрагмента) и целевым сайтом (или его фрагментом) может составлять по меньшей мере 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности последовательности так, что последовательности подвергаются гомологичной рекомбинации. Кроме того, соответствующая область гомологии между гомологичным плечом и соответствующим целевым сайтом может иметь любую длину, которая является достаточной для стимуляции гомологичной рекомбинации на расщепленном сайте распознавания. Например, данное гомологичное плечо и/или соответствующий целевой сайт может содержать соответствующие области гомологии, длина которых составляет по меньшей мере около 50-100 нуклеотидов, 100-1000 нуклеотидов или 5-10, 5-15, 5-20, 5-25, 5-30, 5-35, 5-40, 5-45, 5-50, 5-55, 5-60, 5-65, 5-70, 5-75, 5-80, 5-85, 5-90, 5-95, 5-100, 100-200 или 200-300 тысяч пар нуклеотидов или более (так, как описано в других разделах настоящего документа для векторов LTVEC) так, что гомологичное плечо имеет достаточную гомологию, чтобы подвергаться гомологичной рекомбинации с соответствующими целевыми сайтами в пределах генома клетки.

Для удобства ссылки термин «гомологичные плечи» включает вышележащее и нижележащее гомологичные плечи. Эта терминология относится к относительному положению гомологичных плеч к полинуклеотидной вставке внутри нацеливающего вектора.

Таким образом, гомологичные плечи нацеливающего вектора сконструированы так, чтобы соответствовать целевому сайту с целевым локусом. Таким образом, гомологичные плечи могут соответствовать локусу, который является нативным по отношению к клетке, или, в альтернативном варианте осуществления, они могут соответствовать области гетерологичного или экзогенного сегмента ДНК, который был интегрирован в геном клетки, включая, без ограничений, трансгены, экспрессионные кассеты или гетерологичные или экзогенные области ДНК. В альтернативном варианте осуществления гомологичные плечи нацеливающего вектора могут соответствовать области дрожжевой искусственной хромосомы (YAC), бактериальной искусственной хромосомы (ВАС), человеческой искусственной хромосомы или любой другой сконструированной области, содержащейся в соответствующей клетке-хозяине. Еще дополнительно гомологичные плечи нацеливающего вектора могут соответствовать или могут быть получены из области из библиотеки ВАС, библиотеки космид или библиотеки фага Р1. Таким образом, в конкретных вариантах осуществления гомологичные плечи нацеливающего вектора соответствуют локусу, который является нативным, гетерологичным или экзогенным в отношении прокариота, дрожжей, птицы (например, курицы), не относящегося к человеку млекопитающего, грызуна, человека, крысы, мыши, хомяка, кролика, свиньи, коровы, оленя, овцы, козы, кошки, собаки, хорька, примата (например, мартышки, макаки-резус), домашнего млекопитающего животного, или сельскохозяйственного млекопитающего животного, или любого другого интересующего организма. В дополнительных вариантах осуществления при отсутствии одно- или двухцепочечного разрыва, индуцированного нуклеазный агентом, гомологичные плечи соответствуют локусу клетки, на который нельзя выполнить нацеливание с использованием стандартных способов, или нацеливание может быть только неверным или иметь очень низкую эффективность. В одном варианте осуществления гомологичные плечи получены из синтетической ДНК.

В других вариантах осуществления вышележащее и нижележащее гомологичные плечи соответствуют тому же геному, что и целевой геном. В одном варианте осуществления гомологичные плечи получены из родственного генома, например, целевой геном представляет собой геном мыши первой линии, а нацеливающие плечи получены из генома мыши второй линии, причем первая линия и вторая линия являются разными. В других вариантах осуществления гомологичные плечи получены из генома одного животного или получены из генома одной линии, например, целевой геном представляет собой геном мыши первой линии, и нацеливающие плечи получены из генома той же мыши или мыши той же линии.

Нацеливающий вектор (например, большой нацеливающий вектор) может также содержать кассету селекции или репортерный ген, как обсуждается в других разделах настоящего документа. Кассета селекции может содержать нуклеотидную последовательность, кодирующую селективный маркер, причем нуклеотидная последовательность функционально связана с промотором. Промотор может быть активным в интересующей прокариотической клетке и/или активным в интересующей эукариотической клетке. Такие промоторы могут представлять собой индуцируемый промотор, промотор, являющийся эндогенным по отношению к репортерному гену или клетке, промотор, являющийся гетерологичным по отношению к репортерному гену или клетке, клеточноспецифический промотор, тканеспецифический промотор или промотор, специфический для стадии развития. В одном варианте осуществления селективный маркер выбирают из неомицинфосфотрансферазы (neor), гигромицин-В-фосфотрансферазы (hygr), пуромицин-N-ацетилтрансферазы (puror), бластицидин-S-дезаминазы (bsrr), ксантин/гуанинфосфорибозилтрансферазы (gpt) и тимидинкиназы вируса простого герпеса (HSV-k) и их комбинации. Селективный маркер нацеливающего вектора может быть фланкирован вышележащим и нижележащим гомологичными плечами или находиться в направлении 5' или 3' от гомологичных плеч.

В одном варианте осуществления нацеливающий вектор (например, большой нацеливающий вектор) содержит репортерный ген, функционально связанный с промотором, причем репортерный ген кодирует репортерный белок, который выбирают из группы, состоящей из белков LacZ, mPlum, mCherry, tdTomato, mStrawberry, J-Red, DsRed, mOrange, mKO, mCitrine, Venus, YPet, усиленного желтого флуоресцентного белка (EYFP), Emerald, усиленного зеленого флуоресцентного белка (EGFP), CyPet, голубого флуоресцентного белка (CFP), Cerulean, T-Sapphire, люциферазы, щелочной фосфатазы и их комбинации. Такие репортерные гены могут быть функционально связаны с активным в клетке промотором. Такие промоторы могут представлять собой индуцируемый промотор, промотор, являющийся эндогенным по отношению к репортерному гену или клетке, промотор, являющийся гетерологичным по отношению к репортерному гену или клетке, клеточноспецифический промотор, тканеспецифический промотор или промотор, специфический для стадии развития.

В одном варианте осуществления совместное использование нацеливающего вектора (включая, например, большой нацеливающий вектор) с нуклеазный агентом приводит к повышению эффективности нацеливания по сравнению с использованием только нацеливающего вектора. В одном варианте осуществления, в котором нацеливающий вектор применяют вместе с нуклеазный агентом, эффективность нацеливания нацеливающего вектора увеличивается по меньшей мере в два раза, по меньшей мере в три раза, по меньшей мере в 4 раза или по меньшей мере в 10 раз по сравнению с использованием только нацеливающего вектора.

iii. Большие нацеливающие векторы

Термин «большой нацеливающий вектор» или LTVEC включает большие нацеливающие векторы, содержащие гомологичные плечи, которые соответствуют или получены из нуклеотидных последовательностей, имеющих большую длину, чем те, что обычно используются в других подходах, предназначенных для проведения гомологичной рекомбинации в клетках, и/или содержащие полинуклеотидные вставки, которые содержат нуклеотидные последовательности, имеющие большую длину, чем те, что обычно используются в других подходах, предназначенных для проведения гомологичной рекомбинации в клетках. В конкретных вариантах осуществления гомологичные плечи и/или полинуклеотидная вставка LTVEC содержит геномную последовательность эукариотической клетки. Размер LTVEC является слишком большим, чтобы имелась возможность скрининга событий таргетинга с помощью обычных анализов, например саузерн-блоттинга и ПЦР для амплификации протяженных участков (например, 1 т.п.н. - 5 т.п.н.). Примеры LTVEC включают, без ограничений, векторы, полученные из бактериальной искусственной хромосомы (ВАС), человеческой искусственной хромосомы или дрожжевой искусственной хромосомы (YAC). Не имеющие ограничительного характера примеры LTVEC и способов их получения описаны, например, в патентах США №№6,586,251, 6,596,541, 7,105,348 и WO 2002/036789 (PCT/US01/45375), каждый из которых полностью включен в настоящий документ путем ссылки.

LTVEC может иметь любую длину, включая, без ограничений, длину от около 20 т.п.н. до около 300 т.п.н., от около 20 т.п.н. до около 30 т.п.н., от около 30 т.п.н. до около 40 т.п.н., от около 40 т.п.н. до около 50 т.п.н., от около 50 т.п.н. до около 75 т.п.н., от около 75 т.п.н. до около 100 т.п.н., от около 100 т.п.н. до 125 т.п.н., от около 125 т.п.н. до около 150 т.п.н., от около 150 т.п.н. до около 175 т.п.н., около 175 т.п.н. до около 200 т.п.н., от около 200 т.п.н. до около 225 т.п.н., от около 225 т.п.н. до около 250 т.п.н., от около 250 т.п.н. до около 275 т.п.н. или от около 275 т.п.н. до около 300 т.п.н.

В одном варианте осуществления LTVEC содержит полинуклеотидную вставку с длиной в диапазоне от около 5 т.п.н. до около 200 т.п.н., от около 5 т.п.н. до около 10 т.п.н., от около 10 т.п.н. до около 20 т.п.н., от около 20 т.п.н. до около 30 т.п.н., от около 30 т.п.н. до около 40 т.п.н., от около 40 т.п.н. до около 50 т.п.н., от около 60 т.п.н. до около 70 т.п.н., от около 80 т.п.н. до около 90 т.п.н., от около 90 т.п.н. до около 100 т.п.н., от около 100 т.п.н. до около 110 т.п.н., от около 120 т.п.н. до около 130 т.п.н., от около 130 т.п.н. до около 140 т.п.н., от около 140 т.п.н. до около 150 т.п.н., от около 150 т.п.н. до около 160 т.п.н., от около 160 т.п.н. до около 170 т.п.н., от около 170 т.п.н. до около 180 т.п.н., от около 180 т.п.н. до около 190 т.п.н. или от около 190 т.п.н. до около 200 т.п.н.

В одном варианте осуществления гомологичные плечи LTVEC получены из библиотеки ВАС, библиотеки космид или библиотеки фага Р1. В других вариантах осуществления гомологичные плечи получены из целевого локуса (т.е. геномного локуса) клетки, и в некоторых случаях на целевой локус, для нацеливания на который LTVEC сконструирован, нельзя выполнить нацеливание с помощью стандартных способов. В других вариантах осуществления гомологичные плечи получены из синтетической ДНК. В одном варианте осуществления суммарная длина вышележащего гомологичного плеча и нижележащего гомологичного плеча в LTVEC составляет по меньшей мере 10 т.п.н. В одном варианте осуществления длина вышележащего гомологичного плеча находится в диапазоне от около 1 т.п.н. до около 100 т.п.н. В других вариантах осуществления длина вышележащего гомологичного плеча находится в диапазоне от около 5 т.п.н. до около 100 т.п.н. В одном варианте осуществления длина нижележащего гомологичного плеча находится в диапазоне от около 1 т.п.н. до около 100 т.п.н. В одном варианте осуществления длина нижележащего гомологичного плеча находится в диапазоне от около 5 т.п.н. до около 100 т.п.н. В других вариантах осуществления суммарная длина вышележащего и нижележащего гомологичных плеч составляет от около 1 т.п.н. до около 5 т.п.н., от около 5 т.п.н. до около 10 т.п.н., от около 10 т.п.н. до около 20 т.п.н., от около 20 т.п.н. до около 30 т.п.н., от около 30 т.п.н. до около 40 т.п.н., от около 40 т.п.н. до около 50 т.п.н., от около 50 т.п.н. до около 60 т.п.н., от около 60 т.п.н. до около 70 т.п.н., от около 70 т.п.н. до около 80 т.п.н., от около 80 т.п.н. до около 90 т.п.н., от около 90 т.п.н. до около 100 т.п.н., от около 100 т.п.н. до около 110 т.п.н., от около 110 т.п.н. до около 120 т.п.н., от около 120 т.п.н. до около 130 т.п.н., от около 130 т.п.н. до около 140 т.п.н., от около 140 т.п.н. до около 150 т.п.н., от около 150 т.п.н. до около 160 т.п.н., от около 160 т.п.н. до около 170 т.п.н., от около 170 т.п.н. до около 180 т.п.н., от около 180 т.п.н. до около 190 т.п.н. или от около 190 т.п.н. до около 200 т.п.н.

В других вариантах осуществления суммарная длина 5'- и 3'-гомологичных плеч LTVEC составляет от около 10 т.п.н. до около 30 т.п.н., от около 20 т.п.н. до около 40 т.п.н., от около 40 т.п.н. до около 60 т.п.н., от около 60 т.п.н. до около 80 т.п.н., от около 80 т.п.н. до около 100 т.п.н., от около 100 т.п.н. до около 120 т.п.н. или от около 120 т.п.н. до 150 т.п.н. В других случаях суммарная длина 5'- и 3'-гомологичных плеч составляет от около 16 т.п.н. до около 150 т.п.н.

В дополнительных вариантах осуществления LTVEC и полинуклеотидная вставка сконструированы так, чтобы позволить в целевом локусе делецию от около 5 т.п.н. до около 10 т.п.н., от около 10 т.п.н. до около 20 т.п.н., от около 20 т.п.н. до около 40 т.п.н., от около 40 т.п.н. до около 60 т.п.н., от около 60 т.п.н. до около 80 т.п.н., от около 80 т.п.н. до около 100 т.п.н., от около 100 т.п.н. до около 150 т.п.н. или от около 150 т.п.н. до около 200 т.п.н., от около 200 т.п.н. до около 300 т.п.н., от около 300 т.п.н. до около 400 т.п.н., от около 400 т.п.н. до около 500 т.п.н., от около 500 т.п.н. до около 1 млн п.н., от около 1 млн п.н. до около 1,5 млн п.н., от около 1,5 млн п.н. до около 2 млн п.н., от около 2 млн п.н. до около 2,5 млн п.н. или от около 2,5 млн п.н. до около 3 млн п.н.

В других случаях LTVEC и полинуклеотидная вставка сконструированы так, чтобы позволить инсерцию в целевой локус экзогенной нуклеотидной последовательности в диапазоне от около 5 т.п.н. до около 10 т.п.н., от около 10 т.п.н. до около 20 т.п.н., от около 20 т.п.н. до около 40 т.п.н., от около 40 т.п.н. до около 60 т.п.н., от около 60 т.п.н. до около 80 т.п.н., от около 80 т.п.н. до около 100 т.п.н., от около 100 т.п.н. до около 150 т.п.н., от около 150 т.п.н. до около 200 т.п.н., от около 200 т.п.н. до около 250 т.п.н., от около 250 т.п.н. до около 300 т.п.н., от около 300 т.п.н. до около 350 т.п.н. или от около 350 т.п.н. до около 400 т.п.н. В одном варианте осуществления длина полинуклеотидной вставки составляет около 130 т.п.н. или около 155 т.п.н.

В одном варианте осуществления LTVEC содержит кассету селекции или репортерный ген, как обсуждается в других разделах настоящего документа.

III. Способы интеграции интересующего полинуклеотида в целевой локус

А. Способы интеграции полинуклеотидной вставки вблизи сайта распознавания посредством гомологичной рекомбинации

Предложены способы модификации целевого локуса в клетке. Способы включают (а) обеспечение клетки, содержащей первый полинуклеотид, кодирующий первый селективный маркер, функционально связанный с первым активным в клетке промотором, причем первый полинуклеотид дополнительно содержит первый сайт распознавания для первого нуклеазного агента; (b) введение в клетку: (i) первого нуклеазного агента, который индуцирует одно- или двухцепочечный разрыв на первом сайте распознавания; и (ii) первого нацеливающего вектора, содержащего первую полинуклеотидную вставку, фланкированную первым и вторым гомологичными плечами, соответствующими первому и второму целевым сайтам, расположенным достаточно близко к первому сайту распознавания; и (с) идентификацию по меньшей мере одной клетки, содержащей первую полинуклеотидную вставку, интегрированную в целевой локус. В конкретных вариантах осуществления первый полинуклеотид, содержащий первый селективный маркер, фланкирован первым целевым сайтом и вторым целевым сайтом, причем первый целевой сайт соответствует первому гомологичному плечу в первом нацеливающем векторе, а второй целевой сайт соответствует второму гомологичному плечу в первом нацеливающем векторе.

Для идентификации клеток, имеющих интегрированную в целевой локус полинуклеотидную вставку, можно использовать различные способы. В одном варианте осуществления одно- или двухцепочечный разрыв на первом сайте распознавания нарушает активность первого селективного маркера. Таким образом, в одном варианте осуществления такие клетки идентифицируют посредством культивирования клеток в условиях, позволяющих идентифицировать клетки, не обладающие активностью селективного маркера, кодированного полинуклеотидом, имеющим сайт распознавания, который был вырезан с помощью нуклеазного агента. Известны способы, в которых используются селективные маркеры, и анализы определения их активности. Дополнительный способ идентификации клеток, имеющих полинуклеотидную вставку в целевом локусе, может включать идентификацию по меньшей мере одной клетки, содержащей полинуклеотидную вставку, интегрированную в заданный целевой сайт. Такие способы могут включать идентификацию по меньшей мере одной клетки, содержащей в своем геноме первую полинуклеотидную вставку, интегрированную в первый и второй целевой сайт.

Для идентификации клеток, имеющих интегрированную в целевой локус полинуклеотидную вставку, можно также использовать дополнительные способы. Инсерция полинуклеотидной вставки в целевой локус приводит к «модификации аллеля». Термин «модификация аллеля» или МОА включает модификацию точной последовательности ДНК одного аллеля гена(-ов) хромосомного локуса(-ов) в геноме. Примеры «модификации аллеля» (МОА) включают, без ограничений, делеции, замены или инсерции всего одного нуклеотида или делеции многих тысяч пар нуклеотидов, охватывающих интересующий(-ие) ген(-ы) или хромосомный(-ые) локус(-ы), а также любые и все возможные модификации между этими двумя крайностями.

В различных вариантах осуществления для облегчения идентификации целевой модификации используют высокопроизводительный количественный анализ, а именно - анализ определения модификации аллеля (МОА). Описанный в настоящем документе анализ МОА позволяет проводить крупномасштабный скрининг модифицированного(-ых) аллеля(-ей) в родительской хромосоме после генетической модификации. Анализ МОА можно проводить посредством различных аналитических методик, включая, без ограничений, количественную полимерную цепную реакцию (ПЦР), например ПЦР в реальном времени (кПЦР). Например, ПЦР в реальном времени включает в себя первый набор праймеров, который распознает целевой локус, и второй набор праймеров, который распознает нецелевой эталонный локус. Кроме того, набор праймеров содержит флуоресцентный зонд, который распознает амплифицированную последовательность. Количественный анализ также может быть осуществлен посредством различных аналитических методик, включая, без ограничений, флуоресцентную гибридизацию in situ (FISH), сравнительную геномную гибридизацию, изотермическую амплификацию ДНК, количественную гибридизацию с иммобилизованным зондом(-ами), Invader Probes®, ММР assays®, технологии с использованием зондов TaqMan® Molecular Beacon и Eclipse™. (См., например, публикацию US 2005/0144655, включенную в настоящий документ путем ссылки в полном объеме).

В различных вариантах осуществления наличие одно- или двухцепочечного разрыва в сайте распознавания в пределах селективного маркера увеличивает эффективность и/или частоту рекомбинации между нацеливающим вектором (таким как LTVEC) и целевым локусом. В одном варианте осуществления рекомбинация представляет собой гомологичную рекомбинацию. В различных вариантах осуществления в присутствии одно- или двухцепочечного разрыва эффективность нацеливания нацеливающего вектора (такого как LTVEC) в целевом локусе увеличивается по меньшей мере приблизительно в 2 раза, по меньшей мере приблизительно в 3 раза, по меньшей мере приблизительно в 4 раза, по меньшей мере приблизительно в 10 раз по сравнению с отсутствием одно- или двухцепочечного разрыва (при использовании, например, того же нацеливающего вектора и тех же гомологичных плеч и соответствующих целевых сайтов в интересующем локусе, но без добавления нуклеазного агента, который выполняет одно- или двухцепочечный разрыв).

В. Способы интеграции множества интересующих полинуклеотидов в целевой локус

Различные способы и композиции, предложенные в настоящем документе, позволяют выполнить нацеленную интеграцию множества интересующих полинуклеотидов внутрь данного целевого локуса. В способах используется система нацеленной интеграции, описанная в настоящем документе, в которой применяется стратегическое позиционирование сайта распознавания нуклеазного агента внутри полинуклеотида, кодирующего селективный маркер. В конкретных вариантах осуществления селективный маркер и сайт распознавания внутри каждой полинуклеотидной вставки чередуются. При этом происходит последовательное мозаичное расположение полинуклеотидных вставок внутри данного целевого локуса с улучшенной эффективностью и продуктивностью.

В одном варианте осуществления способ модификации целевого локуса в клетке включает: (а) обеспечение клетки, содержащей локус, который содержит первый полинуклеотид, кодирующий первый селективный маркер, функционально связанный с первым активным в клетке промотором, причем первый полинуклеотид дополнительно содержит первый сайт распознавания для первого нуклеазного агента; (b) введение в клетку первого нуклеазного агента, при этом первый нуклеазный агент индуцирует одно- или двухцепочечный разрыв на первом сайте распознавания; и введение в клетку первого нацеливающего вектора, содержащего первую полинуклеотидную вставку, фланкированную первым и вторым гомологичными плечами, которые соответствуют первому и второму целевым сайтам, расположенным достаточно близко к первому сайту распознавания; и первая полинуклеотидная вставка дополнительно содержит (1) первый интересующий полинуклеотид; и (2) второй полинуклеотид, кодирующий второй селективный маркер, функционально связанный со вторым активным в клетке промотором, при этом второй полинуклеотид содержит второй сайт распознавания для второго нуклеазного агента; и (с) идентификацию по меньшей мере одной клетки, содержащей первую полинуклеотидную вставку, интегрированную в целевой локус.

В дополнительных вариантах осуществления в целевой локус могут быть интегрированы дополнительные интересующие полинуклеотиды. Такие способы модификации целевого локуса в клетке включают: (а) обеспечение клетки, содержащей локус, который содержит первый полинуклеотид, кодирующий первый селективный маркер, функционально связанный с первым активным в клетке промотором, причем первый полинуклеотид дополнительно содержит первый сайт распознавания для первого нуклеазного агента; (b) введение в клетку первого нуклеазного агента, при этом первый нуклеазный агент индуцирует одно- или двухцепочечный разрыв на первом сайте распознавания; и введение в клетку первого нацеливающего вектора, содержащего первую полинуклеотидную вставку, фланкированную первым и вторым гомологичными плечами, которые соответствуют первому и второму целевым сайтам, расположенным достаточно близко к первому сайту распознавания; и первая полинуклеотидная вставка дополнительно содержит (1) первый интересующий полинуклеотид; и (2) второй полинуклеотид, кодирующий второй селективный маркер, функционально связанный со вторым активным в клетке промотором, при этом второй полинуклеотид содержит второй сайт распознавания для второго нуклеазного агента; (с) идентификацию по меньшей мере одной клетки, содержащей первую полинуклеотидную вставку, интегрированную в целевой локус; (d) введение в клетку, содержащую в своем геноме первую полинуклеотидную вставку, интегрированную в целевой локус, (i) второго нуклеазного агента, причем второй нуклеазный агент индуцирует одно- или двухцепочечный разрыв на втором сайте распознавания; и (ii) второго нацеливающего вектора, содержащего вторую полинуклеотидную вставку, фланкированную третьим и четвертым гомологичными плечами; и (b) идентификацию по меньшей мере одной клетки, содержащей вторую полинуклеотидную вставку, интегрированную в целевой локус. В конкретных вариантах осуществления одно- или двухцепочечный разрыв на втором маркере распознавания нарушает активность второго селективного маркера. В дополнительных вариантах осуществления идентификация по меньшей мере одной клетки, содержащей вторую полинуклеотидную вставку, интегрированную в целевой локус, включает культивирование клетки в условиях, позволяющих идентифицировать клетки, не обладающие активностью второго селективного маркера. В еще дополнительных вариантах осуществления второй полинуклеотид, содержащий второй селективный маркер, фланкирован третьим целевым сайтом и четвертым целевым сайтом, третий целевой сайт соответствует третьему гомологичному плечу во втором нацеливающем векторе, а четвертый целевой сайт соответствует четвертому гомологичному плечу во втором нацеливающем векторе. В еще дополнительных вариантах осуществления идентификация по меньшей мере одной клетки, содержащей вторую полинуклеотидную вставку, интегрированную в целевой локус, включает идентификацию по меньшей мере одной клетки, содержащей вторую полинуклеотидную вставку, интегрированную в третий и четвертый целевые сайты.

Дополнительные способы модификации целевого локуса в клетке включают: (а) обеспечение клетки, содержащей целевой локус, который содержит первый полинуклеотид, кодирующий первый селективный маркер, функционально связанный с первым активным в клетке промотором, причем первый полинуклеотид дополнительно содержит первый сайт распознавания для первого нуклеазного агента; (b) введение в клетку (i) первого нуклеазного агента, при этом первый нуклеазный агент индуцирует одно- или двухцепочечный разрыв на первом сайте распознавания; и (ii) первого нацеливающего вектора, содержащего первую полинуклеотидную вставку, фланкированную первым и вторым гомологичными плечами, соответствующими первому и второму целевым сайтам, расположенным достаточно близко к первому сайту распознавания, и при этом первая полинуклеотидная вставка дополнительно содержит (1) первый интересующий полинуклеотид; и (2) второй полинуклеотид, кодирующий второй селективный маркер, функционально связанный со вторым активным в клетке промотором, при этом второй полинуклеотид содержит второй сайт распознавания для второго нуклеазного агента, и второй полинуклеотид, содержащий второй селективный маркер, фланкирован третьим целевым сайтом и четвертым целевым сайтом, при этом третий целевой сайт соответствует третьему гомологичному плечу во втором нацеливающем векторе, а четвертый целевой сайт соответствует четвертому гомологичному плечу во втором нацеливающем векторе; (с) идентификацию по меньшей мере одной клетки, содержащей первую полинуклеотидную вставку, интегрированную в целевой локус; (d) введение в клетку, содержащую первую полинуклеотидную вставку, интегрированную в целевой локус, (i) второго нуклеазного агента, причем второй нуклеазный агент индуцирует одно- или двухцепочечный разрыв на втором сайте распознавания; и (ii) второго нацеливающего вектора, содержащего вторую полинуклеотидную вставку, фланкированную третьим и четвертым гомологичными плечами, при этом вторая полинуклеотидная вставка содержит (1) второй интересующий полинуклеотид; и (2) третий полинуклеотид, кодирующий третий селективный маркер, функционально связанный с третьим активным в клетке промотором, при этом третий полинуклеотид содержит третий сайт распознавания для третьего нуклеазного агента; и (b) идентификацию по меньшей мере одной клетки, содержащей вторую полинуклеотидную вставку, интегрированную в целевой локус. В конкретных вариантах осуществления одно- или двухцепочечный разрыв на втором маркере распознавания нарушает активность второго селективного маркера. В дополнительных вариантах осуществления идентификация по меньшей мере одной клетки, содержащей в своем геноме вторую полинуклеотидную вставку, интегрированную в целевой локус, включает культивирование клетки в условиях, позволяющих идентифицировать клетки, не обладающие активностью второго селективного маркера. В дополнительных вариантах осуществления идентификация по меньшей мере одной клетки, содержащей в своем геноме вторую полинуклеотидную вставку, интегрированную в целевой локус, включает идентификацию по меньшей мере одной клетки, содержащей в своем геноме вторую полинуклеотидную вставку, интегрированную в третий и четвертый целевые сайты.

Различные способы, изложенные выше, могут последовательно повторяться, чтобы обеспечить нацеленную интеграцию любого количества полинуклеотидных вставок в данный целевой локус. Таким образом, различные способы обеспечивают вставку в целевой локус по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или более полинуклеотидных вставок. В некоторых вариантах осуществления такие способы последовательного мозаичного расположения позволяют проводить реконструкцию больших геномных областей из клетки млекопитающего (т.е. человека, не относящегося к человеку животного, грызуна, мыши, обезьяны, крысы, хомяка, домашнего млекопитающего животного или сельскохозяйственного животного) в целевом локусе (т.е. геномном локусе). В таких случаях перенос и реконструкция геномных областей, которые включают в себя как кодирующие, так и некодирующие области, позволяет сохранить сложность данной области путем сохранения, по меньшей мере частично, кодирующих областей, некодирующих областей и вариантов числа копий в нативной геномной области. Таким образом, в различных способах предложены, например, способы создания «гетерологичных» или «экзогенных» геномных областей в пределах любой клетки млекопитающего или интересующего животного. В одном не имеющем ограничительного характера примере в не относящемся к человеку животном создается «гуманизированная» геномная область.

При выполнении интеграции множества полинуклеотидных вставок в данный целевой локус между раундами интеграции можно чередовать полинуклеотиды, кодирующие селективные маркеры, и полинуклеотиды, содержащие сайт распознавания нуклеазного агента. Например, в конкретных способах первый нуклеазный агент отличается от второго нуклеазного агента, и/или первый селективный маркер отличается от второго селективного маркера. В других примерах при введении в целевой локус трех полинуклеотидных вставок первый и третий селективные маркеры могут быть одинаковыми и, в конкретных вариантах осуществления, дополнительно содержат одинаковый сайт распознавания, а второй селективный маркер может отличаться от первого и третьего селективного маркера и содержать отличный сайт распознавания. Такой вид отбора селективных маркеров и сайтов распознавания сводит к минимуму количество нуклеазных агентов, которые необходимо создать, и таким образом улучшает эффективность и продуктивность событий интеграции.

С. Способы модификации одного или более целевых локусов с использованием системы CRISPR/Cas

Предложены способы и композиции для модификации одного или более интересующих целевых локусов в клетке с использованием системы CRISPR/Cas, как описано в других разделах настоящего документа. Для системы CRISPR/Cas термины «целевой сайт» или «целевая последовательность» можно использовать взаимозаменяемо, и они включают нуклеотидные последовательности, присутствующие в целевой ДНК, с которой будет связываться сегмент ДНК-нацеливания гидовой РНК (гРНК), при условии существования достаточных условий для связывания. Например, на целевой сайт (или целевую последовательность) в целевой ДНК оказывает целевое воздействие (или связывается, или гибридизуется, или является комплементарной) нуклеаза Cas или гРНК. Подходящие условия связывания ДНК/РНК включают физиологические условия, обычно существующие в клетке. Другие подходящие условия связывания ДНК/РНК (например, условия в бесклеточной системе) известны в данной области (см., например, Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook et al., Harbor Laboratory Press 2001)). Цепь целевой ДНК, которая является комплементарной или гибридизуется с белком Cas или гРНК, называется «комплементарной цепью», а цепь целевой ДНК, которая является комплементарной «комплементарной цепи» (и, таким образом, не комплементарной белку Cas или гРНК), называется «некомплементарной цепью» или «матричной цепью».

Белок Cas может расщеплять нуклеиновую кислоту на сайте в пределах целевой последовательности или за пределами целевой последовательности. «Сайт расщепления» включает положение нуклеиновой кислоты, в котором белок Cas производит одноцепочечный разрыв или двухцепочечный разрыв. «Липкие» концы также могут быть получены с использованием двух белков Cas9, которые производят одноцепочечный разрыв на сайте расщепления в каждой цепи. Сайт-специфическое расщепление целевой ДНК белком Cas9 может происходить в местах, определенных как (i) комплементарностью спариваемых нуклеотидов между гидовой РНК и целевой ДНК, так и (ii) наличием в целевой ДНК короткого мотива, который называется мотивом, прилежащим к протоспейсеру (РАМ). Например, сайт расщепления Cas9 может находиться на расстоянии от около 1 до около 10 или от около 2 до около 5 пар нуклеотидов (например, 3 пар нуклеотидов) выше последовательности РАМ. В некоторых вариантах осуществления (например, когда используется Cas9 из S. pyogenes или близкородственный Cas9) последовательность РАМ некомплементарной цепи может представлять собой 5'-XGG-3', где X является любым нуклеотидом ДНК, и при этом X находится непосредственно на 3'-конце целевой последовательности некомплементарной цепи целевой ДНК. По существу, последовательность РАМ комплементарной цепи будет представлять собой 5'-CCY-3', где Y является любым нуклеотидом ДНК, и при этом Y находится непосредственно на 5'-конце целевой последовательности комплементарной цепи целевой ДНК. В некоторых таких вариантах осуществления X и Y могут быть комплементарными, и пара нуклеотидов X-Y может являться любой парой нуклеотидов (например, X=C и Y=G; X=G и Y=C; X=A и Y=T, X=T и Y=A).

Таким образом, в некоторых вариантах осуществления способы модификации интересующего целевого локуса в клетке включают: (а) обеспечение клетки, содержащей первый целевой локус, который содержит нуклеиновую кислоту, кодирующую первый селективный маркер, функционально связанный с первым промотором; (b) введение в клетку (i) одной или более экспрессионных конструкций, кодирующих белок Cas, и первой гидовой РНК (гРНК), каждая из которых функционально связана с активным в клетке промотором, причем белок Cas индуцирует одно- или двухцепочечный разрыв на первом целевом сайте гРНК в первой нуклеиновой кислоте, тем самым нарушая экспрессию или активность первого селективного маркера, и (ii) первого нацеливающего вектора, содержащего первую нуклеотидную вставку, которая содержит вторую нуклеиновую кислоту, кодирующую второй селективный маркер, функционально связанный со вторым промотором, при этом первая нуклеотидная вставка фланкирована первым и вторым гомологичными плечами, соответствующими первому и второму целевым сайтам, расположенным в первом целевом локусе; и (с) идентификацию модифицированной клетки, содержащей первую нуклеотидную вставку в первом целевом локусе, при этом модифицированная клетка обладает активностью второго селективного маркера, но не обладает активностью первого селективного маркера, и при этом первый и второй селективные маркеры являются разными. В одном варианте осуществления не происходит гибридизации первой гРНК с первой нуклеотидной вставкой. В одном варианте осуществления интересующий целевой локус расположен в геноме клетки. В другом варианте осуществления интересующий целевой локус расположен в векторе в клетке. В одном варианте осуществления этап идентификации (с) включает культивирование клетки в условиях, позволяющих идентифицировать модифицированную клетку, обладающую активностью второго селективного маркера, но не обладающую активностью первого селективного маркера.

В одном варианте осуществления способ дополнительно включает (d) введение в модифицированную клетку, содержащую первую нуклеотидную вставку в первом целевом локусе, (i) одной или более нуклеиновых кислот, кодирующих белок Cas, и второй гРНК, каждая из которых функционально связана с промотором, активным в модифицированной клетке, причем белок Cas индуцирует одно- или двухцепочечный разрыв на втором целевом сайте гРНК в первой нуклеотидной вставке, содержащей вторую нуклеиновую кислоту, тем самым нарушая экспрессию или активность второго селективного маркера, и (ii) второго нацеливающего вектора, содержащего вторую нуклеотидную вставку, которая содержит третью нуклеиновую кислоту, кодирующую третий селективный маркер, функционально связанный с третьим промотором, при этом вторая нуклеотидная вставка фланкирована третьим и четвертым гомологичными плечами, соответствующими третьему и четвертому целевым сайтам, расположенным во втором целевом локусе; и (е) идентификацию второй модифицированной клетки, содержащей вторую нуклеотидную вставку во втором целевом локусе, при этом вторая модифицированная клетка обладает активностью третьего селективного маркера, но не обладает активностью второго селективного маркера, при этом второй и третий селективные маркеры являются разными. В одном варианте осуществления первый и второй целевые локусы непосредственно смежны друг с другом. В другом варианте осуществления первый или второй целевой локус расположен на расстоянии от около 10 нуклеотидов до около 14 т.п.н. от первого или второго целевого сайта гРНК. В одном варианте осуществления не происходит гибридизации второй гРНК со второй нуклеотидной вставкой. В одном варианте осуществления этап идентификации (е) включает культивирование модифицированной клетки в условиях, позволяющих идентифицировать вторую модифицированную клетку, обладающую активностью третьего селективного маркера, но не обладающую активностью второго селективного маркера.

В одном варианте осуществления способ дополнительно включает (f) введение во вторую модифицированную клетку, содержащую вторую нуклеотидную вставку во втором целевом локусе: (i) одной или более экспрессионных конструкций, кодирующих белок Cas, и третьей гРНК, каждая из которых функционально связана с промотором, активным во второй модифицированной клетке, причем белок Cas индуцирует одно- или двухцепочечный разрыв на третьем целевом сайте гРНК во второй нуклеотидной вставке, содержащей третью нуклеиновую кислоту, тем самым нарушая экспрессию или активность третьего селективного маркера, и (ii) третьего нацеливающего вектора, содержащего третью нуклеотидную вставку, которая содержит четвертую нуклеиновую кислоту, кодирующую четвертый селективный маркер, функционально связанный с четвертым промотором, при этом третья нуклеотидная вставка фланкирована пятым и шестым гомологичными плечами, соответствующими пятому и шестому целевым сайтам, расположенным в третьем целевом локусе; и (g) идентификацию третьей модифицированной клетки, содержащей третью нуклеотидную вставку в третьем целевом локусе, при этом третья модифицированная клетка обладает активностью четвертого селективного маркера, но не обладает активностью третьего селективного маркера, при этом третий и четвертый селективные маркеры являются разными. В одном варианте осуществления второй и третий целевые локусы непосредственно смежны друг с другом. В другом варианте осуществления второй или третий целевой локус расположен на расстоянии от около 10 нуклеотидов до около 14 т.п.н. от первого или второго целевого сайта гРНК.

В одном варианте осуществления первый, второй, третий или четвертый маркер придает устойчивость к антибиотику. В одном варианте осуществления антибиотик представляет собой G418, гигромицин, бластицидин, неомицин или пуромицин. В одном варианте осуществления первый, второй, третий или четвертый селективный маркер содержит гипоксантингуанинфосфорибозилтрансферазу (HGPRT) или тимидинкиназу вируса простого герпеса (HSV-TK). В одном варианте осуществления первая, вторая или третья гРНК содержит (i) нуклеотидную последовательность, которая гибридизуется с первым, вторым или третьим целевым сайтом гРНК, и (ii) трансактивирующую РНК CRISPR (тракрРНК). В одном варианте осуществления первый, второй или третий целевой локус расположен в непосредственной близости к первому, второму или третьему целевому сайту гРНК так, что одно- или двухцепочечный разрыв на целевом сайте гРНК способствует гомологичной рекомбинации нацеливающего вектора в целевом локусе. В одном варианте осуществления белок Cas представляет собой Cas9. В одном варианте осуществления первый, второй или третий целевой сайт гРНК непосредственно фланкирован последовательностью мотива, прилежащего к протоспейсеру (РАМ).

В конкретных вариантах осуществления гРНК сконструирована для нацеливания на первый маркер селекции антибиотиками (например, Hygr) для введения первой нуклеотидной вставки, кодирующей второй селективный маркер (например, Neor), таким образом, введение первой нуклеотидной вставки нарушает активность первого маркера селекции антибиотиками. Может быть разработана вторая плазмида экспрессии гРНК для экспрессии гРНК, оказывающей целевое воздействие на второй селективный маркер для введения второй нуклеотидной вставки, кодирующей первый селективный маркер, таким образом, введение второй нуклеотидной вставки нарушает активность второго маркера селекции антибиотиками. Таким образом, гРНК должны быть сконструированы только для того, чтобы оказывать целевое воздействие на каждый из двух маркеров селекции антибиотиками, которые могут быть использованы в чередующихся вставках нуклеиновых кислот. Примеры нуклеиновых кислот, кодирующих гРНК, специфичные для селективных маркеров устойчивости к Neo, приведены в SEQ ID NO: 13, 14, 15 и 16. Примеры нуклеиновых кислот, кодирующих гРНК, специфичные для селективных маркеров устойчивости к Hyg, приведены в SEQ ID NO: 17, 18, 19 и 20.

В одном варианте осуществления клетка представляет собой прокариотическую клетку. В другом варианте осуществления клетка представляет собой эукариотическую клетку. В одном варианте осуществления эукариотическая клетка представляет собой клетку млекопитающего или клетку не относящегося к человеку млекопитающего. В одном варианте осуществления клетка млекопитающего представляет собой клетку-фибробласт. В одном варианте осуществления клетка млекопитающего представляет собой клетку-фибробласт человека. В одном варианте осуществления клетка млекопитающего представляет собой стволовую клетку взрослого человека. В одном варианте осуществления клетка млекопитающего представляет собой онтогенетически ограниченную клетку-предшественника. В одном варианте осуществления клетка млекопитающего представляет собой онтогенетически ограниченную человеческую клетку-предшественника.

В одном варианте осуществления клетка млекопитающего представляет собой клетку не относящегося к человеку млекопитающего. В одном варианте осуществления клетка млекопитающего получена от грызуна. В одном варианте осуществления грызун представляет собой крысу, мышь или хомяка. В одном варианте осуществления эукариотическая клетка представляет собой плюрипотентную клетку. В одном варианте осуществления плюрипотентная клетка представляет собой гемопоэтическую стволовую клетку или нейрональную стволовую клетку. В одном варианте осуществления плюрипотентная клетка представляет собой человеческую индуцированную плюрипотентную стволовую (ИПС) клетку. В одном варианте осуществления плюрипотентная клетка представляет собой не относящуюся к человеку ЭС-клетку, человеческую ЭС-клетку, эмбриональную стволовую (ЭС) клетку грызуна, эмбриональную стволовую (ЭС) клетку мыши или эмбриональную стволовую (ЭС) клетку крысы.

В одном варианте осуществления первый, второй или третий целевой сайт гРНК расположен в интроне, экзоне, промоторе или регуляторной области промотора в первой, второй или третьей нуклеиновой кислоте, которая кодирует первый, второй или третий селективный маркер. В одном варианте осуществления длина первого, второго или третьего нацеливающего вектора составляет по меньшей мере около 10 т.п.н. В одном варианте осуществления длина первой, второй или третьей нуклеотидной вставки находится в диапазоне от около 5 т.п.н. до около 300 т.п.н.

В одном варианте осуществления первая, вторая или третья нуклеотидная вставка содержит геномную область локуса Т-клеточного альфа-рецептора человека. В одном варианте осуществления геномная область содержит по меньшей мере один генный сегмент вариабельной области и/или генный сегмент соединительной области локуса Т-клеточного альфа-рецептора человека.

В одном варианте осуществления первый и третий селективные маркеры являются одинаковыми. В одном варианте осуществления первый и третий селективные маркеры являются одинаковыми, и второй и четвертый селективные маркеры являются одинаковыми. В одном варианте осуществления первая и третья гРНК являются одинаковыми.

В некоторых вариантах осуществления способы модификации интересующего целевого локуса в клетке включают: (а) обеспечение клетки, содержащей первый целевой локус, который содержит нуклеиновую кислоту, кодирующую первый селективный маркер, функционально связанный с первым промотором; (b) введение в клетку (i) одной или более экспрессионных конструкций, кодирующих белок Cas, и первой гРНК, каждая из которых функционально связана с активным в клетке промотором, причем белок Cas индуцирует одно- или двухцепочечный разрыв на первом целевом сайте гРНК в первой нуклеиновой кислоте, тем самым нарушая экспрессию или активность первого селективного маркера, и (ii) первого нацеливающего вектора, содержащего первую нуклеотидную вставку, которая содержит вторую нуклеиновую кислоту, кодирующую второй селективный маркер, функционально связанный со вторым промотором, при этом первая нуклеотидная вставка фланкирована первым и вторым гомологичными плечами, соответствующими первому и второму целевым сайтам, расположенным в первом целевом локусе; (с) идентификацию модифицированной клетки, содержащей первую нуклеотидную вставку в первом целевом локусе, при этом модифицированная клетка обладает активностью второго селективного маркера, но не обладает активностью первого селективного маркера, и при этом первый и второй селективные маркеры являются разными; (d) введение в модифицированную клетку, содержащую первую нуклеотидную вставку в первом целевом локусе: (i) одной или более нуклеиновых кислот, кодирующих белок Cas, и второй гРНК, каждая из которых функционально связана с промотором, активным в модифицированной клетке, причем белок Cas индуцирует одно- или двухцепочечный разрыв на втором целевом сайте гРНК в первой нуклеотидной вставке, содержащей вторую нуклеиновую кислоту, тем самым нарушая экспрессию или активность второго селективного маркера, и (ii) второго нацеливающего вектора, содержащего вторую нуклеотидную вставку, которая содержит третью нуклеиновую кислоту, кодирующую третий селективный маркер, функционально связанный с третьим промотором, при этом вторая нуклеотидная вставка фланкирована третьим и четвертым гомологичными плечами, соответствующими третьему и четвертому целевым сайтам, расположенным во втором целевом локусе; и (е) идентификацию второй модифицированной клетки, содержащей вторую нуклеотидную вставку во втором целевом локусе, при этом вторая модифицированная клетка обладает активностью третьего селективного маркера, но не обладает активностью второго селективного маркера, при этом первый и третий селективные маркеры являются одинаковыми, а второй и третий селективные маркеры являются разными.

В других вариантах осуществления способы модификации интересующего целевого локуса в клетке включают: (а) обеспечение клетки, содержащей первый целевой локус, который содержит нуклеиновую кислоту, кодирующую первый селективный маркер, функционально связанный с первым промотором; (b) введение в клетку (i) одной или более экспрессионных конструкций, кодирующих белок Cas, и первой гРНК, каждая из которых функционально связана с активным в клетке промотором, причем белок Cas индуцирует одно- или двухцепочечный разрыв на первом целевом сайте гРНК в первой нуклеиновой кислоте, тем самым нарушая экспрессию или активность первого селективного маркера, и (ii) первого нацеливающего вектора, содержащего первую нуклеотидную вставку, которая содержит вторую нуклеиновую кислоту, кодирующую второй селективный маркер, функционально связанный со вторым промотором, при этом первая нуклеотидная вставка фланкирована первым и вторым гомологичными плечами, соответствующими первому и второму целевым сайтам, расположенным в первом целевом локусе; (с) идентификацию модифицированной клетки, содержащей первую нуклеотидную вставку в первом целевом локусе, при этом модифицированная клетка обладает активностью второго селективного маркера, но не обладает активностью первого селективного маркера, и при этом первый и второй селективные маркеры являются разными; (d) введение в модифицированную клетку, содержащую первую нуклеотидную вставку в первом целевом локусе: (i) одной или более нуклеиновых кислот, кодирующих белок Cas, и второй гРНК, каждая из которых функционально связана с промотором, активным в модифицированной клетке, причем белок Cas индуцирует одно- или двухцепочечный разрыв на втором целевом сайте гРНК в первой нуклеотидной вставке, содержащей вторую нуклеиновую кислоту, тем самым нарушая экспрессию или активность второго селективного маркера, и (ii) второго нацеливающего вектора, содержащего вторую нуклеотидную вставку, которая содержит третью нуклеиновую кислоту, кодирующую третий селективный маркер, функционально связанный с третьим промотором, при этом вторая нуклеотидная вставка фланкирована третьим и четвертым гомологичными плечами, соответствующими третьему и четвертому целевым сайтам, расположенным во втором целевом локусе; (е) идентификацию второй модифицированной клетки, содержащей вторую нуклеотидную вставку во втором целевом локусе, при этом вторая модифицированная клетка обладает активностью третьего селективного маркера, но не обладает активностью второго селективного маркера, при этом второй и третий селективные маркеры являются разными; (f) введение во вторую модифицированную клетку, содержащую вторую нуклеотидную вставку во втором целевом локусе: (i) одной или более экспрессионных конструкций, кодирующих белок Cas, и третьей гРНК, каждая из которых функционально связана с промотором, активным во второй модифицированной клетке, причем белок Cas индуцирует одно- или двухцепочечный разрыв на третьем целевом сайте гРНК во второй нуклеотидной вставке, содержащей третью нуклеиновую кислоту, тем самым нарушая экспрессию или активность третьего селективного маркера; и (ii) третьего нацеливающего вектора, содержащего третью нуклеотидную вставку, которая содержит четвертую нуклеиновую кислоту, кодирующую четвертый селективный маркер, функционально связанный с четвертым промотором, при этом третья нуклеотидная вставка фланкирована пятым и шестым гомологичными плечами, соответствующими пятому и шестому целевым сайтам, расположенным в третьем целевом локусе; и (g) идентификацию третьей модифицированной клетки, содержащей третью нуклеотидную вставку в третьем целевом локусе, при этом третья модифицированная клетка обладает активностью четвертого селективного маркера, но не обладает активностью третьего селективного маркера, при этом третий и четвертый селективные маркеры являются разными. В некоторых вариантах осуществления первый и третий селективные маркеры являются одинаковыми, и второй и четвертый селективные маркеры являются одинаковыми. В одном варианте осуществления первый и третий селективные маркеры являются одинаковыми, второй и четвертый селективные маркеры являются одинаковыми, и первая и третья гРНК являются одинаковыми.

IV. Интересующие полинуклеотиды

Любой интересующий полинуклеотид может содержаться в различных полинуклеотидных вставках и, таким образом, быть интегрированным в целевой локус. Способы, описанные в настоящем документе, обеспечивают интеграцию в целевой локус по меньшей мере 1, 2, 3, 4, 5, 6 или более интересующих полинуклеотидов.

При интеграции в целевой локус интересующий полинуклеотид, находящийся внутри полинуклеотидной вставки, может вводить одну или более генетических модификаций в клетку. Генетическая модификация может представлять собой делецию эндогенной нуклеотидной последовательности и/или добавление экзогенного, или гетерологичного, или ортологичного полинуклеотида в целевой локус. В одном варианте осуществления генетическая модификация представляет собой замену в целевом локусе эндогенной нуклеотидной последовательности интересующим экзогенным полинуклеотидом. Таким образом, в настоящем документе предложены способы, обеспечивающие получение генетической модификации, представляющей собой нокаут, делецию, инсерцию, замену (нокин), точечную мутацию, перестановку доменов, перестановку экзонов, перестановку интронов, перестановку регуляторных последовательностей, перестановку генов или их комбинацию. Такие модификации могут происходить при интеграции в целевой локус первой, второй, третьей, четвертой, пятой, шестой, седьмой или любой последующей полинуклеотидной вставки.

Интересующий полинуклеотид внутри полинуклеотидной вставки и/или интегрированный в целевой локус может содержать последовательность, которая является нативной или гомологичной по отношению к клетке, в которую он вводится; интересующий полинуклеотид может быть гетерологичным по отношению к клетке, в которую он вводится; интересующий полинуклеотид может быть экзогенным по отношению к клетке, в которую он вводится; интересующий полинуклеотид может быть ортологичным по отношению к клетке, в которую он вводится; или интересующий полинуклеотид может быть из другого вида, чем клетка, в которую он вводится. Термин «гомологичный» в отношении последовательности означает последовательность, которая является нативной по отношению к клетке. Термин «гетерологичный» в отношении последовательности означает последовательность, полученную из другого вида, или, если она получена от того же вида, по существу подвергнутую модификации относительно ее нативной формы в композиции и/или в локусе в результате целенаправленного вмешательства человека. Термин «экзогенный» в отношении последовательности означает последовательность, которая происходит из другого вида. Термин «ортологичный» означает полинуклеотид из одного вида, который является функционально эквивалентным известной эталонной последовательности из другого вида (т.е. видовой вариант). Интересующий полинуклеотид может быть получен из любого интересующего организма, включая, без ограничений, не относящегося к человеку животного, грызуна, хомяка, мышь, крысу, человека, обезьяну, сельскохозяйственное млекопитающее животное или несельскохозяйственное млекопитающее животное. Интересующий полинуклеотид может дополнительно содержать кодирующую область, некодирующую область, регуляторную область или геномную ДНК. Таким образом, 1-я, 2-я, 3-я, 4-я, 5-я, 6-я, 7-я и/или любая из последующих полинуклеотидных вставок может содержать такие последовательности.

В одном варианте осуществления интересующий полинуклеотид внутри полинуклеотидной вставки и/или интегрированный в целевой локус является гомологичным по отношению к нуклеотидной последовательности мыши, нуклеиновой кислоте человека, нуклеиновой кислоте не относящегося к человеку животного, нуклеиновой кислоте грызуна, нуклеиновой кислоте крысы, нуклеиновой кислоте хомяка, нуклеиновой кислоте обезьяны, нуклеиновой кислоте сельскохозяйственного млекопитающего животного или нуклеиновой кислоте несельскохозяйственного млекопитающего животного. В еще дополнительных вариантах осуществления интересующий полинуклеотид, интегрированный в целевой локус, представляет собой фрагмент геномной нуклеиновой кислоты. В одном варианте осуществления геномная нуклеиновая кислота представляет собой геномную нуклеиновую кислоту мыши, геномную нуклеиновую кислоту человека, нуклеиновую кислоту не относящегося к человеку животного, нуклеиновую кислоту грызуна, нуклеиновую кислоту крысы, нуклеиновую кислоту хомяка, нуклеиновую кислоту обезьяны, нуклеиновую кислоту сельскохозяйственного млекопитающего животного или нуклеиновую кислоту несельскохозяйственного млекопитающего животного или их комбинацию.

В одном варианте осуществления интересующий полинуклеотид может иметь длину в диапазоне от около 500 нуклеотидов до около 200 т.п.н., как описано выше. Интересующий полинуклеотид может иметь длину от около 500 нуклеотидов до около 5 т.п.н., от около 5 т.п.н. до около 200 т.п.н., от около 5 т.п.н. до около 10 т.п.н., от около 10 т.п.н. до около 20 т.п.н., от около 20 т.п.н. до около 30 т.п.н., от около 30 т.п.н. до около 40 т.п.н., от около 40 т.п.н. до около 50 т.п.н., от около 60 т.п.н. до около 70 т.п.н., от около 80 т.п.н. до около 90 т.п.н., от около 90 т.п.н. до около 100 т.п.н., от около 100 т.п.н. до около 110 т.п.н., от около 120 т.п.н. до около 130 т.п.н., от около 130 т.п.н. до около 140 т.п.н., от около 140 т.п.н. до около 150 т.п.н., от около 150 т.п.н. до около 160 т.п.н., от около 160 т.п.н. до около 170 т.п.н., от около 170 т.п.н. до около 180 т.п.н., от около 180 т.п.н. до около 190 т.п.н. или от около 190 т.п.н. до около 200 т.п.н.

Интересующий полинуклеотид внутри полинуклеотидной вставки и/или вставленный в целевой локус может кодировать полипептид, может кодировать микроРНК или может содержать любые регуляторные области или интересующие некодирующие области, включая, например, регуляторную последовательность, последовательность промотора, последовательность энхансера, последовательность, связывающую транскрипционный репрессор, или делецию не кодирующей белок последовательности. Кроме того, интересующий полинуклеотид внутри полинуклеотидной вставки и/или вставленный в целевой локус может кодировать белок, который экспрессируется в нервной системе, костной системе, пищеварительной системе, кровеносной системе, мышечной системе, дыхательной системе, сердечно-сосудистой системе, лимфатической системе, эндокринной системе, мочевыделительной системе, репродуктивной системе или их комбинации. В одном варианте осуществления интересующий полинуклеотид внутри полинуклеотидной вставки и/или вставленный в целевой локус кодирует белок, который экспрессируется в костном мозге или клетке, полученной из костного мозга. В одном варианте осуществления интересующий полинуклеотид внутри полинуклеотидной вставки и/или интегрированный в целевой локус кодирует белок, который экспрессируется в клетке селезенки. В еще дополнительных вариантах осуществления интересующий полинуклеотид внутри полинуклеотидной вставки и/или вставленный в целевой локус кодирует белок, который экспрессируется в В-клетке, кодирует белок, который экспрессируется в незрелой В-клетке, или кодирует белок, который экспрессируется в зрелой В-клетке.

В одном варианте осуществления интересующий полинуклеотид внутри полинуклеотидной вставки и/или вставленный в целевой локус содержит геномную нуклеотидную последовательность, которая кодирует аминокислотную последовательность вариабельной области тяжелой цепи иммуноглобулина. Выражение «тяжелая цепь» или «тяжелая цепь иммуноглобулина» означает последовательность тяжелой цепи иммуноглобулина, включая последовательность константной области тяжелой цепи иммуноглобулина от любого организма. Вариабельные домены тяжелой цепи включают три гипервариабельные области (CDR) тяжелой цепи и четыре каркасные области (FR), если не указано иное. Фрагменты тяжелых цепей включают CDR, CDR и FR и их комбинации. Типичные тяжелые цепи после вариабельного домена содержат (от N-конца к С-концу) домен СН1, петлю, домен СН2 и домен СН3. Функциональный фрагмент тяжелой цепи включает в себя фрагмент, который способен специфически распознавать эпитоп (например, распознавать эпитоп с KD в микромолярном, наномолярном или пикомолярном диапазоне), который способен к экспрессии и секреции из клетки и который содержит по меньшей мере одну CDR. Вариабельные домены тяжелой цепи кодируются нуклеотидной последовательностью вариабельной области, которая обычно содержит сегменты VH, DH и JH, полученные из набора сегментов VH, DH и JH, присутствующих в зародышевой линии. Последовательности, локализации и номенклатура сегментов V, D и J тяжелой цепи для различных организмов находятся в базе данных IMGT, которая доступна в сети Интернет (www) по URL-адресу imgt.org.

В одном варианте осуществления интересующий полинуклеотид внутри полинуклеотидной вставки и/или интегрированный в целевой локус содержит геномную нуклеотидную последовательность, которая кодирует аминокислотную последовательность вариабельной области тяжелой цепи человеческого иммуноглобулина. В одном варианте осуществления геномная нуклеотидная последовательность содержит нереаранжированную нуклеотидную последовательность вариабельной области тяжелой цепи человеческого иммуноглобулина, функционально связанную с нуклеотидной последовательностью константной области тяжелой цепи иммуноглобулина. В одном варианте осуществления нуклеотидная последовательность константной области тяжелой цепи иммуноглобулина представляет собой нуклеотидную последовательность константной области тяжелой цепи иммуноглобулина мыши или нуклеотидную последовательность константной области тяжелой цепи человека или их комбинацию. В одном варианте осуществления нуклеотидную последовательность константной области тяжелой цепи иммуноглобулина выбирают из СН1, петли, СН2, СН3 и их комбинации. В одном варианте осуществления нуклеотидная последовательность константной области тяжелой цепи содержит СН1-петля-СН2-СН3. В одном варианте осуществления геномная нуклеотидная последовательность содержит реаранжированную нуклеотидную последовательность вариабельной области тяжелой цепи человеческого иммуноглобулина, функционально связанную с нуклеотидной последовательностью константной области тяжелой цепи иммуноглобулина. В одном варианте осуществления нуклеотидная последовательность константной области тяжелой цепи иммуноглобулина представляет собой нуклеотидную последовательность константной области тяжелой цепи иммуноглобулина мыши или нуклеотидную последовательность константной области тяжелой цепи человека, или их комбинацию. В одном варианте осуществления нуклеотидную последовательность константной области тяжелой цепи иммуноглобулина выбирают из СН1, петли, СН2, СН3 и их комбинации. В одном варианте осуществления нуклеотидная последовательность константной области тяжелой цепи содержит СН1-петля-СН2-СН3.

В одном варианте осуществления интересующий полинуклеотид внутри полинуклеотидной вставки и/или интегрированный в целевой локус содержит геномную нуклеотидную последовательность, которая кодирует аминокислотную последовательность вариабельной области легкой цепи иммуноглобулина. Выражение «легкая цепь» означает последовательность легкой цепи иммуноглобулина от любого организма и, если не указано иное, включает человеческие легкие цепи каппа (κ) и лямбда (λ) и VpreB, а также суррогатные легкие цепи. Вариабельные домены легкой цепи обычно включают три CDR легкой цепи и четыре FR, если не указано иное. Как правило, полноразмерная легкая цепь включает в себя (от амино-конца до карбокси-конца) вариабельный домен, включающий FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4, и аминокислотную последовательность константной области легкой цепи. Вариабельные домены легкой цепи кодируются нуклеотидной последовательностью вариабельной области легкой цепи, которая обычно содержит генные сегменты VL легкой цепи и JL легкой цепи, полученные из набора генных сегментов V и J легкой цепи, присутствующих в зародышевой линии. Последовательности, локализации и номенклатура генных сегментов V и J легкой цепи для различных организмов находятся в базе данных IMGT, которая доступна в сети Интернет (www) по URL-адресу imgt.org. Легкие цепи, например, включают те, которые селективно не связываются либо с первым, либо со вторым эпитопом, селективно связанным эпитоп-связывающим белком, в котором они находятся. Легкие цепи также включают те, которые связывают и распознают, или помогают тяжелой цепи связывать и распознавать, один или более эпитопов, селективно связанных эпитоп-связывающим белком, в котором они находятся.

В одном варианте осуществления интересующий полинуклеотид внутри полинуклеотидной вставки и/или интегрированный в целевой локус содержит геномную нуклеотидную последовательность, которая кодирует аминокислотную последовательность вариабельной области легкой цепи человеческого иммуноглобулина. В одном варианте осуществления геномная нуклеотидная последовательность содержит нереаранжированную нуклеотидную последовательность вариабельной области легкой цепи λ и/или κ. В одном варианте осуществления геномная нуклеотидная последовательность содержит реаранжированную нуклеотидную последовательность вариабельной области легкой цепи λ и/или κ. В одном варианте осуществления нереаранжированная или реаранжированная нуклеотидная последовательность вариабельной области легкой цепи λ и/или κ функционально связана с нуклеотидной последовательностью константной области легкой цепи иммуноглобулина мыши, крысы или человека, выбранной из нуклеотидной последовательности константной области легкой цепи λ и нуклеотидной последовательности константной области легкой цепи κ.

Интересующий полинуклеотид внутри полинуклеотидной вставки и/или интегрированный в целевой локус может кодировать внеклеточный белок или лиганд для рецептора. В конкретных вариантах осуществления закодированный лиганд представляет собой цитокин. Интересующие цитокины включают хемокин, выбранный из CCL, CXCL, CX3CL и XCL. Цитокин может также содержать фактор некроза опухоли (ФНО). В других вариантах осуществления цитокин представляет собой интерлейкин (IL). В одном варианте осуществления интерлейкин выбирают из IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL-23, IL-24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IL-34, IL-35 и IL-36. В одном из вариантов осуществления, интерлейкин представляет собой IL-2. В конкретных вариантах осуществления такие интересующие полинуклеотиды внутри полинуклеотидной вставки и/или интегрированные в целевой локус получены от человека и, в более конкретных вариантах осуществления, могут содержать человеческую последовательность.

Интересующий полинуклеотид внутри полинуклеотидной вставки и/или интегрированный в целевой локус может кодировать цитоплазматический белок или мембранный белок. В одном варианте осуществления мембранный белок представляет собой рецептор, например рецептор цитокина, рецептор интерлейкина, альфа-рецептор интерлейкина-2 бета-рецептор интерлейкина-2 или гамма-рецептор интерлейкина-2.

Интересующий полинуклеотид внутри полинуклеотидной вставки и/или интегрированный в целевой локус может представлять собой полинуклеотид, кодирующий по меньшей мере область Т-клеточного рецептора, включая Т-клеточный альфа-рецептор. В конкретных способах каждая из полинуклеотидных вставок содержит область локуса Т-клеточного рецептора (т.е. локус Т-клеточного альфа-рецептора), так что после завершения последовательной интеграции часть локуса Т-клеточного рецептора или он весь интегрируется в целевой локус. Такие полинуклеотидные вставки могут содержать по меньшей мере один или более вариабельных сегментов или соединительных сегментов локуса Т-клеточного рецептора (т.е. локуса Т-клеточного альфа-рецептора). В дополнение интересующий полинуклеотид, кодирующий область Т-клеточного рецептора, может быть, например, получен из кодирующего мутантный белок полинуклеотида от млекопитающего, не относящегося к человеку млекопитающего, грызуна, мыши, крысы, человека, обезьяны, сельскохозяйственного млекопитающего животного или домашнего млекопитающего животного.

В других вариантах осуществления интересующий полинуклеотид, интегрированный в целевой локус, кодирует ядерный белок. В одном варианте осуществления ядерный белок представляет собой ядерный рецептор. В конкретных вариантах осуществления такие интересующие полинуклеотиды внутри полинуклеотидной вставки и/или интегрированные в целевой локус получены от человека и, в более конкретных вариантах осуществления, могут содержать человеческую геномную последовательность.

Интересующий полинуклеотид внутри полинуклеотидной вставки и/или интегрированный в целевой геномный локус может содержать генетическую модификацию в кодирующей последовательности. Такие генетические модификации включают, без ограничений, мутацию делеции кодирующей последовательности или слияние двух кодирующих последовательностей.

Интересующий полинуклеотид внутри полинуклеотидной вставки и/или интегрированный в целевой локус может представлять собой полинуклеотид, кодирующий мутантный белок. В одном варианте осуществления мутантный белок характеризуется измененной характеристикой связывания, измененной локализацией, измененной экспрессией и/или измененным характером экспрессии. В одном варианте осуществления интересующий полинуклеотид внутри полинуклеотидной вставки и/или интегрированный в целевой локус содержит по меньшей мере один аллель заболевания, включая, например, аллель неврологического заболевания, аллель сердечно-сосудистого заболевания, аллель почечного заболевания, аллель мышечного заболевания, аллель заболевания крови, аллель гена, вызывающего рак, или аллель заболевания иммунной системы. В таких случаях аллель заболевания может быть доминантным аллелем, или аллель заболевания является рецессивным аллелем. Кроме того, аллель заболевания может представлять собой аллель однонуклеотидного полиморфизма (SNP). Интересующий полинуклеотид, кодирующий мутантный белок, может быть получен из любого организма, включая, без ограничений, кодирующий мутантный белок полинуклеотид от млекопитающего, не относящегося к человеку млекопитающего, грызуна, мыши, крысы, человека, обезьяны, сельскохозяйственного млекопитающего животного или домашнего млекопитающего животного.

Интересующий полинуклеотид внутри полинуклеотидной вставки и/или интегрированный в целевой локус может также содержать регуляторную последовательность, включая, например, последовательность промотора, последовательность энхансера или последовательность, связывающую транскрипционный репрессор. В конкретных вариантах осуществления интересующий полинуклеотид внутри полинуклеотидной вставки и/или интегрированный в целевой локус содержит полинуклеотид с делецией не кодирующей белок последовательности, но не содержит делецию кодирующей белок последовательности. В одном варианте осуществления делеция не кодирующей белок последовательности содержит делецию регуляторной последовательности. В другом варианте осуществления делеция регуляторного элемента содержит делецию последовательности промотора. В одном варианте осуществления делеция регуляторного элемента содержит делецию последовательности энхансера. Такой интересующий полинуклеотид может быть получен из любого организма, включая, без ограничений, кодирующий мутантный белок полинуклеотид от млекопитающего, не относящегося к человеку млекопитающего, грызуна, мыши, крысы, человека, обезьяны, сельскохозяйственного млекопитающего животного или домашнего млекопитающего животного.

V. Способы введения последовательностей и создания трансгенных животных

Как указывалось выше, в настоящем документе предложены способы и композиции, позволяющие выполнить нацеленную интеграцию одного или более интересующих полинуклеотидов. В таких системах используются различные компоненты, и для удобства ознакомления в настоящем документе термин «система нацеленной интеграции» в целом относится ко всем компонентам, необходимым для события интеграции (т.е. к различным нуклеазный агентам, сайтам распознавания, полинуклеотидным ДНК-вставкам, нацеливающим векторам, целевому локусу и интересующим полинуклеотидам).

Предложенные в настоящем документе способы включают введение в клетку одного или более полинуклеотидов или полипептидных конструкций, содержащих различные компоненты системы нацеленной интеграции. Термин «введение» означает передачу в клетку последовательности (полипептидной или полинуклеотидной) таким образом, что эта последовательность получает доступ к внутренней части клетки. Предложенные в настоящем документе способы не зависят от конкретного способа введения любого компонента системы нацеленной интеграции в клетку, а зависят только от получения доступа полинуклеотида к внутренней части по меньшей мере одной клетки. Способы введения полинуклеотидов в различные типы клеток известны в данной области и включают, без ограничений, способы устойчивой трансфекции, способы временной трансфекции и вирус-опосредованные способы.

В некоторых вариантах осуществления клетки, используемые в способах и композициях, имеют стабильно встроенную в их геном конструкцию ДНК. «Стабильно встроенный» или «стабильно введенный» означает введение полинуклеотида в клетку таким образом, что нуклеотидная последовательность интегрируется в геном клетки и способна передаваться по наследству ее потомству. Для стабильного встраивания конструкций ДНК или различных компонентов системы нацеленной интеграции может использоваться любой протокол.

Протоколы трансфекции, а также протоколы введения полипептидов или полинуклеотидных последовательностей в клетки могут быть разными. Не имеющие ограничительного характера способы трансфекции включают химические способы трансфекции, включающие использование липосом; наночастиц; фосфата кальция (Graham et al. (1973). Virology 52 (2): 456-67, Bacchetti et al. (1977) Proc Natl Acad Sci USA 74 (4): 1590-4 и Kriegler, M (1991). Transfer and Expression: A Laboratory Manual. New York: W. H. Freeman and Company, pp. 96-97); дендримеров или катионных полимеров, таких как ДЭАЭ-декстран или полиэтиленимин. Нехимические способы включают электропорацию, сонопорацию и оптическую трансфекцию. Трансфекция с использованием частиц включает применение «генной пушки», магнитной трансфекции (Bertram, J. (2006) Current Pharmaceutical Biotechnology 7, 277-28). Для трансфекции также можно использовать вирусные способы.

В одном варианте осуществления нуклеазный агент вводят в клетку одновременно с нацеливающим вектором или большим нацеливающим вектором (LTVEC). В альтернативном варианте осуществления нуклеазный агент вводят отдельно от нацеливающего вектора или LTVEC за определенный период времени. В одном варианте осуществления нуклеазный агент вводят перед введением нацеливающего вектора или LTVEC, тогда как в других вариантах осуществления нуклеазный агент вводят после введения нацеливающего вектора или LTVEC.

С помощью различных способов, описанных в настоящем документе, можно создавать не относящихся к человеку млекопитающих животных. Такие способы включают (1) интеграцию одного или более интересующих полинуклеотидов в целевой локус плюрипотентной клетки не относящегося к человеку животного для создания генетически модифицированной плюрипотентной клетки, содержащей полинуклеотидную вставку в целевом локусе с использованием способов, описанных в настоящем документе; (2) отбор генетически модифицированной плюрипотентной клетки, имеющей в целевом локусе один или более интересующих полинуклеотидов; (3) введение генетически модифицированной плюрипотентной клетки в эмбрион-хозяин от не относящегося к человеку животного на стадии до образования морулы; и (4) имплантацию эмбриона-хозяина, содержащего генетически модифицированную плюрипотентную клетку, в организм суррогатной матери для получения из генетически модифицированной плюрипотентной клетки поколения F0. Не относящееся к человеку животное может быть не относящимся к человеку млекопитающим животным, грызуном (например, мышью, крысой, хомяком), обезьяной, сельскохозяйственным млекопитающим животным или домашним млекопитающим животным. Плюрипотентная клетка может быть человеческой ЭС-клеткой, человеческой ИПС-клеткой, не относящейся к человеку ЭС-клеткой, ЭС-клеткой грызуна (например, ЭС-клеткой мыши, ЭС-клеткой крысы или ЭС-клеткой хомяка), ЭС-клеткой обезьяны, ЭС-клеткой сельскохозяйственного млекопитающего животного или ЭС-клеткой домашнего млекопитающего животного. См., например, публикацию США №2014/0235933; публикацию США №2014/0310828; и публикацию Tong et al (2010) Nature, 467(7312):211-213, каждая из которых включена в настоящий документ путем ссылки.

Для создания не относящегося к человеку млекопитающего животного можно также использовать методики ядерного переноса. В кратком изложении методы ядерного переноса включают этапы, на которых: (1) проводят энуклеацию ооцита; (2) выделяют донорскую клетку или ядро для объединения с энуклеированным ооцитом; (3) выполняют вставку клетки или ядра в энуклеированный ооцит с образованием реконструированной клетки; (4) имплантируют реконструированную клетку в матку животного с получением эмбриона; и (5) предоставляют эмбриону возможность развития. В таких способах ооциты обычно извлекают из умерших животных, хотя их можно выделять также из яйцеводов и/или яичников живых животных. До энуклеации ооциты могут созревать в различных средах, известных обычным специалистам в данной области. Энуклеация ооцитов может быть выполнена с помощью ряда способов, хорошо известных обычным специалистам в данной области. Вставку донорской клетки или ядра в энуклеированный ооцит с образованием реконструированной клетки обычно проводят перед слиянием путем микроинъекции клетки донора под вителлиновый слой. Слияние можно индуцировать применением электрического импульса постоянного тока в плоскости контакта/слияния (электрослияние), путем воздействия на клетки химическими веществами, стимулирующими слияние, такими как полиэтиленгликоль, или путем использования инактивированного вируса, например вируса Сендай. Реконструированную клетку, как правило, активируют с использованием электричества и/или неэлектрического средства до, во время и/или после слияния ядра донора и ооцита реципиента. Способы активации включают в себя электрические импульсы, химически индуцированный шок, пенетрацию с помощью сперматозоида, повышение уровней двухвалентных катионов в ооцитах, а также снижение фосфорилирования клеточных белков (например, с помощью ингибиторов киназы) в ооците. Активированные реконструированные клетки или эмбрионы обычно культивируют в среде, хорошо известной обычным специалистам в данной области, после чего переносят в матку животного. См., например, US 20080092249, WO/1999/005266 A2, US 20040177390, WO/2008/017234 A1 и патент США №7,612,250, каждый из которых полностью включен в настоящий документ путем ссылки.

Предложены другие описанные в настоящем документе способы создания не относящегося к человеку животного, содержащего в своей зародышевой линии одну или более генетических модификаций, которые включают: (а) модификацию целевого локуса не относящегося к человеку животного в прокариотической клетке с использованием различных способов, описанных в настоящем документе; (b) отбор модифицированной прокариотической клетки, содержащей в целевом локусе генетическую модификацию; (с) выделение из модифицированной прокариотической клетки генетически модифицированного нацеливающего вектора; (d) введение генетически модифицированного нацеливающего вектора в плюрипотентную клетку не относящегося к человеку животного с получением генетически модифицированной плюрипотентной клетки, содержащей в целевом локусе нуклеотидную вставку; (е) отбор генетически модифицированной плюрипотентной клетки; (f) введение генетически модифицированной плюрипотентной клетки в эмбрион-хозяин от не относящегося к человеку животного на стадии до образования морулы; и (g) имплантацию эмбриона-хозяина, содержащего генетически модифицированную плюрипотентную клетку, в организм суррогатной матери для получения из генетически модифицированной плюрипотентной клетки поколения F0. В таких способах нацеливающий вектор может представлять собой большой нацеливающий вектор. Не относящееся к человеку животное может быть не относящимся к человеку млекопитающим животным, грызуном, мышью, крысой, хомяком, обезьяной, сельскохозяйственным млекопитающим животным или домашним млекопитающим животным. Плюрипотентная клетка может быть человеческой ЭС-клеткой, человеческой ИПС-клеткой, не относящейся к человеку ЭС-клеткой, ЭС-клеткой грызуна (например, ЭС-клеткой мыши, ЭС-клеткой крысы или ЭС-клеткой хомяка), ЭС-клеткой обезьяны, ЭС-клеткой сельскохозяйственного млекопитающего животного или ЭС-клеткой домашнего млекопитающего животного.

В дополнительных способах этап выделения (с) дополнительно включает этап (cl) линеаризации генетически модифицированного нацеливающего вектора (т.е. генетически модифицированного LTVEC). В еще дополнительных вариантах осуществления этап введения (d) дополнительно включает этап (dl) введения в плюрипотентную клетку нуклеазного агента, как описано в настоящем документе. В других вариантах осуществления этап введения (d) дополнительно включает этап (d2), на котором плюрипотентная клетка не относящегося к человеку млекопитающего животного содержит целевой локус, содержащий первый полинуклеотид, кодирующий первый селективный маркер, функционально связанный с первым активным в клетке промотором, причем первый полинуклеотид дополнительно содержит первый сайт распознавания для первого нуклеазного агента, и введение нуклеазного агента в плюрипотентную клетку, при этом первый нуклеазный агент индуцирует на первом сайте распознавания одно- или двухцепочечный разрыв. Дополнительно вводят в плюрипотентную клетку первый нацеливающий вектор, содержащий генетически модифицированный нацеливающий вектор из генома модифицированной прокариотической клетки. Модифицированный нацеливающий вектор содержит первое и второе гомологичные плечи, которые соответствуют первому и второму целевым сайтам, расположенные достаточно близко к первому сайту распознавания внутри генома плюрипотентной клетки не относящегося к человеку млекопитающего животного. В одном варианте осуществления этапы отбора (b) и/или (е) осуществляют путем применения селективного агента, как описано в настоящем документе, в прокариотической клетке или плюрипотентной клетке. В одном варианте осуществления этапы отбора (b) и/или (е) выполняют посредством анализа определения модификации аллеля (МОА), как описано в настоящем документе.

Предложены дополнительные способы модификации целевого локуса клетки млекопитающего посредством бактериальной гомологичной рекомбинации (BHR) в прокариотической клетке, которые включают: (а) обеспечение прокариотической клетки, содержащей целевой локус, который содержит первый полинуклеотид, кодирующий первый селективный маркер, функционально связанный с первым промотором, активным в прокариотической клетке, причем первый полинуклеотид дополнительно содержит первый сайт распознавания для первого нуклеазного агента, (b) введение в прокариотическую клетку нацеливающего вектора, содержащего полинуклеотидную вставку, фланкированную первым вышележащим гомологичным плечом и первым нижележащим гомологичным плечом, при этом полинуклеотидная вставка содержит область от млекопитающего, и введение в прокариотическую клетку нуклеазного агента, который выполняет одно- или двухцепочечный разрыв на первом сайте распознавания или возле него, и (с) отбор целевой прокариотической клетки, содержащей в целевом локусе полинуклеотидную вставку, при этом прокариотическая клетка способна экспрессировать рекомбиногенные белки и ферменты, которые опосредуют BHR. Этапы (а)-(с) можно последовательно повторять так, как описано в настоящем документе, чтобы обеспечить введение множества полинуклеотидных вставок в целевой локус в прокариотической клетке. После «построения» целевого локуса с прокариотической клеткой нацеливающий вектор, содержащий модифицированный целевой локус, может быть выделен из прокариотической клетки и введен в целевой локус внутри клетки не относящегося к человеку млекопитающего животного. Из клеток млекопитающего, содержащих модифицированный локус, впоследствии можно получить не относящееся к человеку трансгенное животное.

В некоторых вариантах осуществления различные генетические модификации целевых локусов, описанные в настоящем документе, можно проводить с помощью ряда реакций гомологичной рекомбинации (BHR) в бактериальных клетках с использованием ДНК бактериальной искусственной хромосомы (ВАС) с помощью технологии генной инженерии VELOCIGENE® (см., например, патент США №6,586,251 и публикацию Valenzuela, D.М. et al. (2003) High-throughput engineering of the mouse genome coupled with high-resolution expression analysis, Nature Biotechnology, 21(6): 652-659, полностью включенные настоящий документ путем ссылки).

В некоторых вариантах осуществления целевые ЭС-клетки млекопитающего (т.е. полученные от не относящихся к человеку млекопитающих, грызунов (например, мышей, крыс, хомяков), сельскохозяйственных млекопитающих животных, домашних млекопитающих животных, обезьян и т.п.), содержащие различные генетические модификации, как описано в настоящем документе, вводят в эмбрион, полученный из соответствующего организма, на стадии до образования морулы, например в мышиный эмбрион на стадии 8 клеток, с помощью метода VELOCIMOUSE® (см., например, US 7,576,259, US 7,659,442, US 7,294,754, и US 2008-0078000 A1, все из которых полностью включены в настоящий документ путем ссылки). Эмбрион не относящегося к человеку млекопитающего животного, содержащий генетически модифицированные ЭС-клетки, инкубируют до стадии бластоцисты, а затем имплантируют суррогатной матери для получения F0. В некоторых других вариантах осуществления целевые ЭС-клетки млекопитающего, содержащие различные генетические модификации, как описано в настоящем документе, вводят в эмбрион на стадии бластоцисты. Не относящиеся к человеку млекопитающие животные, несущие генетически модифицированный локус, могут быть идентифицированы посредством анализа определения модификации аллеля (МОА), как описано в настоящем документе. Полученное из генетически модифицированных ЭС-клеток поколение F0 не относящегося к человеку млекопитающего скрещивают с не относящимся к человеку млекопитающим дикого типа, чтобы получить потомство поколения F1. После генотипирования со специфическими праймерами и/или зондами не относящихся к человеку млекопитающих F1, которые являются гетерозиготными по генетически модифицированному локусу, скрещивают друг с другом, чтобы получить не относящихся к человеку млекопитающих, которые являются гомозиготными по генетически модифицированному локусу.

VI. Клетки

В различных способах, описанных в настоящем документе, используется система нацеливания локуса в клетке. Такие клетки включают прокариотические клетки, такие как бактериальные клетки, включая Е.coli, или эукариотические клетки, такие как клетки дрожжей, насекомых, земноводных, птиц (например, куриные клетки), растений или млекопитающих, включая, без ограничений, клетку мыши, клетку крысы, клетку кролика, клетку свиньи, клетку коровы, клетку оленя, клетку овцы, клетку козы, клетку кота, клетку собаки, клетку хорька, клетку примата (например, мартышки, макаки-резус) и т.п. и клетки от домашних млекопитающих животных или клетки от сельскохозяйственных млекопитающих животных. Некоторые клетки являются клетками, не относящимися к человеку, в частности, клетками не относящегося к человеку млекопитающего. В некоторых вариантах осуществления для тех млекопитающих, для которых нет легкодоступных подходящих генетически модифицируемых плюрипотентных клеток, для перепрограммирования соматических клеток в плюрипотентные клетки используют другие способы, например введение в соматические клетки комбинации факторов, индуцирующих плюрипотентность, включая, без ограничений, Oct3/4, Sox2, KLF4, Мус, Nanog, LIN28 и Glis1.

В одном варианте осуществления эукариотическая клетка представляет собой плюрипотентную клетку. В одном из вариантов осуществления настоящего изобретения упомянутые плюрипотентные клетки представляют собой эмбриональную (ЭС) стволовую клетку. Термин «эмбриональная стволовая клетка» или «ЭС-клетка» означает полученную из эмбриона тотипотентную или плюрипотентную клетку, которая способна к недифференцированной пролиферации in vitro, а при введении в эмбрион может участвовать в развитии любой ткани развивающегося эмбриона. Термин «плюрипотентная клетка» означает недифференцированную клетку, которая обладает способностью развиваться в более чем один дифференцированный тип клеток. Термин «зародышевая линия» в отношении полинуклеотидной последовательности означает нуклеотидную последовательность, которая может быть передана потомству.

Плюрипотентная клетка может представлять собой не относящуюся к человеку ЭС-клетку или индуцированную плюрипотентную стволовую (ИПС) клетку. В одном варианте осуществления индуцированную плюрипотентную (ИПС) клетку получают из фибробласта. В конкретных вариантах осуществления индуцированную плюрипотентную (ИПС) клетку получают из фибробласта человека. В некоторых вариантах осуществления плюрипотентная клетка представляет собой гемопоэтическую стволовую клетку (HSC), нейрональную стволовую клетку (NSC) или эпибластную стволовую клетку. Плюрипотентная клетка также может представлять собой онтогенетически ограниченную клетку-предшественника. В дополнительных вариантах осуществления плюрипотентная клетка представляет собой плюрипотентную клетку грызуна. В одном варианте осуществления плюрипотентная клетка грызуна представляет собой плюрипотентную клетку крысы или ЭС-клетку крысы. В других вариантах осуществления плюрипотентная клетка грызуна представляет собой плюрипотентную клетку мыши или ЭС-клетку мыши.

В других вариантах осуществления клетка млекопитающего может представлять собой иммортализованную клетку мыши, клетку крысы или клетку человека. В одном варианте осуществления клетка млекопитающего является фибробластом человека, тогда как в других вариантах осуществления клетка млекопитающего является раковой клеткой, в том числе раковой клеткой человека.

В еще дополнительных вариантах осуществления млекопитающее представляет собой человека, и нацеливание осуществляют с использованием ex vivo клетки человека.

В одном варианте осуществления клетка млекопитающего представляет собой клетку человека, выделенную от пациента, имеющего заболевание, и/или содержит человеческий полинуклеотид, кодирующий мутантный белок. В одном варианте осуществления мутантный человеческий белок характеризуется измененной характеристикой связывания, измененной локализацией, измененной экспрессией и/или измененным характером экспрессии. В одном варианте осуществления человеческая нуклеотидная последовательность содержит по меньшей мере один аллель заболевания человека. В одном варианте осуществления человеческая нуклеотидная последовательность содержит по меньшей мере один аллель заболевания человека. В одном варианте осуществления аллель заболевания человека представляет собой аллель неврологического заболевания. В одном варианте осуществления аллель заболевания человека представляет собой аллель сердечно-сосудистого заболевания. В одном варианте осуществления аллель заболевания человека представляет собой аллель почечного заболевания. В одном варианте осуществления аллель заболевания человека представляет собой аллель мышечного заболевания. В одном варианте осуществления аллель заболевания человека представляет собой аллель заболевания крови. В одном варианте осуществления аллель заболевания человека представляет собой аллель гена, вызывающего рак. В одном варианте осуществления аллель заболевания человека представляет собой аллель заболевания иммунной системы. В одном варианте осуществления аллель заболевания человека является доминантным аллелем. В одном варианте осуществления аллель заболевания человека является рецессивным аллелем. В одном варианте осуществления аллель заболевания человека содержит аллель однонуклеотидного полиморфизма (SNP).

Если клетка представляет собой прокариотическую клетку, в конкретных вариантах осуществления прокариотическая клетка является рекомбинационно-компетентным штаммом Е.coli. В одном варианте осуществления прокариотическая клетка содержит нуклеиновую кислоту, которая кодирует рекомбиногенные белки и ферменты. В одном варианте осуществления прокариотическая клетка не содержит нуклеиновую кислоту, кодирующую рекомбиногенные белки и ферменты, и нуклеиновую кислоту, кодирующую рекомбиногенные белки и ферменты, вводят в прокариотическую клетку. В одном варианте осуществления нуклеиновая кислота содержит ДНК или мРНК, кодирующую рекомбиногенные белки и ферменты. В одном варианте осуществления нуклеиновая кислота, кодирующая рекомбиногенные белки и ферменты, представляет собой pABG. В одном варианте осуществления рекомбиногенные белки и ферменты экспрессируются под управлением индуцируемого промотора. В одном варианте осуществления экспрессией рекомбиногенных белков и ферментов управляет арабиноза.

VII. Экспрессионные кассеты

В настоящем документе предложены полинуклеотиды или молекулы нуклеиновой кислоты, содержащие различные компоненты системы нацеленной интеграции, предложенной в настоящем документе (т.е. нуклеазные агенты, сайты распознавания, полинуклеотидные вставки, интересующие полинуклеотиды, нацеливающие векторы, селективные маркеры и другие компоненты).

Термины «полинуклеотид», «полинуклеотидная последовательность», «нуклеотидная последовательность» и «фрагмент нуклеиновой кислоты» применяются в настоящем документе взаимозаменяемо. Эти термины охватывают нуклеотидные последовательности и т.п. Полинуклеотид может представлять собой полимер РНК и ДНК, который образует одну или две цепи, необязательно содержащих синтетические, отсутствующие в природе или измененные нуклеотидные основания. Полинуклеотид в форме полимера ДНК можно образовать из одной или более сегментов кДНК, геномной ДНК, синтетической ДНК или их смесей. Полинуклеотиды могут представлять собой дезоксирибонуклеотиды и рибонуклеотиды, включая как встречающиеся в природе молекулы, так и синтетические аналоги, а также любые их комбинации. Полинуклеотиды, предложенные в настоящем документе, также охватывают все формы последовательностей, включая, без ограничений, одноцепочечные формы, двухцепочечные формы, шпильки, структуры «стебель-петля» и т.п.

Дополнительно предложены рекомбинантные полинуклеотиды, содержащие различные компоненты системы нацеленной интеграции. Термины «рекомбинантный полинуклеотид» и «рекомбинантная конструкция ДНК» используются в настоящем документе взаимозаменяемо. Рекомбинантная конструкция содержит искусственную или гетерологичную комбинацию нуклеотидных последовательностей, например, регуляторной и кодирующей последовательностей, которые вместе не встречаются в природе. В других вариантах осуществления рекомбинантная конструкция может содержать регуляторные последовательности и кодирующие последовательности, полученные из разных источников, или регуляторные последовательности и кодирующие последовательности, полученные из того же источника, но расположенные способом, отличным от того, как они встречаются в природе. Такая конструкция может быть использована сама по себе или может быть использована в сочетании с вектором. Если используется вектор, то выбор вектора зависит от способа, который используется для преобразования клеток-хозяев, как хорошо известно специалистам в данной области. Например, можно использовать плазмидный вектор. В настоящем документе предложены генетические элементы, необходимые для успешного преобразования, выбора и размножения клетки-хозяина, которые включают любой из выделенных фрагментов нуклеиновых кислот. Скрининг можно выполнять, среди прочего, с помощью саузерн-блот-анализа ДНК, нозерн-блот-анализа экспрессии мРНК, анализа иммуноблоттинга экспрессии белка или фенотипического анализа.

В конкретных вариантах осуществления один или более компонентов системы нацеленной интеграции, описанной в настоящем документе, может быть обеспечен в экспрессионной кассете для экспрессии в прокариотической клетке, эукариотической клетке, бактериальной клетке, дрожжевой клетке или клетке млекопитающего или другом интересующем организме или типе клетки. Кассета может включать 5'- и 3'-регуляторные последовательности, функционально связанные с полинуклеотидом, представленным в настоящем документе. «Функционально связанный» означает наличие функциональной связи между двумя или более элементами. Например, функциональная связь между интересующим полинуклеотидом и регуляторной последовательностью (т.е. промотором) представляет собой функциональную связь, позволяющую экспрессию интересующего полинуклеотида. Функционально связанные элементы могут быть непрерывными или могут не быть непрерывными. Используемый для обозначения соединения двух кодирующих белок областей термин «функционально связанный» означает, что кодирующие области находятся в одной рамке считывания. В другом случае нуклеотидная последовательность, кодирующая белок, может быть функционально связана с регуляторными последовательностями (например, последовательностью промотора, энхансера, сайленсера и т.п), чтобы сохранить соответствующее регулирование транскрипции. В одном случае нуклеотидная последовательность вариабельной области иммуноглобулина (или сегменты V(D)J) может быть функционально связана с нуклеотидной последовательностью константной области иммуноглобулина, чтобы обеспечивать соответствующую рекомбинацию между последовательностями в последовательности тяжелой или легкой цепи иммуноглобулина.

Кассета может дополнительно содержать по меньшей мере один дополнительный интересующий полинуклеотид, предназначенный для одновременного введения в организм. В альтернативном варианте осуществления дополнительный интересующий полинуклеотид может быть обеспечен на множестве экспрессионных кассет. Такая экспрессионная кассета обеспечена множеством сайтов рестрикции и/или сайтов рекомбинации для вставки рекомбинантного полинуклеотида, который должен находиться под транскрипционным контролем регуляторных областей. Экспрессионная кассета может дополнительно содержать гены селективных маркеров.

Экспрессионная кассета может включать в себя в направлении транскрипции 5'-3' область инициации транскрипции и трансляции (т.е. промотор), рекомбинантный полинуклеотид, предложенный в настоящем документе, и область терминации транскрипции и трансляции (т.е. область терминации), действующие в интересующей клетке млекопитающего или клетке-хозяине. Регуляторные области (т.е. промоторы, регуляторные области транскрипции и области терминации трансляции) и/или полинуклеотид, предложенный в настоящем документе, могут быть нативными/аналогичными клетке-хозяину или друг другу. В альтернативном варианте осуществления регуляторные области и/или а полинуклеотид, предложенный в настоящем документе, могут быть гетерологичными клетке-хозяину или друг другу. Например, промотор, функционально связанный с гетерологичным полинуклеотидом, происходит из вида, отличного от вида, из которого был получен полинуклеотид, или, если он получен из того же/аналогичного вида, один или оба являются по существу модифицированными по сравнению с их изначальной формой и/или локусом, или промотор не является нативным промотором, функционально связанным с полинуклеотидом. В альтернативном варианте осуществления регуляторные области и/или рекомбинантный полинуклеотид, предложенный в настоящем документе, могут быть полностью синтетическими.

Область терминации может быть нативной с областью инициации транскрипции, может быть нативной с функционально связанным рекомбинантным полинуклеотидом, может быть нативной с клеткой-хозяином или может быть получена из другого источника (т.е. чужеродного или гетерологичного) по отношению к промотору, рекомбинантному полинуклеотиду, клетке-хозяину или любой их комбинации.

При получении экспрессионной кассеты могут быть проведены манипуляции с различными фрагментами ДНК, чтобы обеспечить подходящую ориентацию последовательностей ДНК. С этой целью для соединения фрагментов ДНК могут быть использованы адаптеры или линкеры или могут быть проведены другие манипуляции, чтобы обеспечить удобные сайты рестрикции, удалить лишние ДНК, удалить сайты рестрикции и т.п. Для этой цели можно использовать in vitro мутагенез, восстановление праймера, рестрикцию, отжиг, повторные замены, например переходы и трансверсии.

В экспрессионных кассетах, предложенных в настоящем документе, можно использовать некоторое количество промоторов. Промоторы можно выбирать на основе желаемого результата. Следует признать, что различные виды применения могут быть расширены за счет использования в экспрессионных кассетах различных промоторов для модуляции времени, места и/или уровня экспрессии интересующего полинуклеотида. Такие экспрессионные конструкции также при необходимости могут содержать промоторную регуляторную область (например, область, придающую индуцибельную или конститутивную, зависящую от окружающей среды или стадии развития, или клеточно- или тканеспецифичную/селективную экспрессию), инициирующий транскрипцию начальный сайт, сайт связывания рибосомы, сигнал РНК-процессинга, сайт терминации транскрипции и/или сигнал полиаденилирования.

Экспрессионная кассета, содержащая полинуклеотиды, предложенные в настоящем документе, также может содержать ген селективного маркера для селекции трансформированных клеток. Гены селективного маркера используются для селекции трансформированных клеток или тканей.

Там, где это уместно, последовательности, используемые в способах и композициях, (т.е. интересующий полинуклеотид, нуклеазный агент и т.п.) могут быть оптимизированы для повышения экспрессии в клетке. То есть гены могут быть синтезированы с использованием кодонов, предпочтительных в данной интересующей клетке, включая, например, кодоны, предпочтительные у млекопитающего, кодоны, предпочтительные у человека, кодоны, предпочтительные у грызуна, кодоны, предпочтительные у мыши, кодоны, предпочтительные у крысы и т.п.для улучшенной экспрессии.

VIII. Идентичность последовательности

В способах и композициях, предложенных в настоящем документе, используется разнообразие различных компонентов системы нацеленной интеграции (т.е. нуклеазные агенты, сайты распознавания, полинуклеотидные вставки, интересующие полинуклеотиды, нацеливающие векторы, селективные маркеры и другие компоненты). В описании признано, что некоторые компоненты системы нацеленной интеграции могут иметь активные варианты и фрагменты. Такие компоненты включают, например, нуклеазные агенты (т.е. сконструированные нуклеазные агенты), сайты распознавания нуклеазного агента, интересующие полинуклеотиды, целевые сайты и соответствующие гомологичные плечи нацеливающего вектора. Биологическая активность каждого из этих компонентов описана в других разделах настоящего документа.

В настоящем документе термин «идентичность последовательности» или «идентичность» в контексте двух полинуклеотидов или полипептидных последовательностей означает ссылку на остатки, которые одинаковы в двух последовательностях при выравнивании для максимального соответствия в установленном окне сравнения. Если термин «процентная доля идентичности последовательности» применяется в отношении белков, следует понимать, что положения с остатками, не являющимися идентичными, зачастую отличаются консервативными заменами аминокислот, где остатки аминокислот заменяются на другие остатки аминокислот с аналогичными химическими свойствами (например, зарядом или гидрофобностью) и поэтому не изменяют функциональные свойства молекулы. Если последовательности отличаются консервативными заменами, процентную долю идентичности последовательностей можно скорректировать в сторону увеличения, чтобы учесть консервативный характер замены. Последовательности, отличающиеся такими консервативными заменами, считаются имеющими «сходство последовательностей» или «сходство». Способы внесения данной корректировки хорошо известны специалистам в данной области. Как правило, они включают в себя оценку консервативной замены как частичного, а не полного несовпадения, в результате чего повышается процент идентичности последовательности. Таким образом, например, если идентичной аминокислоте присваивают оценку 1, то неконсервативной замене присваивают оценку, равную нулю, а консервативная замена получает оценку от нуля до 1. Вычисляют оценку консервативных замен, например, в соответствии с реализацией в программе PC/GENE (Intelligenetics, г. Маунтин-Вью, штат Калифорния, США).

В настоящем документе термин «процентная доля идентичности последовательности» означает значение, которое определяют путем сравнения двух оптимально выровненных последовательностей в окне сравнения, причем участок полинуклеотидной последовательности в окне сравнения может содержать добавления или делеции (т.е. гэпы) в сравнении с эталонной последовательностью (которая не содержит добавлений или делеций) для оптимального выравнивания двух последовательностей. Процент рассчитывают путем определения числа положений, в которых в обеих последовательностях встречаются идентичные нуклеиновые основания или аминокислотные остатки, деления числа совпадающих положений на общее число положений в окне сравнения и умножения результата на 100 с получением процента идентичности последовательности.

Если не указано иное, значения идентичности/сходства последовательности, представленные в настоящем документе, относятся к значению, полученному с использованием программного обеспечения GAP версии 10 с использованием следующих параметров: для нуклеотидной последовательности % идентичности и % сходства обнаруживают с применением штрафа за начало пропуска 50 и штрафа за удлинение пропуска 3 и матрицы замен nwsgapdna.cmp; для аминокислотной последовательности % идентичности или % сходства определяют с применением штрафа за начало пропуска 8 и штрафа за удлинение пропуска 2 и матрицы замен BLOSUM62; или любого эквивалентного программного обеспечения. «Эквивалентное программное обеспечение» обозначает любое программное обеспечение для сравнения последовательностей, которое для любых двух рассматриваемых последовательностей создает выравнивание, обладающее идентичными соответствиями нуклеотидов или аминокислотных остатков и идентичным процентом идентичности последовательности при сравнении с соответствующим выравниванием, получаемым посредством программного обеспечения GAP версии 10.

Не имеющие ограничительного характера варианты осуществления включают:

1. Способ модификации целевого локуса в клетке, включающий: (а) обеспечение клетки, содержащей целевой локус, который содержит первый полинуклеотид, кодирующий первый селективный маркер, функционально связанный с первым активным в клетке промотором, причем первый полинуклеотид дополнительно содержит первый сайт распознавания для первого нуклеазного агента, (b) введение в клетку (i) первого нуклеазного агента, при этом первый нуклеазный агент индуцирует одно- или двухцепочечный разрыв на первом сайте распознавания; и (ii) первого нацеливающего вектора, содержащего первую полинуклеотидную вставку, фланкированную первым и вторым гомологичными плечами, соответствующими первому и второму целевым сайтам, расположенным достаточно близко к первому сайту распознавания; и (с) идентификацию по меньшей мере одной клетки, содержащей первую полинуклеотидную вставку, интегрированную в целевой локус.

2. Способ модификации целевого локуса в клетке, включающий: (а) обеспечение клетки, содержащей первый целевой локус, который содержит первый полинуклеотид, кодирующий первый селективный маркер, функционально связанный с первым промотором, причем первый полинуклеотид дополнительно содержит первый сайт распознавания для первого нуклеазного агента, (b) введение в клетку: (i) одной или более экспрессионных конструкций, кодирующих первый нуклеазный агент, который функционально связан с активным в клетке промотором, при этом первый нуклеазный агент индуцирует одно- или двухцепочечный разрыв на первом сайте распознавания в первом полинуклеотиде, тем самым нарушая экспрессию или активность первого селективного маркера; и (ii) первого нацеливающего вектора, содержащего первую полинуклеотидную вставку, которая содержит второй полинуклеотид, кодирующий второй селективный маркер, функционально связанный со вторым промотором, при этом первая нуклеотидная вставка фланкирована первым и вторым гомологичными плечами, соответствующими первому и второму целевым сайтам, расположенным в первом целевом локусе; и (с) идентификацию модифицированной клетки, содержащей первую нуклеотидную вставку в первом целевом локусе, при этом модифицированная клетка обладает активностью второго селективного маркера, но не обладает активностью первого селективного маркера, и при этом первый и второй селективные маркеры являются разными.

3. Способ по варианту осуществления 1 или 2, в котором целевой локус находится в геноме клетки.

4. Способ по варианту осуществления 1 или 2, в котором целевой локус расположен в векторе в клетке.

5. Способ по любому из вариантов осуществления 1-4, в котором одно- или двухцепочечный разрыв на первом сайте распознавания нарушает активность первого селективного маркера.

6. Способ по варианту осуществления 1, 2, 3, 4 или 5, в котором этап идентификации (с) включает культивирование клеток в условиях, позволяющих идентифицировать клетки, не обладающие активностью первого селективного маркера.

7. Способ по любому из вариантов осуществления 1-6, в котором первый полинуклеотид, содержащий первый селективный маркер, фланкирован первым целевым сайтом и вторым целевым сайтом.

8. Способ по варианту осуществления 7, в котором этап идентификации (с) включает идентификацию по меньшей мере одной клетки, содержащей первую полинуклеотидную вставку, интегрированную в первый и второй целевые сайты.

9. Способ по любому из вариантов осуществления 1-8, в котором первая полинуклеотидная вставка содержит: (а) первый интересующий полинуклеотид; и (b) второй полинуклеотид, кодирующий второй селективный маркер, функционально связанный со вторым активным в клетке промотором, причем второй полинуклеотид содержит второй сайт распознавания для второго нуклеазного агента.

10. Способ по варианту осуществления 9, который дополнительно включает (а) введение в клетку, содержащую первую полинуклеотидную вставку, интегрированную в целевой локус, (i) второго нуклеазного агента, причем второй нуклеазный агент индуцирует одно- или двухцепочечный разрыв на втором сайте распознавания; и (ii) второго нацеливающего вектора, содержащего вторую полинуклеотидную вставку, фланкированную третьим и четвертым гомологичными плечами, соответствующими третьему и четвертому целевым сайтам, расположенным достаточно близко ко второму сайту распознавания; и (b) идентификацию по меньшей мере одной клетки, содержащей вторую полинуклеотидную вставку, интегрированную в целевой локус.

11. Способ по варианту осуществления 10, в котором одно- или двухцепочечный разрыв на втором сайте распознавания нарушает активность второго селективного маркера.

12. Способ по варианту осуществления 11, в котором этап идентификации (b) включает культивирование клетки в условиях, позволяющих идентифицировать клетки, не обладающие активностью второго селективного маркера.

13. Способ по варианту осуществления 10, 11 или 12, в котором второй полинуклеотид, содержащий второй селективный маркер, фланкирован третьим целевым сайтом и четвертым целевым сайтом.

14. Способ по варианту осуществления 13, в котором этап идентификации (b) включает идентификацию по меньшей мере одной клетки, содержащей вторую полинуклеотидную вставку, интегрированную в третий и четвертый целевые сайты.

15. Способ по любому из вариантов осуществления 10-14, в котором вторая полинуклеотидная вставка содержит: (а) второй интересующий полинуклеотид; и (b) третий полинуклеотид, кодирующий третий селективный маркер, функционально связанный с третьим активным в клетке промотором, причем третий полинуклеотид содержит третий сайт распознавания для третьего нуклеазного агента.

16. Способ по любому из вариантов осуществления 9-15, в котором первый нуклеазный агент отличается от второго нуклеазного агента.

17. Способ по любому из вариантов осуществления 9-16, в котором первый селективный маркер отличается от второго селективного маркера.

18. Способ по варианту осуществления 15, в котором первый и третий сайты распознавания нуклеазы идентичны друг другу и отличаются от второго сайта распознавания нуклеазы; и при этом первый и третий нуклеазные агенты идентичны друг другу и отличаются от второго нуклеазного агента.

19. Способ по варианту осуществления 15, в котором первый и третий селективные маркеры являются идентичными.

20. Способ по любому из вариантов осуществления 1-19, в котором один из первого, второго или третьего селективного маркера придает устойчивость к антибиотику.

21. Способ по варианту осуществления 20, в котором антибиотик представляет собой G418, гигромицин, бластицидин, неомицин или пуромицин.

22. Способ по любому из вариантов осуществления 1-19, в котором один из первого, второго или третьего селективного маркера функционально связан с индуцируемым промотором и экспрессия селективного маркера является токсичной для клетки.

23. Способ по варианту осуществления 22, в котором первый, второй или третий селективный маркер содержит гипоксантингуанинфосфорибозилтрансферазу (HGPRT) или тимидинкиназу вируса простого герпеса (HSV-TK).

24. Способ по любому из вариантов осуществления 1-23, в котором указанная клетка представляет собой прокариотическую клетку.

25. Способ по любому из вариантов осуществления 1-23, в котором указанная клетка представляет собой эукариотическую клетку.

26. Способ по варианту осуществления 25, в котором эукариотическая клетка представляет собой клетку млекопитающего.

27. Способ по варианту осуществления 26, в котором клетка млекопитающего представляет собой клетку не относящегося к человеку млекопитающего.

28. Способ по варианту осуществления 27, в котором клетка млекопитающего получена от грызуна.

29. Способ по варианту осуществления 28, в котором грызун представляет собой крысу или мышь.

30. Способ по любому из вариантов осуществления 26-29, в котором клетка представляет собой плюрипотентную клетку.

31. Способ по варианту осуществления 26, в котором клетка млекопитающего представляет собой человеческую индуцированную плюрипотентную стволовую (ИПС) клетку.

32. Способ по варианту осуществления 30, в котором плюрипотентная клетка представляет собой не относящуюся к человеку эмбриональную стволовую (ЭС) клетку.

33. Способ по варианту осуществления 30, в котором плюрипотентная клетка представляет собой эмбриональную стволовую (ЭС) клетку мыши или эмбриональную стволовую (ЭС) клетку крысы.

34. Способ по любому из вариантов осуществления 30-33, в котором плюрипотентная клетка представляет собой гемопоэтическую стволовую клетку.

35. Способ по любому из вариантов осуществления 30-33, в котором плюрипотентная клетка представляет собой нейрональную стволовую клетку.

36. Способ по варианту осуществления 26, в котором клетка млекопитающего представляет собой фибробласт человека.

37. Способ по варианту осуществления 1 или 2, в котором совместное использование первого нацеливающего вектора с первым нуклеазный агентом приводит к повышению эффективности нацеливания по сравнению с использованием только первого нацеливающего вектора.

38. Способ по варианту осуществления 37, в котором эффективность нацеливания первого нацеливающего вектора увеличивается по меньшей мере в 2 раза по сравнению с использованием только первого нацеливающего вектора.

39. Способ по любому из вариантов осуществления 1-38, в котором первый или второй нуклеазный агент содержит экспрессионную конструкцию, содержащую нуклеотидную последовательность, кодирующую нуклеазный агент, и при этом нуклеиновая кислота функционально связана с четвертым активным в клетке промотором.

40. Способ по любому из вариантов осуществления 1-39, в котором первый или второй нуклеазный агент представляет собой мРНК, кодирующую нуклеазу.

41. Способ по любому из вариантов осуществления 1-39, в котором первый или второй нуклеазный агент представляет собой нуклеазу с «цинковыми пальцами» (ZFN).

42. Способ по любому из вариантов осуществления 1-39, в котором первый или второй нуклеазный агент представляет собой эффекторную нуклеазу, подобную активатору транскрипции (TALEN).

43. Способ по любому из вариантов осуществления 1-39, в котором первый или второй нуклеазный агент представляет собой мегануклеазу.

44. Способ по любому из вариантов осуществления 1-43, в котором первый или второй нуклеазный агент содержит белок (Cas), ассоциированный с короткими палиндромными повторами, регулярно расположенными группами (CRISPR), и гидовую РНК (гРНК).

45. Способ по варианту осуществления 44, в котором гидовая РНК (гРНК) содержит (а) РНК коротких палиндромных повторов, регулярно расположенных группами (CRISPR), (крРНК), нацеленную на первый, второй или третий сайт распознавания; и (b) трансактивирующую РНК CRISPR (тракрРНК).

46. Способ по варианту осуществления 45, в котором первый или второй сайт распознавания непосредственно фланкирован последовательностью мотива, прилежащего к протоспейсеру (РАМ).

47. Способ по варианту осуществления 44, 45 или 46, в котором интересующий геномный локус содержит нуклеотидную последовательность SEQ ID NO: 1.

48. Способ по варианту осуществления 44, 45, 46 или 47, в котором белок Cas представляет собой Cas9.

49. Способ по любому из вариантов осуществления 44-46, в котором гРНК содержит: (а) химерную РНК нуклеотидной последовательности SEQ ID NO: 2; или (b) химерную РНК нуклеотидной последовательности SEQ ID NO: 3.

50. Способ по любому из вариантов осуществления 44-46, в котором крРНК содержит SEQ ID NO: 4; SEQ ID NO: 5 или SEQ ID NO: 6.

51. Способ по любому из вариантов осуществления 44-46, в котором тракрРНК содержит SEQ ID NO: 7 или SEQ ID NO: 8.

52. Способ по любому из вариантов осуществления 1-51, в котором первый, второй и/или третий сайт распознавания расположен в интроне, экзоне, промоторе, регуляторной области промотора или энхансерной области первого, второго или третьего селективного маркера.

53. Способ по любому из вариантов осуществления 1-52, в котором первый целевой сайт и второй целевой сайт непосредственно смежны с первым сайтом распознавания.

54. Способ по любому из вариантов осуществления 10-19, в котором первый целевой сайт и второй целевой сайт расположены на расстоянии от около 10 нуклеотидов до около 14 т.п.н. от первого сайта распознавания.

55. Способ по любому из вариантов осуществления 10-19, в котором третий целевой сайт и четвертый целевой сайт расположены непосредственно смежно со вторым сайтом распознавания.

56. Способ по любому из вариантов осуществления 10-19, в котором третий целевой сайт и четвертый целевой сайт расположены на расстоянии от около 10 нуклеотидов до около 14 т.п.н. от второго сайта распознавания.

57. Способ по любому из вариантов осуществления 1-56, в котором суммарная длина первого гомологичного плеча и второго гомологичного плеча составляет по меньшей мере около 10 т.п.н.

58. Способ по любому из вариантов осуществления 10-57, в котором суммарная длина третьего гомологичного плеча и четвертого гомологичного плеча составляет по меньшей мере около 10 т.п.н.

59. Способ по любому из вариантов осуществления 1-58, в котором длина первой полинуклеотидной вставки находится в диапазоне от около 5 т.п.н. до около 300 т.п.н.

60. Способ по любому из вариантов осуществления 10-59, в котором длина второй полинуклеотидной вставки находится в диапазоне от около 5 т.п.н. до около 300 т.п.н.

61. Способ по любому из вариантов осуществления 1-60, в котором интеграция первой полинуклеотидной вставки в целевой локус приводит к нокауту, нокину, точечной мутации, перестановке доменов, перестановке экзонов, перестановке интронов, перестановке регуляторных последовательностей, перестановке генов или их комбинации.

62. Способ по любому из вариантов осуществления 10-61, в котором интеграция второй полинуклеотидной вставки в целевой локус приводит к нокауту, нокину, точечной мутации, перестановке доменов, перестановке экзонов, перестановке интронов, перестановке регуляторных последовательностей, перестановке генов или их комбинации.

63. Способ по любому из вариантов осуществления 1-62, в котором первая полинуклеотидная вставка содержит интересующий полинуклеотид, который представляет собой человеческий полинуклеотид.

64. Способ по любому из вариантов осуществления 8-63, в котором вторая полинуклеотидная вставка содержит интересующий полинуклеотид, который представляет собой человеческий полинуклеотид.

65. Способ по любому из вариантов осуществления 1-64, в котором первая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий область локуса Т-клеточного альфа-рецептора.

66. Способ по любому из вариантов осуществления 8-65, в котором вторая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий область локуса Т-клеточного альфа-рецептора.

67. Способ по вариантам осуществления 65 или 66, в котором первая или вторая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий по меньшей мере один генный сегмент вариабельной области и/или генный сегмент соединительной области локуса Т-клеточного альфа-рецептора.

68. Способ по любому из вариантов осуществления 65-67, в котором область локуса Т-клеточного альфа-рецептора получена от человека.

69. Способ по любому из вариантов осуществления 1-64, в котором первая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий нереаранжированную нуклеотидную последовательность вариабельной области тяжелой цепи человеческого иммуноглобулина, функционально связанную с нуклеотидной последовательностью константной области тяжелой цепи не относящегося к человеку иммуноглобулина.

70. Способ по любому из вариантов осуществления 1-69, в котором этап идентификации выполняют посредством анализа определения модификации аллеля (МОА).

71. Способ по любому из вариантов осуществления 1-65, в котором первая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий нуклеотидную последовательность, которая является гомологичной или ортологичной нуклеотидной последовательности в геноме клетки.

72. Способ по любому из вариантов осуществления 10-71, в котором вторая полинуклеотидная вставка содержит нуклеотидную последовательность, которая является гомологичной или ортологичной нуклеотидной последовательности в геноме клетки.

73. Способ по любому из вариантов осуществления 1-70, в котором первая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий экзогенную нуклеотидную последовательность.

74. Способ по любому из вариантов осуществления 10-70 или 73, в котором вторая полинуклеотидная вставка содержит интересующий полинуклеотид, содержащий экзогенную нуклеотидную последовательность.

Другие не имеющие ограничительного характера варианты осуществления включают:

1. Способ модификации интересующего целевого локуса в клетке, включающий: (а) обеспечение клетки, содержащей первый целевой локус, который содержит нуклеиновую кислоту, кодирующую первый селективный маркер, функционально связанный с первым промотором, (b) введение в клетку: (i) одной или более экспрессионных конструкций, кодирующих белок Cas, и первой гидовой РНК (гРНК), каждая из которых функционально связана с активным в клетке промотором, причем белок Cas индуцирует одно- или двухцепочечный разрыв на первом целевом сайте гРНК в первой нуклеиновой кислоте, тем самым нарушая экспрессию или активность первого селективного маркера, и (ii) первого нацеливающего вектора, содержащего первую нуклеотидную вставку, которая содержит вторую нуклеиновую кислоту, кодирующую второй селективный маркер, функционально связанный со вторым промотором, при этом первая нуклеотидная вставка фланкирована первым и вторым гомологичными плечами, соответствующими первому и второму целевым сайтам, расположенным в первом целевом локусе; и (с) идентификацию модифицированной клетки, содержащей первую нуклеотидную вставку в первом целевом локусе, при этом модифицированная клетка обладает активностью второго селективного маркера, но не обладает активностью первого селективного маркера, и при этом первый и второй селективные маркеры являются разными.

2. Способ по варианту осуществления 1, в котором не происходит гибридизации первой гРНК с первой нуклеотидной вставкой.

3. Способ по варианту осуществления 1, в котором интересующий целевой локус расположен в геноме клетки.

4. Способ по варианту осуществления 1, в котором интересующий целевой локус расположен в векторе в клетке.

5. Способ по варианту осуществления 1, в котором этап идентификации (c) включает культивирование клетки в условиях, позволяющих идентифицировать модифицированную клетку, обладающую активностью второго селективного маркера, но не обладающую активностью первого селективного маркера.

6. Способ по варианту осуществления 1, дополнительно включающий: (d) введение в модифицированную клетку, содержащую первую нуклеотидную вставку в первом целевом локусе: (i) одной или более нуклеиновых кислот, кодирующих белок Cas, и второй гРНК, каждая из которых функционально связана с промотором, активным в модифицированной клетке, причем белок Cas индуцирует одно- или двухцепочечный разрыв на втором целевом сайте гРНК в первой нуклеотидной вставке, содержащей вторую нуклеиновую кислоту, тем самым нарушая экспрессию или активность второго селективного маркера, и (ii) второго нацеливающего вектора, содержащего вторую нуклеотидную вставку, которая содержит третью нуклеиновую кислоту, кодирующую третий селективный маркер, функционально связанный с третьим промотором, при этом вторая нуклеотидная вставка фланкирована третьим и четвертым гомологичными плечами, соответствующими третьему и четвертому целевым сайтам, расположенным во втором целевом локусе; и (е) идентификацию второй модифицированной клетки, содержащей вторую нуклеотидную вставку во втором целевом локусе, при этом вторая модифицированная клетка обладает активностью третьего селективного маркера, но не обладает активностью второго селективного маркера, при этом второй и третий селективные маркеры являются разными.

7. Способ по варианту осуществления 6, в котором первый и второй целевые локусы непосредственно смежны друг с другом.

8. Способ по варианту осуществления 6, в котором первый или второй целевой локус расположен на расстоянии от около 10 нуклеотидов до около 14 т.п.н. от первого или второго целевого сайта гРНК.

9. Способ по варианту осуществления 8, в котором не происходит гибридизации второй гРНК со второй нуклеотидной вставкой.

10. Способ по варианту осуществления 6, в котором этап идентификации (e) включает культивирование модифицированной клетки в условиях, позволяющих идентифицировать вторую модифицированную клетку, обладающую активностью третьего селективного маркера, но не обладающую активностью второго селективного маркера.

11. Способ по варианту осуществления 6, дополнительно включающий: (f) введение во вторую модифицированную клетку, содержащую вторую нуклеотидную вставку во втором целевом локусе: (i) одной или более экспрессионных конструкций, кодирующих белок Cas, и третьей гРНК, каждая из которых функционально связана с промотором, активным во второй модифицированной клетке, причем белок Cas индуцирует одно- или двухцепочечный разрыв на третьем целевом сайте гРНК во второй нуклеотидной вставке, содержащей третью нуклеиновую кислоту, тем самым нарушая экспрессию или активность третьего селективного маркера; и (ii) третьего нацеливающего вектора, содержащего третью нуклеотидную вставку, которая содержит четвертую нуклеиновую кислоту, кодирующую четвертый селективный маркер, функционально связанный с четвертым промотором, при этом третья нуклеотидная вставка фланкирована пятым и шестым гомологичными плечами, соответствующими пятому и шестому целевым сайтам, расположенным в третьем целевом локусе; и (g) идентификацию третьей модифицированной клетки, содержащей третью нуклеотидную вставку в третьем целевом локусе, при этом третья модифицированная клетка обладает активностью четвертого селективного маркера, но не обладает активностью третьего селективного маркера, при этом третий и четвертый селективные маркеры являются разными.

12. Способ по варианту осуществления 11, в котором второй и третий целевые локусы непосредственно смежны друг с другом.

13. Способ по варианту осуществления 11, в котором второй или третий целевой локус расположен на расстоянии от около 10 нуклеотидов до около 14 т.п.н. от первого или второго целевого сайта гРНК.

14. Способ по любому из вариантов осуществления 1-13, в котором первый, второй, третий или четвертый маркер придает устойчивость к антибиотику.

15. Способ по варианту осуществления 14, в котором антибиотик представляет собой G418, гигромицин, бластицидин, неомицин или пуромицин.

16. Способ по любому из вариантов осуществления 1-13, в котором первый, второй, третий или четвертый селективный маркер содержит гипоксантингуанинфосфорибозилтрансферазу (HGPRT) или тимидинкиназу вируса простого герпеса (HSV-TK).

17. Способ по варианту осуществления 1, 6 или 11, в котором первая, вторая или третья гРНК содержит (i) нуклеотидную последовательность, которая гибридизуется с первым, вторым или третьим целевым сайтом гРНК, и (ii) трансактивирующую РНК CRISPR (тракрРНК).

18. Способ по варианту осуществления 1, 6 или 11, в котором первый, второй или третий целевой локус расположен в непосредственной близости к первому, второму или третьему целевому сайту гРНК так, что одно- или двухцепочечный разрыв на целевом сайте гРНК способствует гомологичной рекомбинации нацеливающего вектора в целевом локусе.

19. Способ по варианту осуществления 1, 6 или 11, в котором белок Cas представляет собой Cas9.

20. Способ по варианту осуществления 19, в котором первый, второй или третий целевой сайт гРНК непосредственно фланкирован последовательностью мотива, прилежащего к протоспейсеру (РАМ).

21. Способ по варианту осуществления 1, 6 или 11, в котором указанная клетка представляет собой прокариотическую клетку.

22. Способ по вариантам осуществления 1, 6 и 11, в котором клетка представляет собой эукариотическую клетку.

23. Способ по варианту осуществления 22, в котором эукариотическая клетка представляет собой клетку млекопитающего.

24. Способ по варианту осуществления 23, в котором клетка млекопитающего представляет собой фибробласт.

25. Способ по варианту осуществления 23, в котором клетка млекопитающего представляет собой клетку не относящегося к человеку млекопитающего.

26. Способ по варианту осуществления 23, в котором клетка млекопитающего получена от грызуна.

27. Способ по варианту осуществления 26, в котором грызун представляет собой крысу, мышь или хомяка.

28. Способ по варианту осуществления 22, в котором эукариотическая клетка представляет собой плюрипотентную клетку.

29. Способ по варианту осуществления 28, в котором плюрипотентная клетка представляет собой гемопоэтическую стволовую клетку или нейрональную стволовую клетку.

30. Способ по варианту осуществления 28, в котором плюрипотентная клетка представляет собой человеческую индуцированную плюрипотентную стволовую (ИПС) клетку.

31. Способ по варианту осуществления 28, в котором плюрипотентная клетка представляет собой эмбриональную стволовую (ЭС) клетку мыши или эмбриональную стволовую (ЭС) клетку крысы.

32. Способ по любому из вариантов осуществления 1, 6 и 11, в котором первый, второй или третий целевой сайт гРНК расположен в интроне, экзоне, промоторе или регуляторной области промотора в первой, второй или третьей нуклеиновой кислоте, которая кодирует первый, второй или третий селективный маркер.

33. Способ по варианту осуществления 1, 6 или 11, в котором длина первого, второго или третьего нацеливающего вектора составляет по меньшей мере около 10 т.п.н.

34. Способ по варианту осуществления 1, 6 или 11, в котором длина первой, второй или третьей нуклеотидной вставки находится в диапазоне от около 5 т.п.н. до около 300 т.п.н.

35. Способ по варианту осуществления 1, 6 или 11, в котором первая, вторая или третья нуклеотидная вставка содержит геномную область локуса Т-клеточного альфа-рецептора человека.

36. Способ по п. 35, в котором геномная область содержит по меньшей мере один генный сегмент вариабельной области и/или генный сегмент соединительной области локуса Т-клеточного альфа-рецептора человека.

37. Способ по варианту осуществления 6, в котором первый и третий селективные маркеры являются одинаковыми.

38. Способ по варианту осуществления 11, в котором первый и третий селективные маркеры являются одинаковыми и второй и четвертый селективные маркеры являются одинаковыми.

39. Способ по варианту осуществления 38, в котором первая и третья гРНК являются одинаковыми.

40. Способ по варианту осуществления 1, 6, 37, 38 или 39, в котором гРНК является специфической для гена устойчивости к гигромицину или неомицину.

41. Способ по варианту осуществления 40, в котором гРНК, которая является специфической для гена устойчивости к неомицину, кодируется нуклеиновой кислотой, содержащей нуклеотидную последовательность, приведенную в SEQ ID NO: 13, 14, 15 или 16.

42. Способ по варианту осуществления 40, в котором гРНК, которая является специфической для гена устойчивости к гигромицину, кодируется нуклеиновой кислотой, содержащей нуклеотидную последовательность, приведенную в SEQ ID NO: 17, 18, 19 или 20.

43. Способ по варианту осуществления 6, 37, 38 или 39, в котором а) первая гРНК кодируется нуклеиновой кислотой, содержащей нуклеотидную последовательность, приведенную в SEQ ID NO: 13, 14, 15 или 16, а вторая гРНК кодируется нуклеиновой кислотой, содержащей нуклеотидную последовательность, приведенную в SEQ ID NO: 17, 18, 19 или 20; или b) первая гРНК кодируется нуклеиновой кислотой, содержащей нуклеотидную последовательность, приведенную в SEQ ID NO: 17, 18, 19 или 20, а вторая гРНК кодируется нуклеиновой кислотой, содержащей нуклеотидную последовательность, приведенную в SEQ ID NO: 13, 14, 15 или 16.

Следующие примеры предлагаются в качестве иллюстрации, а не в качестве ограничения.

ПРИМЕРЫ

Эксперименты последовательного нацеливания генов, показанные на Фиг. 1 и 2, продемонстрировали значение объединения большого нацеливающего вектора (LTVEC) на основе ВАС с нуклеазой с «цинковыми пальцами» (ZFN), предназначенного для распознавания и расщепления целевой последовательности в кассете селекции лекарственными средствами.

Для первого этапа последовательного нацеливания (Фиг. 1) конструировали LTVEC для создания модификации (аллель B-hyg TCRα), которая вставляет 136 т.п.н. ДНК, кодирующей 11 вариабельных (V) доменов Т-клеточного альфа-рецептора человека (TCRα) в соответствующий локус TCRα мыши. 0,02 мг сконструированного LTVEC с помощью электропорации вводили в 10 миллионов эмбриональных стволовых (ЭС) клеток мыши, несущих ранее созданную модификацию (аллель A-neo TCRα) в локусе TCRα, в которой вариабельные (V) и соединительные (J) сегменты генов мыши заменяли человеческими V-сегментами и J-сегментами. После восстановления в ростовой среде ЭС-клетки, подвергнутой электропорации, добавляли гигромицин для отбора колоний, полученных из клеток, в геномы которых встраивали LTVEC. Скрининг на модификацию аллеля (МОА) выделенных колоний привел к идентификации четырех правильно нацеленных клонов среди 136 подвергнутых скринингу колоний, устойчивых к гигромицину, при этом эффективность нацеливания составила 2,9% (таблица 1, эксперимент 1). В дополнение к вставке 11 дополнительных V-сегментов правильно нацеленные клоны имели кассету (hygr) устойчивости к гигромицину, которой заменили кассету (neor) устойчивости к неомицину (G418).

Эксперимент 2 был идентичен эксперименту 1, за исключением добавления 0,02 мг каждой из двух плазмид, экспрессирующих каждую половину Neo-ZFN(1,2), которая связывается с последовательностями распознавания в гене neor и катализирует двухцепочечный разрыв в ДНК. Включение Neo-ZFN(1,2) приводило к 55 правильно нацеленным клонам из 568 подвергнутых скринингу клонов, устойчивых к гигромицину, при этом эффективность нацеливания составляла 9,7%, что является в 3,3 раза большей эффективностью нацеливания по сравнению с электропорацией только LTVEC (таблица 1, сравнение экспериментов 1 и 2).

Эксперимент 3 был идентичен эксперименту 2, за исключением того, что плазмиды, кодирующие Neo-ZFN(1,2), заменяли плазмидами Neo-ZFN(3,4). Включение Neo-ZFN(3,4) приводило к 42 правильно нацеленным клонам из 360 подвергнутых скринингу клонов, устойчивых к гигромицину, при этом эффективность нацеливания составляла 11,7%, что является в 4 раза большей эффективностью нацеливания по сравнению с электропорацией только LTVEC (таблица 1, сравнение экспериментов 1 и 3).

На втором этапе последовательного нацеливания (Фиг. 2) с помощью электропорации вводили 0,002 мг LTVEC, разработанного для создания модификации (аллель С-neo TCRα), который вставляет 157 т.п.н. ДНК, кодирующей 11 дополнительных вариабельных (V) доменов человеческого TCRα, отличающихся от тех, которые имеются в аллелях А-neo или B-hyg в TCRα, в 10 миллионов эмбриональных стволовых (ЭС) клеток мыши, несущих аллель B-hyg TCRα, полученный на первом этапе последовательного нацеливания (Фиг. 1), выполняя введение LTVEC в ЭС-клетки. После восстановления в ростовой среде ЭС-клетки, подвергнутой электропорации, добавляли G418 для отбора колоний, полученных из клеток, в геномы которых встраивали LTVEC. Скрининг МОА выделенных колоний привел к идентификации двух правильно нацеленных клонов среди 192 подвергнутых скринингу колоний, устойчивых к G418, при этом эффективность нацеливания составила 1,0% (таблица 1, эксперимент 4). В дополнение к вставке 11 дополнительных V-сегментов правильно нацеленные клоны имели кассету neor, которой заменили кассету hygr.

Эксперимент 5 был идентичен эксперименту 4, за исключением добавления 0,02 мг каждой из двух плазмид, экспрессирующих каждую половину Hyg-ZFN(1,2), которая связывается с последовательностями распознавания в hygr и катализирует двухцепочечный разрыв в ДНК. Включение Hyg-ZFN(1,2) приводило к 40 правильно нацеленным клонам из 192 подвергнутых скринингу клонов, устойчивых к G418, при этом эффективность нацеливания составляла 21%, что является в 21 раз большей эффективностью нацеливания по сравнению с электропорацией только LTVEC (таблица 1, сравнение экспериментов 4 и 5).

Эксперимент 6 был идентичен эксперименту 5, за исключением того, что плазмиды, кодирующие Hyg-ZFN(1,2) заменяли плазмидами Hyg-ZFN(3,4). Включение Hyg-ZFN(3,4) приводило к 42 правильно нацеленным клонам из 192 подвергнутых скринингу клонов, устойчивых к гигромицину, при этом эффективность нацеливания составляла 22%, что является в 22 раза большей эффективностью нацеливания по сравнению с электропорацией только LTVEC (таблица 1, сравнение экспериментов 4 и 6).

В экспериментах, обобщенных в таблице 1, было установлено, что включение в эксперименты последовательного нацеливания ZFN, нацеленных на кассеты селекции neor или hygr, и LTVEC может повысить эффективность нацеливания в 3-20 раз по сравнению с экспериментами нацеливания, которые включают в себя только LTVEC. Увеличение эффективности нацеливания, полученное посредством включения ZFN в эксперименты последовательного нацеливания, способствовало правильной намеченной вставке очень больших частей (136 т.п.н. и 157 т.п.н.) человеческой ДНК точно в заданное хромосомное положение ранее модифицированного аллеля. Усиленное ZFN нацеливание значительно повышает вероятность успеха в проекте нацеливания и обеспечивает значительную экономию времени, труда и материальных затрат на скрининг ЭС-клеток.

Все публикации и заявки на патенты, упомянутые в настоящем техническом описании, являются показателем уровня среднего специалиста в данной области, к которой относится настоящее изобретение. Все публикации и заявки на патенты включены в настоящий документ путем ссылки в той степени, как если бы каждая отдельная публикация или заявка на патент была конкретно и индивидуально обозначена как включенная путем ссылки. Если из контекста не следует иное, любой вариант осуществления, аспект, этап или признак изобретения может быть использован в сочетании с любым другим. Ссылка на диапазон включает в себя любые целые числа в пределах диапазона, любой поддиапазон в пределах диапазона. Ссылка на множество диапазонов включает в себя комбинации таких диапазонов.


СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МОДИФИКАЦИИ ЦЕЛЕВОГО ЛОКУСА
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МОДИФИКАЦИИ ЦЕЛЕВОГО ЛОКУСА
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МОДИФИКАЦИИ ЦЕЛЕВОГО ЛОКУСА
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МОДИФИКАЦИИ ЦЕЛЕВОГО ЛОКУСА
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МОДИФИКАЦИИ ЦЕЛЕВОГО ЛОКУСА
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МОДИФИКАЦИИ ЦЕЛЕВОГО ЛОКУСА
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МОДИФИКАЦИИ ЦЕЛЕВОГО ЛОКУСА
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МОДИФИКАЦИИ ЦЕЛЕВОГО ЛОКУСА
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МОДИФИКАЦИИ ЦЕЛЕВОГО ЛОКУСА
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МОДИФИКАЦИИ ЦЕЛЕВОГО ЛОКУСА
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МОДИФИКАЦИИ ЦЕЛЕВОГО ЛОКУСА
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МОДИФИКАЦИИ ЦЕЛЕВОГО ЛОКУСА
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МОДИФИКАЦИИ ЦЕЛЕВОГО ЛОКУСА
Источник поступления информации: Роспатент

Showing 1-10 of 33 items.
04.04.2018
№218.016.2fd1

Антитела со встроенным в легкие цепи гистидином и генетически модифицированные отличные от человека животные для их получения

Настоящее изобретение относится к генетической инженерии, в частности к генетически модифицированным грызунам, а именно крысам и мышам. Указанные грызуны созданы для получения антител, содержащих лёгкую цепь иммуноглобулина с вариабельным доменом человека, в котором аминокислота гистидин...
Тип: Изобретение
Номер охранного документа: 0002644684
Дата охранного документа: 13.02.2018
04.04.2018
№218.016.3347

Опосредованное нуклеазой нацеливание с большими нацеливающими векторами

Изобретение относится к генетической инженерии, в частности к способу модификации целевого геномного локуса путем гомологичной рекомбинации в мышиной эмбриональной стволовой (ES) клетке. Для осуществления указанного способа сначала в мышиную ES-клетку вводят цинковопальцевую нуклеазу (ZFN),...
Тип: Изобретение
Номер охранного документа: 0002645475
Дата охранного документа: 21.02.2018
10.05.2018
№218.016.3bcc

Легковыделяемые биспецифические антитела с природным иммуноглобулиновым форматом

Изобретение относится к области биохимии. Описано изобретение - способ выделения биспецифического антигенсвязывающего белка. Способ включает в себя стадии: контактирование разрушенной клетки или смеси антигенсвязывающих белков с аффинной подложкой с белком А, и, элюирование биспецифического...
Тип: Изобретение
Номер охранного документа: 0002647758
Дата охранного документа: 19.03.2018
10.05.2018
№218.016.3db4

Животные, содержащие гуманизированную дипептидилпептидазу iv (dpp4)

Настоящее изобретение относится к генетической инженерии, в частности к трансгенному грызуну, мыши или крысе, которого используют для экспрессии человеческого белка DPP4. Геном указанного грызуна содержит замену геномного фрагмента гена Dpp4 грызуна в эндогенном локусе Dpp4 грызуна на геномный...
Тип: Изобретение
Номер охранного документа: 0002648166
Дата охранного документа: 22.03.2018
11.06.2018
№218.016.6065

Гуманизированные не относящиеся к человеку животные с ограниченными локусами тяжелой цепи иммуноглобулина

Изобретение относится к области биохимии, в частности к мыши, содержащей в своей зародышевой линии нереаранжированную геномную последовательность человека, содержащую единственный генный сегмент V человека, который представляет собой V1-2, V1-69, один или несколько генных сегментов D человека и...
Тип: Изобретение
Номер охранного документа: 0002656155
Дата охранного документа: 31.05.2018
25.06.2018
№218.016.66d9

Человеческие антитела к fel d1 и способы их применения

Настоящее изобретение относится к области биохимии, а именно к антителу, которое связывается с кошачьим аллергеном, Fel d1, композициям, содержащим указанное антитело, нуклеиновой кислоте, его кодирующей, а также к способу применения указанного антитела. Антитела по настоящему изобретению также...
Тип: Изобретение
Номер охранного документа: 0002658491
Дата охранного документа: 21.06.2018
08.07.2018
№218.016.6daa

Генетически модифицированные мыши, экспрессирующие химерные молекулы главного комплекса гистосовместимости

Изобретение относится к области биохимии, в частности к грызуну, который экспрессирует химерный человеческий/относящийся к грызуну белковый комплекс МНС II, а также к его клетке и ткане. Также раскрыт способ модификации локуса МНС II мыши для экспрессии химерного человеческого/мышиного...
Тип: Изобретение
Номер охранного документа: 0002660564
Дата охранного документа: 06.07.2018
12.07.2018
№218.016.6f41

Генетически модифицированные в отношении т-клеточного рецептора мыши

Изобретение относится к области биохимии, в частности к генетически модифицированному грызуну, экспрессирующему гуманизированный Т-клеточный рецептор (TCR) и содержащему в геноме своей зародышевой линии: нереаранжированную последовательность вариабельной области TCRα, и/или нереаранжированную...
Тип: Изобретение
Номер охранного документа: 0002661106
Дата охранного документа: 11.07.2018
17.08.2018
№218.016.7be1

Гуманизированные грызуны, которые экспрессируют тяжелые цепи, содержащие домены vl

Изобретение относится к области биохимии, в частности к мыши для получения последовательностей вариабельной области иммуноглобулина человека, содержащей вставку одного или нескольких генных сегментов V человека и одного или нескольких генных сегментов J человека, вставку одного или нескольких...
Тип: Изобретение
Номер охранного документа: 0002664185
Дата охранного документа: 15.08.2018
17.08.2018
№218.016.7bf2

Маркеры ответа опухолевых клеток на противораковую терапию

Изобретение относится к биотехнологии. Описаны композиции и способы для определения находящихся в системе кровообращения биомолекул до, во время и/или после лечения пациента противораковым или противоопухолевым лекарственным препаратом (или предполагаемым лекарственным препаратом). Предложены...
Тип: Изобретение
Номер охранного документа: 0002664180
Дата охранного документа: 15.08.2018
Showing 1-7 of 7 items.
04.04.2018
№218.016.3347

Опосредованное нуклеазой нацеливание с большими нацеливающими векторами

Изобретение относится к генетической инженерии, в частности к способу модификации целевого геномного локуса путем гомологичной рекомбинации в мышиной эмбриональной стволовой (ES) клетке. Для осуществления указанного способа сначала в мышиную ES-клетку вводят цинковопальцевую нуклеазу (ZFN),...
Тип: Изобретение
Номер охранного документа: 0002645475
Дата охранного документа: 21.02.2018
11.01.2019
№219.016.ae99

Направленная модификация генома крысы

Изобретение относится к области биохимии, в частности к способу направленной модификации представляющего интерес геномного локуса в одной или более плюрипотентных клетках крысы, включающему введение в плюрипотентные клетки крысы большого таргетирующего вектора (LTVEC), содержащего вставку...
Тип: Изобретение
Номер охранного документа: 0002676708
Дата охранного документа: 10.01.2019
27.04.2019
№219.017.3ba9

Способы и композиции для направленной модификации генома

Настоящее изобретение относится к генной инженерии. Предложен способ in vitro модификации генома в представляющем интерес геномном локусе в нечеловеческой плюрипотентной клетке млекопитающего, включающий внесение в клетку компонентов системы CRISPR/Cas9 в комбинации с крупным направляющим...
Тип: Изобретение
Номер охранного документа: 0002685914
Дата охранного документа: 23.04.2019
04.06.2019
№219.017.72ff

Генетическая модификация крыс

Изобретение относится к области биотехнологии, а именно к созданию линии крысиных эмбриональных стволовых клеток, получению генетически модифицированной крысы и композиции для культивирования и поддержания плюрипотентности крысиных эмбриональных стволовых клеток. Способ включает...
Тип: Изобретение
Номер охранного документа: 0002690352
Дата охранного документа: 31.05.2019
24.11.2019
№219.017.e563

Способы и композиции для получения или поддержания плюрипотентных клеток

Изобретение относится к области биотехнологии, а именно к получению популяции человеческих индуцированных плюрипотентных стволовых клеток (hiPSC), поддержанию hiPSC, модификации целевого геномного локуса в hiPSC и композиции для культивирования и поддержания hiPSC. Способ включает...
Тип: Изобретение
Номер охранного документа: 0002706965
Дата охранного документа: 21.11.2019
06.12.2019
№219.017.e9e9

Опосредованная нуклеазой сборка днк

Изобретение относится к области биотехнологии и молекулярной биологии. Предложен in vitro способ сборки нуклеиновых кислот с использованием нуклеазного агента - комплекса гРНК-Cas, нуклеазы с цинковыми пальцами или эффекторной нуклеазы. Изобретение может быть использовано в прикладной...
Тип: Изобретение
Номер охранного документа: 0002707911
Дата охранного документа: 02.12.2019
24.01.2020
№220.017.f97f

Способы и композиции для нацеленных генетических модификаций и способы их применения

Изобретение относится к области биохимии, в частности к способу модификации целевого геномного локуса на Y-хромосоме в мышиной эмбриональной стволовой клетке (ЭС). При этом способ предусматривает: обеспечение мышиной ЭС клетки, содержащей целевой геномный локус на Y-хромосоме, причем целевой...
Тип: Изобретение
Номер охранного документа: 0002711740
Дата охранного документа: 21.01.2020
+ добавить свой РИД