На участке левой цепи днк нуклеотиды расположены в такой последовательности
Для решения задач по молекулярной биологии необходимо владеть следующими биологическими понятиями: виды нуклеиновых кислот,строение ДНК, репликация ДНК , функции ДНК, строение и функции РНК, генетический код, свойства генетического кода,мутация.
Типовые задачи знакомят с основными приемами рассуждений в генетике, а "сюжетные"– полнее раскрывают и иллюстрируют особенности этой науки, делая ее интересной и привлекательной для учащихся. Подобранные задачи характеризуют генетику как точную науку, использующую математические методы анализа. Решение задач в биологии требует умения анализировать фактический материал, логически думать и рассуждать , а также определенной изобретательности при решении особенно трудных и запутанных задач.
Для закрепления теоретического материала по способам и приемам решения задач предлагаются задачи для самостоятельного решения, а также вопросы для самоконтроля.
Примеры решения задач
- Один шаг это полный виток спирали ДНК–поворот на 360 o
- Один шаг составляют 10 пар нуклеотидов
- Длина одного шага – 3,4 нм
- Расстояние между двумя нуклеотидами – 0,34 нм
- Молекулярная масса одного нуклеотида – 345 г/моль
- Молекулярная масса одной аминокислоты – 120 г/мол
- В молекуле ДНК: А+Г=Т+Ц (Правило Чаргаффа: ∑(А) = ∑(Т), ∑(Г) = ∑(Ц), ∑(А+Г) =∑(Т+Ц)
- Комплементарность нуклеотидов: А=Т; Г=Ц
- Цепи ДНК удерживаются водородными связями, которые образуются между комплементарными азотистыми основаниями: аденин с тимином соединяются 2 водородными связями, а гуанин с цитозином тремя.
- В среднем один белок содержит 400 аминокислот;
- вычисление молекулярной массы белка:
где Мmin – минимальная молекулярная масса белка,
а – атомная или молекулярная масса компонента,
в – процентное содержание компонента.
Задача № 1.Одна из цепочек ДНК имеет последовательность нуклеотидов : АГТ АЦЦ ГАТ АЦТ ЦГА ТТТ АЦГ . Какую последовательность нуклеотидов имеет вторая цепочка ДНК той же молекулы. Для наглядности можно использовать магнитную "азбуку" ДНК (прием автора статьи) .
Решение: по принципу комплементарности достраиваем вторую цепочку (А-Т,Г-Ц) .Она выглядит следующим образом: ТЦА ТГГ ЦТА ТГА ГЦТ ААА ТГЦ.
Задача № 2. Последовательность нуклеотидов в начале гена, хранящего информацию о белке инсулине, начинается так: ААА ЦАЦ ЦТГ ЦТТ ГТА ГАЦ. Напишите последовательности аминокислот, которой начинается цепь инсулина.
Решение: Задание выполняется с помощью таблицы генетического кода, в которой нуклеотиды в иРНК (в скобках – в исходной ДНК) соответствуют аминокислотным остаткам.
Задача № 3. Большая из двух цепей белка инсулина имеет (так называемая цепь В) начинается со следующих аминокислот : фенилаланин-валин-аспарагин-глутаминовая кислота-гистидин-лейцин. Напишите последовательность нуклеотидов в начале участка молекулы ДНК, хранящего информацию об этом белке.
Решение (для удобства используем табличную форму записи решения): т.к. одну аминокислоту могут кодировать несколько триплетов, точную структуру и-РНК и участка ДНКопределить невозможно, структура может варьировать. Используя принцип комплементарности и таблицу генетического кода получаем один из вариантов:
На участке левой цепи ДНК нуклеотиды расположены в такой последовательности: АГАТАТТГТТЦТ. Какую первичную структуру будет иметь белок, синтезируемый при участии противоположной - правой цепи ДНК(для решения используйте таблицу генетического кода)?
P.S. Нужно сначала перевести в правую цепь ДНК или сразу в и-РНК??
левая цепь АГАТАТТГТТЦТ
правая ------ТЦТАТААЦААГА
и-РНК с
правой цепи АГАУАУУГУУЦУ
(в общем-то и-РНК с правой цепи будет повторять левую, в которой Т заменено на У)
белок: аргинин (АГА) - тирозин (УАУ) -цистеин (УГУ) -серин (УЦУ)
Нихрена щас учат. Забей до понедельника, а там скажи, мол недопоняла я, так вот так, объясните, или возьми лист накалякай там эти УЦАГи и стрелки (типа я вот старалась) . Пару точно не влепят.
На участке левой цепи ДНК нуклеотиды расположены в следующей последовательности : АЦААТААААГТТГ… Какую первичную структуру имеет полипептид, синтезируемый при участии этой цепи ДНК?
Что будет с молекулой белка, если 13 и 2 нуклеотиды поменяются местами?
ЕСЛИ МЕНЯЮТСЯ, ТО : ТЦТТАТТТТЦААГ
Кодирующая цепь ДНК имеет последовательность нуклеотидов : ТАГ ТТЦ ТЦГ АГА?
Кодирующая цепь ДНК имеет последовательность нуклеотидов : ТАГ ТТЦ ТЦГ АГА.
Как изменится структура молекулы белка, если произойдет удвоение восьмого нуклеотида в цепи ДНК.
Дана цепь ДНК : ЦТАТАГТААЦЦАА?
Дана цепь ДНК : ЦТАТАГТААЦЦАА.
Определите : а)первичную структуру белка, закодированного в этой цепи ; б)количество (в %) различных видов нуклеотидов в этом гене (в двух цепях) ; в)длину этого гена ; г) первичную структуру белка, синтезируемого после выпадуния девятого нуклеотида в этой цепи ДНК.
Одно из цепей молекул днк имеет следующий порядок нуклеотидов : ААГАААГГТАТТ?
Одно из цепей молекул днк имеет следующий порядок нуклеотидов : ААГАААГГТАТТ.
Определите последовательность нуклеотидов в комплементарной цепи днк.
Определите последовательность нуклеотидов иРНК, синтезированную с правой цепи фрагментов молекулы ДНК, если ее левая цепь имеет следующую последовательность АААЦГАГТТГГПТТЦГТГ?
Определите последовательность нуклеотидов иРНК, синтезированную с правой цепи фрагментов молекулы ДНК, если ее левая цепь имеет следующую последовательность АААЦГАГТТГГПТТЦГТГ.
Правая цепь фрагмента ДНК имеет такую структуру : ТАТТЦТТТТТГТГГАЦГ… Укажите структуру соответствующей части молекулы белка, синтезируемого при участии левой цепи ДНК?
Правая цепь фрагмента ДНК имеет такую структуру : ТАТТЦТТТТТГТГГАЦГ… Укажите структуру соответствующей части молекулы белка, синтезируемого при участии левой цепи ДНК.
А как изменится структура фрагмента синтезируемого белка, если в правой цепи ДНК под воздействием химических факторов выпадает 11 - й нуклеотид?
На участке левой (условно) цепи ДНК нуклеотиды расположены в такой последовательности : АЦА АТА ААА ГТТ ГЦА?
На участке левой (условно) цепи ДНК нуклеотиды расположены в такой последовательности : АЦА АТА ААА ГТТ ГЦА.
Какую первичную структуру имеет полипептид, синтезируемый при участии этой цепи ДНК?
И желательно решение подробное.
Практическая работа№4 помогите?
Практическая работа№4 помогите!
1)Определите последовательность нуклеотидов участка молекулы иРНК, синтезируемой на участке ДНК с последовательностью нуклеотидов АТТЦАЦГАЦЦЦТТЦТ
2)Определите последовательность нуклеотидов иРНК, синтезированную с правой цепи фрагмента молекулы ДНК , если ее левая цепь имеет следующую последовательность : АААЦГАГТТГГАТТЦГТГ
3)Фрагмент транскрибируемой цепи молекулы ДНК содержит 38% гуаниловых нуклеотидов.
Определите содержание цитидиловых нуклеотидов в соответствующей молекуле иРНК
4)Фрагмент иРНК имеет следующую последовательность нуклеотидов : ГЦАУУАГЦАУЦАГАЦУГУ.
Определите последовательность нуклеотидов фрагмента молекулы ДНК, с которой транскрибирован данный фрагмент иРНК.
5)Укажите последовательность нуклеотидов в обеих цепях фрагмента ДНК, если известно, что иРНК, синтезированная на этом участке, имеет следующее строение : АГУАЦЦГАУАЦУУГА
6)Последовательность нуклеотидов в начале гена, хранящего информацию о белке инсулине, начинается так : АААЦАЦЦТГЦТТГТАГАЦ.
Запишите последовательность аминокислот, с которой начинается цепь инсулина.
7)Полипептид состоит из следующих друг за другом аминокислот : глицин - валин - аланин - глицин - лизин - триптофан - валин - серин - глутаминовая кислота.
Определите структуру участка ДНК, кодирующего приведенный полипептид.
9. Участок молекулы белка имеет следующую последовательность аминокислот : аргинин - метионин - триптофан - гистидин - аргинин.
Определить возможные последовательности нуклеотидов в молекуле иРНК.
10)В синтезе белка приняли участие молекулы тРНК с антикодонами : УУГ, ГУЦ, ЦГУ, УУЦ, ГАУ, АУЦ.
Определите нуклеотидную последовательность во фрагме ДНК, последовательность аминокислот в участке синтезируемого белка и чисто нуклеотидную последовательность во фрагменте ДНК, последовательность аминокислот в участке синтезируемого белка и число нуклеотидов, содержащих тимин, аденин, гуанин и цитозин во фрагменте молекулы ДНК.
На участке первого фрагмента днк нуклеотиды расположены в такой последовательности ААААТААЦААГААЦ?
На участке первого фрагмента днк нуклеотиды расположены в такой последовательности ААААТААЦААГААЦ.
Какую первичную структуру будет иметь белок, синтезирующий при участии этой (правой)ДН?
Постройте вторую цепь днк.
На участке правой цепи фрагмента ДНК нуклеотиды расположены так : А - А - А - А - Т - А - А - Ц - А - А - Ц - А - Ц?
На участке правой цепи фрагмента ДНК нуклеотиды расположены так : А - А - А - А - Т - А - А - Ц - А - А - Ц - А - Ц.
Какую первичную структуру будет иметь белок синтезируемый при участии правой цепи ДНК?
Достройте вторую цепь ДНК.
Последовательность нуклеотидов одной из цепей ДНК имеет вид : ЦЦАГГГТТАГГЦЦЦА?
Последовательность нуклеотидов одной из цепей ДНК имеет вид : ЦЦАГГГТТАГГЦЦЦА.
Запишите последовательность нуклеотидов комплементарной цепи.
Определите процентное содержание всех нуклеотидов этого участка молекулы ДНК.
Некоторым аминокислотам соответствует несколько антикодонов т-РНК, поэтому одну аминокислоту могут переносить несколько т-РНК.
Вопрос. Заполните таблицу.
Вопрос. Что и как закодировано в цепи ДНК?
Закодирована информация о первичной структуре белков. Информация записана нуклеотидами, каждый триплет нуклеотидов в молекуле ДНК соответствует одной аминокислоте в молекуле белка.
Вопрос. Что происходит в процессе транскрипции?
На матрице, которой является структурный ген ДНК, синтезируется его копия — и-РНК. Синтез молекулы и-РНК идет по принципу комплементарности с помощью нескольких ферментов.
Вопрос. Где и как происходит трансляция?
Трансляция происходит в цитоплазме клетки. Рибосома соединяется с молекулой и-РНК и передвигается по ней, а т-РНК подносят аминокислоты, которые присоединяются рибосомой к растущей полипептидной цепи.
Вопрос. Какую роль играют ферменты в процессе биосинтезе белка?
Ферменты осуществляют и ускоряют процессы биосинтеза белка.
Вопрос 2. Решите задачу. Используя таблицу генетического кода, запишите последовательность аминокислот, зашифрованных в участке и-РНК:
А У Г Ц У У У У А Г У У А Г А Г У Г
мет — лей — лей — вал — арг — вал
Вопрос 3. Письменно составьте план рассказа о современной догме молекулярной биологии, которая выражается в схеме: ДНК → и-РНК → белок.
1.Генетический код ДНК; 2. Процесс транскрипции; 3. Процесс трансляции.
Стр. 112–113
Решение задач по молекулярной биологии
Вопрос 1. Используя принцип комплементарности, постройте участок второй нити ДНК по данному участку кодогенной нити и определите общее количество водородных связей на данном участке ДНК.
Всего связей: 16+30=46
Вопрос 2. Сколько свободных нуклеотидов потребуется:
А) для редупликации фрагмента ДНК:
ЦГТААЦТГЦГГЦТТТАЦГГАЦААГГЦТ Редупликация — это процесс удвоения ДНК, когда из комплементарных свободных нуклеотидов достраивается вторая цепь. Для редупликации данного фрагмента необходимо: аденина (А) — 6 нуклеотидов, тимина (Т) — 6 нуклеотидов, цитозина(Ц) — 8 нуклеотидов, гуанина (Г) — 7 нуклеотидов.
Б) для образования и-РНК, на которой синтезируется белок, состоящий из 1380 аминокислот;
Если белок состоит из 1380 аминокислот, а каждая аминокислота кодируется триплетом нуклеотидов, значит потребуется 1380×3=4140 нуклеотидов.
в) для формирования участка ДНК, содержащего данный ген. Потребуется 4140 нуклеотидов для одной цепи ДНК, и столько же для второй цепи ДНК. Всего: 4140 ×2= 8280 нуклеотидов.
Вопрос 3. Участок ДНК содержит 26% аденина. Определите процентный состав других нуклеотидов.
Согласно принципу комплементарности: количество аденина равно количеству тимина, значит А=Т=26%. Принимая все количество нуклеотидов за 100%, найдем суммарное количество цитозина и гуанина (Ц+Г)=100% — (А+Т). (Ц+Г)=100% — (26%+26%)=48%. Так как количество гуанина равно количеству цитозина Ц=Г=48% : 2=24%.
Ответ: Т=26%, Ц=24%, Г=24%.
Вопрос 4. На участке кодогенной нити ДНК нуклеотиды расположены в следующей последовательности: Ц Г Т Ц Т А Ц Т Т А Г Т А Ц Ц Т Т Т Т Ц А
Какую первичную структуру имеет полипептид, синтезируемый при участии этой цепи ДНК?
Ц Г Т Ц Т А Ц Т Т А Г Т А Ц Ц Т Т Т Т Ц А
и-РНК Г Ц А Г А У Г А А У Ц А У Г Г А А А А Г У
Ответ: ала — асп — глу — сер — три — лиз — сер
Вопрос 5. Часть молекулы белка имеет следующую первичную структуру: сер-лиз-три-глун-ала-сер-аспн-вал. Запишите:
А) участок и-РНК, на котором синтезирован этот белок;
Используя таблицу генетического кода, определяем триплеты, кодирующие аминокислоты. Зная такое свойство генетического кода, как вырожденность, когда одну аминокислоту кодирует несколько триплетов, берем самое верхнее значение в таблице.
Б) участок гена, который несет информацию о строении этого белка;
по принципу комплементарности с и-РНК переписываем цепь ДНК:
АГА ТТТ АЦЦ ЦТТ ЦГА АГА ЦТА ЦАА
В) антикодоны т-РНК, которые участвуют в синтезе этого белка.
Антикодоны т-РНК должны быть комплементарны триплетам нуклеотидов и-РНК:
Вопрос 6. Как могут быть закодированы в гене мономеры следующего участка белка:
лиз — три-цис-тир-гис-гли-ала-. Запишите два варианта.
Используя таблицу генетического кода, определяем триплеты и-РНК, кодирующие аминокислоты. Зная такое свойство генетического кода, как вырожденность, когда одну аминокислоту кодирует несколько триплетов, берем самое верхнее значение в таблице.
и-РНК ААА-УГГ-УГУ-УАУ-ЦАУ-ГГУ-ГЦУ по принципу комплементарности с и-РНК переписываем цепь ДНК:
ТТТ АЦЦ АЦА АТА ГТА ЦЦА ЦГА
Используя таблицу генетического кода, определяем триплеты и-РНК, кодирующие аминокислоты. Зная такое свойство генетического кода, как вырожденность, когда одну аминокислоту кодирует несколько триплетов, берем самое нижнее значение в таблице.
Обзор
ДНК не то, чем кажется. И то, чем кажется, тоже. Но не всегда.
иллюстрация автора статьи
Автор
Редакторы
Генеральный партнер конкурса — ежегодная биотехнологическая конференция BiotechClub, организованная международной инновационной биотехнологической компанией BIOCAD.
Спонсор конкурса — компания SkyGen: передовой дистрибьютор продукции для life science на российском рынке.
Место ДНК в клетке и обществе
Всё это радует и служит популяризации науки, однако не стоит забывать что в жизни — в биологической жизни — ДНК — это, чаще всего, правозакрученная двойная спираль, шаг которой охватывает примерно 10 нуклеотидов.
В тени молекулярной догмы
- реплицироваться в новую копию ДНК;
- транскрибироваться в РНК.
И уже РНК далее способна (хотя и не обязательно — может просто функционировать в клетке сама по себе):
или в особом, описанном позже, случае
Рисунок 2. Центральная догма молекулярной биологии
Что же осталось в тени процессов, объединенных информационными потоками центральной догмы? Что бы это ни было, ему есть где развернутся. На некодирующие области приходится большая часть эукариотических геномов (в случае человека — увесистые 98%). У прокариот их поменьше — в среднем, 20%. По началу такие области, не содержащие послание для передачи в РНК, называли мусорной ДНК (junk DNA) [1] и относились к ним с пренебрежением. Прошли годы, методики совершенствовались, знания неуклонно копились. И теперь мы знаем: в этом сумраке таится много полезного. Что же именно и в какой пропорции?
В некодирующей области ДНК есть, скажем, мобильные генетические элементы (прежде всего, способные перемещаться по геному транспозоны [2]), тандемные повторы разного сорта (от сателлитов до микросателлитов) [3] и прочее. Наконец, огромное значение имеют области ДНК, нужные для регуляции. Действительно, помимо блоков, ЦДМБ имеет еще и стрелки — они обозначают процессы передачи информации, вполне конкретные биохимические процессы.
Что регулирует эти сложные процессы, что управляет ими? Специфичное, хорошо оркестрованное взаимодействие ДНК и ДНК-связывающих белков. Дело в том, что в живой клетке (ткани, природе. ) все должно быть динамично и управляемо. Это жизненно необходимо и для разумного реагирования на удары судьбы (стрессы), и для разного рода взаимодействий клеток, и для индивидуального развития (онтогенеза).
Притча о слепых белках и ДНК
Безусловно, ДНК далеко до структурного разнообразия белков с их неисчислимыми фолдами, укладками и т.п. Однако и у нее можно выделить иерархию уровней организации: от первичной (последовательность нуклеотидов) через небольшое разнообразие вторичных и третичных структурных блоков до четвертичной. Последняя представляет собой надмолекулярные объединения — как между разными молекулами ДНК, так и между ДНК и ДНК-связывающими белками.
- триплетность;
- неперекрываемость;
- вырожденность;
- универсальность;
- наличие кодонов — знаков препинания;
и некоторыми другими.
Все эти законы не действуют на некодирующей части генома. А действуют совсем другие и для каждого типа последовательности они, в общем, свои.
Таковы принципы кодирования и хранения генетической информации, изображенные в виде блоков ЦДМБ. А как насчет способов ее воплощения, то есть перевода информации одного биополимера в другой, а также всех последующих этапов экспрессии генов? Что стоит за стрелками на схеме догмы, соединяющей квадраты? Большая биохимическая работа и сложные структурные основы. Эти процессы протекают во вполне физической реальности — на них согласованно работают многие ферменты, факторы. Вовлечены в эту 3D-хореографию и специализированные области ДНК. Что же делает их такими специализированными?
В первом приближении — им следует связывать белковые молекулы. Для этого служат опять-таки разные уровни организации регуляторных ДНК: особая последовательность, структура и физико-химические свойства.
Рисунок 3. Сайт специфичного и точного связывания важной рестриктазы EcoRI и место разреза — расщепления ДНК
рисунок автора статьи
Рисунок 4. Сайт связывания фактора транскрипции CEBPB
видят ДНК совершенно по-разному.
Пo мере того, как ученые вникали в интимные стороны взаимодействий ДНК и ДНК-связывающих белков, они стали различать прямое (direct) и непрямое прочтения (indirect readout) нуклеотидной последовательности. В случае прямого прочтения распознавание и связывание двух биомолекул определяется теми парами оснований, которые, собственно, контактируют с белком. Здесь все понятно. Но уже довольно давно биологи стали отмечать: не вовлеченные в прямые взаимодействия нуклеотиды определяют стабильность и специфичность связывания. В этом и состоит непрямое прочтение.
В числе первых этот аспект распознавания описан на примере такого важного фактора транскррипции, как TATA-связывающий белок (TATA-binding protein, TBP). После этого последовало множество других примеров непрямого прочтения [6].
Но и этого мало: выделили также прочтение формы (shape readout) — оно определяется трехмерной формой дуплекса ДНК. В основе этого нового видения той же ДНК — вандерваальсовы и электростатические взаимодействия. Напомним, что прямое прочтение ДНК белком зависит от водородных связей, образованных конкретными нуклеотидами и аминокислотными остатками [7].
Следующий пункт. Важность великого множества одних только физико-химических и структурных свойств (не забывая и первичную структуру!) связано с тем, что, скажем, транскрипция — процесс многостадийный, и на разных этапах одни параметры ДНК могут быть важнее других. Даже инициация транскрипции насчитывает несколько этапов: посадка белков, образование закрытого комплекса, плавление дуплекса (то есть расхождение цепей) с образованием открытого комплекса и т.д. Кстати, именно инициация транскрипции — в особенности на примере прокариотических промоторов и простых РНК-полимераз, — служит элементарной системой для изучения всей сложной кухни молекулярного узнавания [8], [9].
Рисунок 5. Бактериофаг Т7 — срез через вирион (слева) и общий вид
Биография Т7 от начала до конца. До 3′-конца
Далее включается область генов II класса и соответствующих промоторов. Их задача — активная наработка ДНК бактериофага (ее репликация), а также синтез лизоцима — антибактериального фермента, с помощью которого потомкам бактериофага предстоит выбраться из гибнущей клетки. Стандартный сценарий для такого литического фага, как Т7.
Наконец, область генов и промоторов III класса. Их задача — обеспечить созревание фаговой ДНК, сборку новых вирусных частиц и затем упаковать одно в другое.
На этом жизненный цикл Т7 заканчивается литической и трагической концовкой. Весь экшн занимает обычно 17 мин, по минутам же расписано переключение между его фазами [13], [14]. Но остается довольно животрепещущий вопрос: что переключает активность областей этого элементарного генома?
Промоторы — промотируют, полимераза — полимеразит
Рисунок 7. Едва различимые последовательности очень непохожих по своим свойствам нативных промоторов бактериофага T7
Здесь на сцену выходят физико-химические свойства дуплекса промоторных областей. Они могут объяснить, как РНК-полимераза Т7 распознает их и специфично, и переключаемо. Для этого процесса молекулярного узнавания важнее именно уровень физико-химических свойств ДНК — что особенно явственно в случае предельно простой транскрипционной системы Т7 [14].
Какими же параметрами ДНК могут направляться взаимодействия биомолекул?
Задолго до прямого контакта молекулярному узнаванию промотора и полимеразы может способствовать электростатический потенциал. Действительно, если мы вспомним, что каждый ее мономер-нуклеотид имеет заряженную отрицательно фосфатную группу, станет понятно — на ДНК есть к чему притянутся положительному заряду. В полном соответствии со школьным законом Кулона. Действительно, ДНК-связывающие белки с этой целью снабжены положительно заряженными участками. В случае же промоторов Т7 присутствуют и особые мотивы распределения заряда [15]. Если мы рассчитаем значение заряда вдоль оси ДНК (на основе известной последовательности нуклеотидов), то получим характерные профили (рис. 8). Заметим, что свой профиль есть и у промоторов II и III класса — по ним, в частности, фаговая РНК-полимераза их и различает.
Рисунок 8. Профили электростатического потенциала для промоторов Т7: ранних, II класса и III класса
Следующее важное свойство ДНК — дестабилизация при скручивании. Сложно подобрать простое название этому параметру, так что приведем какое есть: вызванная суперспирализацией дестабилизации дуплекса ДНК (Stress-Induced Duplex Destabilization). Если коротко, модель SIDD — это способ описать, что будет с ДНК, если на нее как следует надавить, а точнее — скрутить. Дело в том, что одни последовательности в такой напряженной ситуации могут легко расплавиться (так называют расхождение цепей ДНК), другие — выстоят, третьи — плавятся совсем не там, где от них ждешь. Это свойство важно для взаимодействия ДНК с белками и, в частности, хорошо зарекомендовало себя для предсказания промоторов [9]. Как же обстоят дела с SIDD у промоторов Т7?
Рисунок 9. Профиль SIDD для генома Т7
рисунок автора статьи
Из набора промоторов Т7 SIDD показывает следующий тренд. Если промотор представляет класс III, то он гораздо более легкоплавкий — цепи дуплекса такого участка ДНК расходятся при меньшей температуре и более низкой суперспирализации. Это неплохо соотносится с экспериментальными данными о том, что промоторы разных классов активны при разных условиях окружающей среды — включая как раз таки показатель суперспиральности [4], [9].
Другая закономерность затрагивает репликацию, для которой Т7-ДНК также является хорошей моделью. Этот геном имеет специализированный ориджин (точку начала репликации), отдаленный от 5′-конца на 17% длины генома. Однако его копирование может начинаться также в ряде других точек — и это как раз таки некоторые промоторы. Удивительно, но именно они относятся к числу дестабилизированных. Удивительно и осмысленно, поскольку репликация также может требовать особых физико-химических свойств дуплекса. В частности, легкость плавление дуплекса ДНК здесь точно не помешает [5].
Исчерпывающие мутанты
Сложный характер зависимости промоторной активности от физико-химических свойств ДНК и от нуклеотидной последовательности требует полных или по меньшей мере больших данных. Вот если бы получить все или почти все возможные варианты промотора Т7 и узнать, насколько они активны. А ведь в постгеномную эпоху и век дешевых NGS это как раз таки реализуемо! И уже проделано в отношении промотора Т7. В работе [17] использована высокопроизводительная методология: в небольшие фрагменты ДНК встроили почти 8 тысяч случайным образом измененных последовательностей промотора фага Т7, а также последовательности-метки (баркоды) — чтобы потом разобрать, кто есть кто. Далее напрямую замерили их промоторную активность. Имея в распоряжении полные последовательности (промотор + небольшой контекст), нетрудно и рассчитать те физико-химические параметры дуплекса, которые не требуют значительных участков ДНК на входе (SIDD здесь, к сожалению, отпадает — ведь для расчета этого параметра дуплекса нужны очень крупные фрагменты ДНК).
Что показала данная работа и последующий анализ данных о последовательности, физико-химии и величине промоторной активности? Прежде всего, она подтвердила многие выводы о важности отдельных нуклеотидов в конкретных положениях и согласованности таких замен. Нетривиальный результат: ранее для этого ученые не одно десятилетие скрупулезно изучали геном T7 с помощью доступных тогда методов. И теперь мы знаем, что высокопроизводительный, основанный на NGS подход — хороший способ разобраться в устройстве других промоторов и вообще вовлеченных в регуляцию областей ДНК. В том числе в новых, не исследованных геномах, которые нам поставляют бесчисленные секвенаторы.
Читайте также: