项新研究表明
在单细胞真菌酵母中,“随机 ”是自 美国数据中的电话号码列表 然活跃的,而在哺乳动物细胞中,这种DNA在自然状态下处于关闭状态,尽管它们在十亿年前拥有共同的祖先和相同的基本分子机制。
这项新发现围绕着 DNA 遗传指令首先转化为相关物质RNA,然后转化为构成人体结构和信号的蛋白质的过程展开。在酵母、小鼠和人类中,基因表达的第一步,即转录,是在 DNA 分子“字母”(核碱基)以一个方向读取时进行的。虽然 80% 的人类基因组(即我们细胞中的完整 DNA 集)被主动解码为 RNA,但实际上只有不到 2% 编码了指导蛋白质构建的基因。
那么,基因组学中一个长期未解之谜就是,所有这些与基因无关的转录到底起什么作用。它们只是噪音、进化的副作用,还是真的有作用?
纽约大学朗格尼健康中心的一个研究小组试图通过创建一个大的合成基因来回答这个问题,该基因的 DNA 代码与其天然亲本的顺序相反。然后他们将合成基因放入酵母和小鼠干细胞中,并观察每个细胞中的转录水平。发表在《自然》杂志上的这项新研究表明,酵母的遗传系统设置为几乎所有基因都会不断转录,而哺乳动物细胞中的相同“默认状态”是转录关闭。
方法论和发现
有趣的是,研究作者表示,代码的反向 在典型的保留中,由于有固定的工作范围 味着范围的改变和/或价格的上涨 顺序意味着酵母和哺乳动物细胞中进化出的所有开启或关闭转录的机制都不存在,因为反向代码是无意义的。然而,就像镜像一样,反向代码反映了自然代码中看到的一些基本模式,包括 DNA 字母出现的频率、它们落在什么附近以及它们重复的频率。由于反向代码长度为 100,000 个分子字母,研究小组发现它随机包含了许多以前未知的代码的小片段,这些代码可能在酵母中更频繁地启动转录,并在哺乳动物细胞中停止转录。
认转录差异将有助于我们更好地了解遗传密码的哪些部分具有功能,哪些部分是进化的偶然,”通讯作者 Jef Boeke 博士说,他是纽约大学朗格尼医学中心系统遗传学研究所的 Sol 和 Judith Bergstein 主任。“这反过来有望指导酵母工程制造新药,或创造新的基因疗法,甚至帮助我们找到埋藏在大量密码中的新基因。”
这项研究为以下理论提供了有力证据:酵母的转录状态非常活跃,因此外来 DNA(例如,在酵母自我复制时,病毒很少将外来 DNA 注入酵母)很可能会转录成 RNA。如果该 RNA 构建出一种具有有用功能的蛋白质,那么该代码将作为新基因在进化过程中保留下来。与酵母这种单细胞生物不同,酵母可以产生推动更快进化的危险新基因,而哺乳动物细胞作为具有数百万个协作细胞的生物体的一部分,在每次遇到病毒时,它们都无法自由地整合新 DNA。许多调节机制保护着微妙平衡的代码。
大 DNA
这项新研究必须考虑 DNA 链的大小,人类基因 买房b 组包含 30 亿个“字母”,一些基因长达 200 万个字母。虽然著名的技术可以逐个字母地进行更改,但如果研究人员从头开始构建 DNA,将大量预先组装的代码进行广泛更改,将其替换到细胞中以取代其天然对应部分,那么一些工程任务会更有效率。由于人类基因非常复杂,Boeke 的实验室首先在酵母中开发了“基因组编写”方法,但最近又将其应用于哺乳动物的遗传密码。研究人员使用酵母细胞在一个步骤中组装长 DNA 序列,然后将其导入小鼠胚胎干细胞。
在目前的研究中,研究小组通过引入一段合成的 101 千碱基的工程 DNA(人类基因次黄嘌呤磷酸核糖转移酶 1 (HPRT1),以反向编码顺序)来解决转录在进化过程中的普遍性问题。他们观察到,尽管缺乏启动子的无意义代码(DNA 片段进化为发出转录开始的信号),但该基因在酵母中仍然具有广泛的活性。
此外,研究小组还在反向密码中发现了小序列,即腺苷和胸腺嘧啶结构单元的重复序列,这些序列已知可被转录因子识别,转录因子是与 DNA 结合以启动转录的蛋白质。作者表示,这些序列只有 5 到 15 个字母长,很容易随机出现,可能部分解释了酵母非常活跃的默认状态。
相反,插入小鼠胚胎干细胞基因组的相同反向密码不会引起广泛的转录。在这种情况下,即使已知可以主动关闭(沉默)基因的进化 CpG 二核苷酸在反向密码中不起作用,转录也会受到抑制。该团队推测,哺乳动物基因组中的其他基本元素可能比酵母更能限制转录,并且可能通过直接招募已知可以沉默基因的蛋白质组(多梳复合物)来限制转录。
“我们越接近将‘基因组价值’的无义 DNA 引入活细胞,它们就越能将其与实际进化的基因组进行比较,”第一作者、Boeke 实验室的研究生 Brendan Camellato 说道。“这可能会引领我们进入工程化细胞疗法的新领域,因为能够插入更长的合成 DNA 可以让我们更好地了解基因组可以容忍什么插入,并且可能包含一个或多个更大、更完整的工程化基因。”