首页 > 业界 > 关键词  > 基因组最新资讯  > 正文

科学家们公布完整的人类基因组序列 并揭示了新的遗传秘密

2022-04-04 10:40 · 稿源: cnbeta

当科学家们在2003年宣布人类基因组的完整序列时,实际上当时仍有大约8%尚未被完全破译。这主要是因为它由高度重复的DNA片段组成,很难与其他部分啮合。但是,一个为期三年的联盟终于填补了剩余的DNA研究空白,为科学家和医生提供了第一个完整的、无间隙的基因组序列供参考。

新完成的基因组被称为T2T-CHM13,代表了目前参考基因组的一个重大升级,该基因组被医生用来寻找与疾病有关的突变,以及被研究人类遗传变异进化的科学家使用。

除其他事项外,新的DNA序列揭示了关于着丝粒(centromere)周围区域的前所未有的细节,着丝粒是细胞分裂时染色体被抓取和拉开的地方,确保每个“子”细胞继承正确的染色体数量。这个区域内的变异性也可能为我们的人类祖先如何在非洲进化提供新的证据。

加利福尼亚大学伯克利分校的博士后研究员Nicolas Altemose说:“揭示这些以前缺失的基因组区域的完整序列告诉我们很多关于它们是如何组织起来的,这对于许多染色体来说是完全未知的。”他是四篇关于已完成基因组的新论文的共同作者。“以前,我们只是对那里的情况有最模糊的了解,而现在它已经清晰到了单碱基对的分辨率。”

Altemose是一篇描述着丝粒周围碱基对序列的论文的第一作者。一篇解释如何进行测序的论文出现在4月1日的《科学》杂志印刷版上,而Altemose的着丝粒论文和其他四篇描述新序列告诉我们什么的论文在该杂志上进行了总结,论文全文发布在网上。四篇配套论文,包括Altemose是共同第一作者的一篇,也于4月1日在《自然方法》杂志上在线发表。

测序和分析是由一个由100多人组成的团队完成的,即所谓的“端粒到端粒”联盟(T2T),以覆盖所有染色体末端的端粒命名。该联盟的所有22条常染色体和X性染色体的无间隙版本由30.55亿个碱基对组成,这些碱基对是构建染色体和我们的基因的单位,还有19969个蛋白质编码基因。在蛋白质编码基因中,T2T团队发现了大约2000个新的基因,其中大部分是禁用的,但其中115个可能仍在表达。他们还在人类基因组中发现了大约200万个额外的变体,其中622个发生在医学相关的基因中。

“将来,当某人的基因组被测序时,我们将能够识别他们DNA中的所有变体,并利用这些信息更好地指导他们的医疗保健,”T2T的领导人之一、美国国立卫生研究院国家人类基因组研究所(NHGRI)的高级调查员Adam Phillippy说。“真正完成人类基因组序列就像戴上了一副新眼镜。现在我们可以清楚地看到一切,我们离理解这一切意味着什么又近了一步。”

不断演变的着丝粒

着丝粒内和周围的新DNA序列共占整个基因组的6.2%,即近1.9亿个碱基对,或核苷酸。在剩下的新增加的序列中,大部分被发现在每条染色体末端的端粒周围和核糖体基因周围的区域。整个基因组仅由四种类型的核苷酸组成,这些核苷酸以三组为单位,对用于构建蛋白质的氨基酸进行编码。Altemose的主要研究涉及寻找和探索染色体上蛋白质与DNA相互作用的区域。

Layers-of-Relic-Centromeres.jpg

Altemose说:“没有蛋白质,DNA就什么都不是。”在获得牛津大学统计学博士学位后,他于2021年在加州大学伯克利分校和旧金山分校联合获得了生物工程博士学位。“DNA是一组指令,如果它周围没有蛋白质来组织它,调节它,在它受损时修复它,并复制它,就没有人可以读懂它。蛋白质与DNA的相互作用确实是基因组调控的所有行动发生的地方,能够绘制出某些蛋白质与基因组结合的位置,对于理解它们的功能真的很重要。”

在T2T联盟对缺失的DNA进行测序后,Altemose和他的团队使用新技术找到了着丝粒内的位置,在那里,一个被称为"动粒"的大蛋白复合物牢固地抓住了染色体,以便细胞核内的其他机器能够将染色体对拉开。

他说:“当这出错时,你最终会出现染色体错误分离的情况,而这将导致各种问题。如果这发生在减数分裂中,这意味着你可能出现染色体异常,导致自发流产或先天性疾病。如果它发生在体细胞中,你可能最终患上癌症--基本上,有大量错误调节的细胞。”

他们在着丝粒内和周围发现的是新的序列层叠在旧的序列层上,就像通过进化,新的着丝粒区域被反复铺设以结合到动粒上。旧区域的特点是有更多的随机突变和缺失,表明它们不再被细胞使用。较新的与动粒结合的序列变化较少,而且甲基化程度也较低。甲基化的增加是一个表观遗传标签,倾向于使基因沉默。

着丝粒内和周围的所有层都是由重复长度的DNA组成的,基于一个大约171个碱基对长的单位,这大约是包裹着一组蛋白质形成核糖体的DNA的长度,保持DNA的包装和紧凑。这些171个碱基对的单位形成了更大的重复结构,被串联重复多次,在着丝粒周围建立了一个大的重复序列区域。

T2T团队只关注一个人类基因组,该基因组是从一个被称为葡萄胎的非癌症肿瘤中获得的,它本质上是一个拒绝母体DNA而复制其父体DNA的人类胚胎。这样的胚胎会死亡并转化为肿瘤。但是这个痣有两个相同的父系DNA副本--都带有父亲的X染色体,而不是来自母亲和父亲的不同DNA--这一事实使它更容易测序。

Altemose说,研究人员本周还发布了一个来自不同来源的Y染色体的完整序列,该序列花费的时间几乎与基因组的其他部分加起来一样长。对这个新的Y染色体序列的分析将出现在未来的出版物中。

3.png

Altemose和他的团队,包括加州大学伯克利分校的项目科学家Sasha Langley,还用新的参考基因组作为支架,比较了来自世界各地的1600个个体的中心粒DNA,揭示了着丝粒周围重复DNA的序列和拷贝数的重大差异。以前的研究表明,当古人类群体从非洲迁移到世界其他地方时,他们只带走了一小部分基因变体的样本。Altemose和他的团队证实,这种模式延伸到了着丝粒。

Altemose说:“我们所发现的是,在非洲大陆以外的具有近期血统的个体中,他们的着丝粒,至少在X染色体上,往往分为两个大的集群,而大多数有趣的变异是在具有近期非洲血统的个体中。鉴于我们对基因组其他部分的了解,这并不完全是一个惊喜。但它所表明的是,如果我们想看看这些着丝粒区域的有趣变异,我们确实需要集中精力对更多的非洲基因组进行测序,并进行完整的端粒到端粒的序列组装。”

他指出,着丝粒周围的DNA序列也可以用来追踪人类的血统,追溯到我们共同的猿人祖先。

Altemose说:“当你远离活跃的着丝粒部位时,你会得到越来越多的退化序列,以至于如果你走到这个重复序列‘海洋的最远海岸’,你开始看到古老的着丝粒,也许,我们的灵长类祖先的着丝粒曾经与动粒结合。这几乎就像化石的层次。”

长读测序“改变了游戏规则”

T2T的成功归功于一次对长DNA片段进行测序的改进技术,这有助于确定高度重复的DNA片段的顺序。其中有PacBio的HiFi测序技术,它可以高精度地读取长度超过20,000个碱基对的数据。另一方面, Oxford Nanopore技术有限公司开发的技术可以读取多达几百万个碱基对的序列,尽管保真度较低。作为比较,Illumina公司的所谓下一代测序技术仅限于数百个碱基对。

4.jpg

Altemose说:“这些新的长读DNA测序技术真是令人难以置信;它们是这样的游戏改变者,不仅对于这个重复的DNA世界,而且因为它们允许你对单个长的DNA分子进行测序。你可以开始在一个分辨率水平上提出问题,这在以前是不可能的,即使是短读测序方法也不可能。”

Altemose计划进一步探索着丝粒区域,使用他和斯坦福大学的同事开发的一种改进技术来确定染色体上被蛋白质结合的位置,类似于动粒与着丝粒结合的方式。这项技术也使用了长读测序技术。他和他的小组在本周发表在《自然方法》杂志上的一篇论文中描述了这种技术,称为定向甲基化与长读测序(DiMeLo-seq)。

同时,T2T联盟正在与人类泛基因组参考联盟合作,致力于建立一个代表全人类的参考基因组。

Altemose说:“我们应该有一个代表每个人的参考,而不是仅仅从一个人类个体或一个葡萄胎(甚至不是真正的人类个体)获得一个参考。关于如何实现这一目标,有各种想法。但是我们首先需要的是掌握这种变异是什么样子的,我们需要大量高质量的个体基因组序列来完成这个任务。”

他在着丝粒区域的工作,他称之为"一个激情项目",是由博士后奖学金资助的。T2T项目的负责人是加州大学圣克鲁兹分校的Karen Miga、华盛顿大学的Evan Eichler和NHGRI的Adam Phillippy,后者提供了大部分的资金。加州大学伯克利分校着丝粒论文的其他合著者是生物工程副教授Aaron Streets;分子和细胞生物学教授Abby Dernburg和Gary Karpen;项目科学家Sasha Langley;以及前博士后研究员Gina Caldas。

举报

  • 相关推荐
  • 大家在看
  • SEOPulser:自动生成SEO优化文章,提升网站流量。

    SEOPulser是一个AI驱动的SEO文章生成平台,专注于通过自动化技术帮助用户快速生成大量SEO优化的文章。它通过机器学习算法优化文章内容,以提高搜索引擎的可见性和排名。产品提供了全自动化的内容生成、优化和发布服务,支持与WordPress、Shopify等平台的无缝集成。SEOPulser还提供了灵活的定价方案,满足不同规模企业的需求。

  • Trupeer:AI驱动的产品视频和文档制作工具

    Trupeer是一个利用人工智能技术,将简单的屏幕录制转换成专业视频和详细指南的平台。它通过自动化编辑和AI配音,大幅降低了制作高质量产品视频和文档的难度和成本。Trupeer的主要优点包括快速生成内容、用户友好的操作界面、以及无需专业视频编辑或技术写作经验即可使用。产品定位于帮助产品营销人员、产品经理、支持团队、技术作者、内容创作者、设计师和L&D团队高效创建产品内容。

  • Indigo AI:AI助手,提升工作效率

    Indigo AI是一个旨在通过AI技术提高工作效率的桌面和网络应用程序套件。它允许用户保存提示并在任何应用程序中运行它们,从而简化工作流程并提高生产力。该产品背景信息显示,它致力于成为用户工作中的AI伙伴,通过智能化的辅助功能,帮助用户更高效地完成任务。

  • Rakun Sensory Sanctuary Quiz:发现符合您氛围的旅行目的地

    Rakun Sensory Sanctuary Quiz 是一个在线趣味测试,旨在通过一系列问题帮助用户发现与他们个人氛围相匹配的旅行目的地。该测试利用用户对不同感官体验的偏好,如视觉、听觉和触觉,来推荐最适合他们的旅行地点。这种个性化的推荐方式不仅增加了旅行规划的乐趣,还有助于用户发现新的地方,从而丰富他们的旅行体验。

  • Insight Pipeline:自动化客户研究,获取深入洞察

    Insight Pipeline是一个专注于客户研究的自动化平台,旨在帮助企业通过定期与客户进行对话来收集和分析客户反馈。该平台通过自动化安排每周的客户对话,使企业能够更好地理解产品、市场和竞争对手。Insight Pipeline的主要优点包括定制化调研、与用户日程相匹配的灵活安排、以及能够根据用户资料和应用内活动进行用户细分。此外,它还提供了多种联系方式,如Google Meet、电话和WhatsApp,以及页面和用户细分功能,以确保研究目标的精确性。

  • Qihoo-T2X:,一款针对文本到任意任务的高效扩散变换器模型。

    Qihoo-T2X是由360CVGroup开发的一个开源项目,它代表了一种创新的文本到任意任务(Text-to-Any)的扩散变换器(DiT)架构范式。该项目旨在通过代理令牌技术,提高文本到任意任务的处理效率。Qihoo-T2X项目是一个正在进行中的项目,其团队承诺将持续优化和增强其功能。

  • 这个男人能嫁吗:AI分析虚拟人物,预测婚姻适配度

    这个男人能嫁吗是一个基于人工智能技术的网站,通过分析虚拟人物的特性,为用户提供婚姻适配度的预测。它利用先进的算法和大数据分析,为用户提供娱乐性的参考。产品以轻松诙谐的方式呈现,适合寻求娱乐和轻松互动的用户。

  • SuperPrompt:旨在帮助我们理解AI代理的工程化提示项目。

    SuperPrompt是一个开源项目,旨在通过精心设计的提示来帮助我们更好地理解人工智能代理。该项目由多个阶段组成,目前仍处于永远的测试阶段。它不仅适用于Claude这样的大型语言模型,也适用于其他类似的模型。项目在移动设备上创建,预期将不断改进。SuperPrompt通过一系列复杂的逻辑和数学结构,旨在探索和扩展AI的认知边界,推动AI技术的发展。

  • rStar:通过自博弈相互推理,提升小型语言模型的解决问题能力。

    rStar是一个自我博弈相互推理方法,它通过将推理过程分解为解决方案生成和相互验证,显著提升了小型语言模型(SLMs)的推理能力,无需微调或使用更高级的模型。rStar通过蒙特卡洛树搜索(MCTS)和人类推理动作的结合,构建更高质量的推理轨迹,并通过另一个类似能力的SLM作为鉴别器来验证这些轨迹的正确性。这种方法在多个SLMs上进行了广泛的实验,证明了其在解决多样化推理问题方面的有效性。

  • WechatFerry:微信机器人框架,可定制、强大、快速、开源。

    WechatFerry是一个微信机器人框架,旨在为用户提供一站式的微信操作解决方案。它通过集成WCF SDK客户端,支持消息监听、消息发送及群聊操作等功能。同时,它还提供了Agent库,帮助用户轻松实现历史消息处理、数据库操作和复杂业务逻辑。此外,WechatFerry还提供了与Wechaty兼容的免费PC Hook协议,以及Nuxt框架的集成工具包,使得开发者可以快速构建和调试微信机器人应用。

  • Concept Sliders:用于精确控制扩散模型中概念的低秩适配器

    Concept Sliders 是一种用于精确控制扩散模型中概念的技术,它通过低秩适配器(LoRA)在预训练模型之上进行应用,允许艺术家和用户通过简单的文本描述或图像对来训练控制特定属性的方向。这种技术的主要优点是能够在不改变图像整体结构的情况下,对生成的图像进行细微调整,如眼睛大小、光线等,从而实现更精细的控制。它为艺术家提供了一种新的创作表达方式,同时解决了生成模糊或扭曲图像的问题。

  • AI Blaze:快速AI写作与编辑,提升生产力。

    AI Blaze是一款利用人工智能技术提供快速写作和编辑服务的产品。它通过动态提示,让用户能够即时在任何网页的文本框中触发GPT-4,以实现快速响应电子邮件、重写文本和纠正拼写等功能。产品的主要优点包括响应速度快、使用便捷、支持团队协作,并且可以自定义提示,以适应不同的写作需求。AI Blaze旨在提高用户的工作效率,通过智能化的文本处理,让用户能够更专注于内容创作本身。

  • 开拍:AI视频剪辑工具,提升视频质量,增强创作体验。

    开拍是一款利用人工智能技术提供视频剪辑服务的在线平台,通过AI算法优化视频画质、消除水印、自动生成字幕等,旨在帮助用户提升视频制作效率和质量。产品背景信息显示,开拍致力于解决视频创作过程中的常见问题,如画质不清晰、水印去除困难、字幕添加繁琐等,通过技术手段简化视频编辑流程,让视频创作更便捷、高效。

  • 即刻动态开盒Bot:分析即刻动态,了解朋友的趣味成分。

    即刻动态开盒Bot是一个在线工具,通过分析用户上传的即刻动态截图,揭示用户的兴趣爱好和社交行为。它利用人工智能技术,对图片中的文字和图像进行分析,从而得出用户的个性标签。这个工具不仅增加了社交媒体互动的趣味性,也帮助用户更深入地了解自己和他人。

  • 你和狗的区别:探索你和狗的相似与不同,发现更多趣味互动。

    这是一个提供趣味互动和娱乐内容的网站,通过轻松幽默的方式让用户探索与狗的相似之处,同时提供其他多种娱乐功能,如星座运势、歌词接龙等,旨在为用户带来轻松愉快的体验。

  • FineChatBI:AI驱动的对话式业务分析工具

    FineChatBI是帆软推出的一款AI驱动的对话式业务分析工具,它利用Text2DSL技术将用户的自然语言问题转化为可理解、可干预的指令,从而提供可控、结果可信、分析闭环、交互友好的业务分析体验。该产品基于企业级BI能力底座,结合AI技术,大幅降低业务分析门槛,提升企业决策效率。

  • Pony Diffusion:多功能文本到图像扩散模型,生成高质量非真实感图像。

    Pony Diffusion V6 XL是一个文本到图像的扩散模型,专门设计用于生成以小马为主题的高质量艺术作品。它在大约80,000张小马图像的数据集上进行了微调,确保生成的图像既相关又美观。该模型采用用户友好的界面,易于使用,并通过CLIP进行美学排名,以提升图像质量。Pony Diffusion在CreativeML OpenRAIL许可证下提供,允许用户自由使用、再分发和修改模型。

  • TarotCard.Art:AI算法融合古老智慧,生成个性化塔罗牌。

    TarotCard.Art——AI个性化塔罗牌生成器是一款结合了古老塔罗智慧与现代AI技术的在线工具,旨在为用户提供个性化的塔罗牌解读体验。用户可以通过输入问题或描述,利用AI算法生成独特的塔罗牌,并获得相应的解读。该产品不仅为塔罗爱好者提供了一种新颖的体验方式,也为寻求指导和灵感的用户提供了一个有趣的平台。

  • AI Describe Pictures:AI技术快速生成图片描述

    AI Describe Pictures是一个利用人工智能大模型构建的平台,能够快速为图片生成详细或简要的描述。它通过AI技术,不仅能够描述图片中的场景和人物,还可以根据用户的需求提供定制化的描述方式。该产品通过AI技术的应用,极大地提高了图片描述的效率和准确性,对于视觉障碍人士、内容创作者和需要图片描述的各类场景都具有重要的意义。

  • AI回复生成器:AI辅助,快速生成个性化回复。

    AI回复生成器是一款革命性的沟通工具,旨在帮助用户创建个性化、符合上下文的回复。无论是撰写电子邮件、回应客户咨询还是生成内容,我们的AI系统确保您的信息清晰、简洁且针对您的受众量身定制。

今日大家都在搜的词: