您当前浏览器版本过低,为了不影响您的使用,建议您使用最新的谷歌浏览器、火狐浏览器、 360浏览器,更换浏览器后使用更流畅!(注意!双核浏览器请切换为极速模式)
400-607-9388

顶刊再+1!看浙大“女娲”AI模型

2025-07-10
7258

艾思科蓝官网-版头.gif


iNature

基因组由DNA组成,它不仅包含蛋白质的编码序列,还包含大量不编码蛋白质调控序列。

2025年7月8日,浙江大学郭国骥、韩晓平共同通讯在Cell在线发表题为“Modeling the vertebrate regulatory sequence landscape by UUATAC-seq and deep learning”的研究论文,该研究开发了一种使用测序(UUATAC-seq)协议对转座酶可及染色质进行超通量、超灵敏的单核分析,该协议能够在1天的实验中为一个物种构建染色质可及性景观。

使用UUATAC-seq,绘制了五种代表性脊椎动物的候选顺式调控元件(cCRE)图谱。分析表明,不同物种的基因组大小差异会影响cCRE的数量,但不会影响其大小。研究人员引入了Nvwa顺式调控元件(NvwaCE,“女娲”),这是一个大型任务深度学习模型,旨在解释顺式调控语法,并直接从基因组序列中高精度地预测cCRE景观。NvwaCE证明了调控语法比核苷酸序列更保守,并且这种语法将cCRE组织成不同的功能模块。此外,NvwaCE准确预测了合成突变对谱系特异性cCRE功能的影响,与因果数量性状位点(QTL)和基因组编辑结果一致。总之,该研究为解码脊椎动物的调节语言提供了宝贵的资源。


640 (31).png

多细胞生物中的不同细胞类型共享相同的基因组,但由于基因表达的差异调节,表现出高度专业化的功能特征。调节序列通过以细胞类型特异性的方式募集序列特异性转录因子(TF)来决定基因表达模式。染色质可及性是调节DNA的通用标记,可通过DNase I超敏感性测序(DNase-seq)和使用测序的转座酶可及染色质分析(ATAC-seq)进行测量。已经有几次大规模的努力使用这些分析来绘制哺乳动物的全基因组调节序列。

单细胞技术的进步极大地增强了研究复杂生物系统中基因调控的能力。基于液滴、微孔或分流池策略的高通量单细胞测序方法,能够大规模并行分析单个细胞,而不会对细胞群体或标记列表进行有偏见的选择。这些技术革命为生物学中基因组、转录组和蛋白质组信息的系统测量设定了新的标准。生物规模细胞图谱的最新进展为细胞谱系规格和遗传调控提供了前所未有的见解。虽然转录组图谱侧重于谱系特异性基因表达,但单细胞染色质可及性图谱可以捕捉控制每种细胞类型转录的染色质调控景观。然而,目前的细胞图谱技术有多种局限性:难以平衡通量和灵敏度,DNA片段或转录物的缺失,以及使数据整合复杂化的批量效应。


640 (32).png
机理模式图(图源自Cell)

直接从DNA序列预测调节和表达信号的深度学习模型的应用是现代基因组领域的一个里程碑。最近,深度学习模型已被用于预测单细胞水平的染色质可及性和基因表达。虽然NVWA以单细胞分辨率实现了细胞类型特异性基因表达的图谱规模预测,Huatuo有助于在几乎所有细胞类型中解码单核苷酸水平的疾病相关调控序列。大多数当前的细胞图谱数据在灵敏度或通量方面都有局限性,从而阻碍了高精度预测模型的生成。基因组领域深度学习模型的优化仍然是一个持续的挑战,而蛋白质结构预测模型已经取得了显著的成功。

在这项研究中,研究人员通过使用同源衔接子转座酶和温控衔接子转换,显著提高了ATAC分析的灵敏度和通量。此外,还引入了一种高通量、超灵敏的单核ATAC序列(UUATAC-seq)方案来绘制斑马鱼、蝾螈、壁虎、鸡和小鼠的高分辨率染色质图谱,其基因组大小跨越了脊椎动物亚门,这使得能够研究不同物种和谱系中脊椎动物候选顺式调控元件(cCREs)的共同模式。最后,建立了一个巨型任务深度学习模型,Nvwa顺式调控元件(NvwaCE),它可以准确预测染色质可及性景观,推断进化效应,并直接从任何给定的脊椎动物基因组序列中评估合成突变。总的来说,该研究开发了能够高效构建染色质可及性图谱的UUATAC-seq技术,以及用于脊椎动物染色质图谱预测的基因组 AI 模型—女娲CE(NvwaCE),这些成果为进一步破译脊椎动物基因组的调控语言提供了宝贵资源。

论文并列一作包括22级博士生吴涵语、20级博士生王雪怡、21级博士生刘代媛、21级博士生傅雨婷、20级博士生杨蕾、博士后汪仁英、博士后张霈婧、22级博士生马立枫。该研究获得了国家自然科学基金重点项目与浙江省尖兵领雁项目的支持。


参考信息:
https://www.cell.com/cell/fulltext/S0092-8674(25)00686-5

艾思科蓝官网-版尾.jpg

已收藏 0
点赞 3

学术会议

第七届土木建筑及灾害防控国际学术会议(CADPC 2026)
第七届土木建筑及灾害防控国际学术会议(CADPC 2026)将于2026年1月30日-2月1日在中国·大理举办。会议将以“建筑技术”、“灾害预测”、“灾害防控”、“灾后重建”等主题展开学术研讨。
2026-01-30
【北京师范大学主办|连续2年快速EI检索】第三届信息化教育与计算机技术国际学术会议(IECA 2026)
第三届信息化教育与计算机技术国际学术会议(IECA 2026)将于2026年01月17-18日在中国-上海召开。近年来,信息和教育技术领域取得了前所未有的进步,在知识的传播和消费方式方面发挥了变革作用
2026-01-16
【连续四年EI检索|马来亚大学主办|ACM出版】第五届大数据、信息与计算机网络国际学术会议(BDICN 2026)
第五届大数据、信息与计算机网络国际学术会议(BDICN 2026)定于2026年1月9-11日在马来西亚吉隆坡举行。会议旨在为从事相关研究的专家学者提供加强学术研究和探讨的平台。
2026-01-09
【往届会后3个月EI检索丨三百余人齐聚遥感与测绘学术盛会】第五届遥感与测绘国际学术会议(RSSM 2026)
第五届遥感与测绘国际学术会议(RSSM 2026)将于2026年1月16-18日在中国重庆召开,会议往届论文集均已完成EI检索,EI检索稳定。会议由重庆交通大学主办
2026-01-16
【SPIE出版|往届会后3个月检索】第五届电子信息工程与数据处理国际学术会议(EIEDP 2026)
第五届电子信息工程与数据处理国际学术会议(EIEDP 2026)将于2026年1月23-25日在中国成都召开,会议聚焦于电子信息工程与数据处理,邀请了海内外知名专家出席报告,与海内外高校学者交流
2026-01-23
【IEEE出版|安徽大学主办】第六届神经网络、信息与通信工程国际学术会议(NNICE 2026)
第六届神经网络、信息与通信工程国际学术会议(NNICE 2026)将于2026年1月23-125日在中国合肥举行。安徽大学主办,特邀IEEE Fellow重量级嘉宾,IEEE多年稳定检索。
2026-01-23
相关资讯

7所高校,齐发Nature!

近日,上海交通大学、北京师范大学、电子科技大学、成都大学、南方科技大学、北京大学、中国科学院大学在Nature发文!

49614

39

2023-03-03

5所“双一流”,齐发Nature!

近日,山西大学、浙江大学、清华大学、复旦大学、北京大学的研究成果发表于Nature。

48960

20

2023-02-27

颠覆性超材料,登上Science!

颠覆性超材料,登上Science!

3815

3

2025-12-17

中国人民大学博士毕业生发《经济研究》!

中国人民大学博士毕业生发《经济研究》!

3730

3

2025-12-17

一作!同济大学青年教师发UTD 24!

一作!同济大学青年教师发UTD 24!

3352

3

2025-12-17

两位院士领衔,华东师范大学,Nature Photonics!

两位院士领衔,华东师范大学,Nature Photonics!

3983

3

2025-12-17