您当前浏览器版本过低,为了不影响您的使用,建议您使用最新的谷歌浏览器、火狐浏览器、 360浏览器,更换浏览器后使用更流畅!(注意!双核浏览器请切换为极速模式)
400-607-9388

顶刊再+1!看浙大“女娲”AI模型

2025-07-10
4847

艾思科蓝官网-版头.gif


iNature

基因组由DNA组成,它不仅包含蛋白质的编码序列,还包含大量不编码蛋白质调控序列。

2025年7月8日,浙江大学郭国骥、韩晓平共同通讯在Cell在线发表题为“Modeling the vertebrate regulatory sequence landscape by UUATAC-seq and deep learning”的研究论文,该研究开发了一种使用测序(UUATAC-seq)协议对转座酶可及染色质进行超通量、超灵敏的单核分析,该协议能够在1天的实验中为一个物种构建染色质可及性景观。

使用UUATAC-seq,绘制了五种代表性脊椎动物的候选顺式调控元件(cCRE)图谱。分析表明,不同物种的基因组大小差异会影响cCRE的数量,但不会影响其大小。研究人员引入了Nvwa顺式调控元件(NvwaCE,“女娲”),这是一个大型任务深度学习模型,旨在解释顺式调控语法,并直接从基因组序列中高精度地预测cCRE景观。NvwaCE证明了调控语法比核苷酸序列更保守,并且这种语法将cCRE组织成不同的功能模块。此外,NvwaCE准确预测了合成突变对谱系特异性cCRE功能的影响,与因果数量性状位点(QTL)和基因组编辑结果一致。总之,该研究为解码脊椎动物的调节语言提供了宝贵的资源。


640 (31).png

多细胞生物中的不同细胞类型共享相同的基因组,但由于基因表达的差异调节,表现出高度专业化的功能特征。调节序列通过以细胞类型特异性的方式募集序列特异性转录因子(TF)来决定基因表达模式。染色质可及性是调节DNA的通用标记,可通过DNase I超敏感性测序(DNase-seq)和使用测序的转座酶可及染色质分析(ATAC-seq)进行测量。已经有几次大规模的努力使用这些分析来绘制哺乳动物的全基因组调节序列。

单细胞技术的进步极大地增强了研究复杂生物系统中基因调控的能力。基于液滴、微孔或分流池策略的高通量单细胞测序方法,能够大规模并行分析单个细胞,而不会对细胞群体或标记列表进行有偏见的选择。这些技术革命为生物学中基因组、转录组和蛋白质组信息的系统测量设定了新的标准。生物规模细胞图谱的最新进展为细胞谱系规格和遗传调控提供了前所未有的见解。虽然转录组图谱侧重于谱系特异性基因表达,但单细胞染色质可及性图谱可以捕捉控制每种细胞类型转录的染色质调控景观。然而,目前的细胞图谱技术有多种局限性:难以平衡通量和灵敏度,DNA片段或转录物的缺失,以及使数据整合复杂化的批量效应。


640 (32).png
机理模式图(图源自Cell)

直接从DNA序列预测调节和表达信号的深度学习模型的应用是现代基因组领域的一个里程碑。最近,深度学习模型已被用于预测单细胞水平的染色质可及性和基因表达。虽然NVWA以单细胞分辨率实现了细胞类型特异性基因表达的图谱规模预测,Huatuo有助于在几乎所有细胞类型中解码单核苷酸水平的疾病相关调控序列。大多数当前的细胞图谱数据在灵敏度或通量方面都有局限性,从而阻碍了高精度预测模型的生成。基因组领域深度学习模型的优化仍然是一个持续的挑战,而蛋白质结构预测模型已经取得了显著的成功。

在这项研究中,研究人员通过使用同源衔接子转座酶和温控衔接子转换,显著提高了ATAC分析的灵敏度和通量。此外,还引入了一种高通量、超灵敏的单核ATAC序列(UUATAC-seq)方案来绘制斑马鱼、蝾螈、壁虎、鸡和小鼠的高分辨率染色质图谱,其基因组大小跨越了脊椎动物亚门,这使得能够研究不同物种和谱系中脊椎动物候选顺式调控元件(cCREs)的共同模式。最后,建立了一个巨型任务深度学习模型,Nvwa顺式调控元件(NvwaCE),它可以准确预测染色质可及性景观,推断进化效应,并直接从任何给定的脊椎动物基因组序列中评估合成突变。总的来说,该研究开发了能够高效构建染色质可及性图谱的UUATAC-seq技术,以及用于脊椎动物染色质图谱预测的基因组 AI 模型—女娲CE(NvwaCE),这些成果为进一步破译脊椎动物基因组的调控语言提供了宝贵资源。

论文并列一作包括22级博士生吴涵语、20级博士生王雪怡、21级博士生刘代媛、21级博士生傅雨婷、20级博士生杨蕾、博士后汪仁英、博士后张霈婧、22级博士生马立枫。该研究获得了国家自然科学基金重点项目与浙江省尖兵领雁项目的支持。


参考信息:
https://www.cell.com/cell/fulltext/S0092-8674(25)00686-5

艾思科蓝官网-版尾.jpg

已收藏 0
点赞 3

学术会议

【IEEE出版 | 兰州大学校内举办】第19届复合医学工程国际会议(CME 2025)
第19届复合医学工程国际会议(CME 2025)将于2025年8月1日至3日在中国甘肃省兰州市举行,会议由国际复合医学工程学会(ICME)主办, 兰州大学承办。
2025-08-01
【高层次|国际化|连续11届EI检索】第十二届行为与社会计算国际会议(BESC 2025)
行为与社会计算国际会议(BESC)是一个重要的国际论坛,旨在汇聚来自人工智能、计算社会科学、自然语言处理、商业与市场,以及行为与心理科学等领域的学术研究人员和行业实践者,共同展示最新的研究成果。
2025-10-16
【院士报告,JPCS独立出版,EI检索】2025年先进材料与结构力学国际学术会议(ICAMSM 2025)
2025年先进材料与结构力学国际学术会议(ICAMSM 2025)2025年先进材料与结构力学国际学术会议(ICAMSM 2025)将于2025年7月25日至27日在中国沈阳举行。
2025-07-25
【IEEE出版|EI稳定检索|往届快至会后3.5个月检索】第五届计算机科学与区块链国际学术会议(CCSB 2025)
第五届计算机科学与区块链国际学术会议(CCSB 2025)将于2025年8月1日至3日在中国深圳市召开,会议旨在为计算机科学与区块链相关领域的专家、学者提供一个交流思想、促进合作的平台。
2025-08-01
【IEEE出版 | 往届提交后两个月检索】第四届半导体与电子技术国际研讨会(ISSET 2025)
2025年第四届半导体与电子技术国际研讨会(ISSET 2025)将于2025年7月25日-27日在中国西安举行。ISSET 2025将围绕“半导体”与“电子技术”等相关最新研究领域展开。
2025-07-24
【七专题会场|高层次专家报告|稳定检索】第二届可持续发展与能源资源国际学术会议(SDER 2025)
第二届可持续发展与能源资源国际学术会议(SDER 2025)将于2025年8月1-3日在中国深圳隆重举行。大会诚邀国内外高校、科研机构专家、学者,企业界人士及其他相关人员投稿与参会交流。
2025-08-01
相关资讯

7所高校,齐发Nature!

近日,上海交通大学、北京师范大学、电子科技大学、成都大学、南方科技大学、北京大学、中国科学院大学在Nature发文!

48162

39

2023-03-03

5所“双一流”,齐发Nature!

近日,山西大学、浙江大学、清华大学、复旦大学、北京大学的研究成果发表于Nature。

47477

20

2023-02-27

博士生一作!北京理工大学,Nature Protocols!

博士生一作!北京理工大学,Nature Protocols!

4109

4

2025-07-09

南策文院士领衔!清华大学/福州大学/北京大学,最新Nature子刊!

南策文院士领衔!清华大学/福州大学/北京大学,最新Nature子刊!

4731

4

2025-07-08

北京大学汤富酬团队最新Nature子刊

北京大学汤富酬团队最新Nature子刊

4127

4

2025-07-07

南京大学,Science!

南京大学,Science!

3722

4

2025-07-03