您当前浏览器版本过低,为了不影响您的使用,建议您使用最新的谷歌浏览器、火狐浏览器、 360浏览器,更换浏览器后使用更流畅!(注意!双核浏览器请切换为极速模式)
工信部人工智能赋能中小企业典型应用场景案例(科研领域)

机器学习有助于绘制全球海洋社区的地图

2020-06-01
4840

机器学习有助于绘制全球海洋社区的地图.jpg

在陆地上,一个生态区域的终点和另一个生态区域的起点非常明显,例如在沙漠和热带稀树草原之间的边界。在海洋中,生命的大部分是微观的,并且流动性强得多,这给科学家们绘制生态上独特的海洋区域之间的边界图带来了挑战。

科学家描绘海洋群落的一种方式是通过卫星图像的叶绿素(浮游植物产生的绿色色素)。叶绿素浓度可以表明一个地区与另一个地区相比,潜在生态系统的丰富程度或生产力。但是叶绿素图只能给出给定区域中可能存在的总生命量的信息。实际上,叶绿素浓度相同的两个区域实际上可能具有植物和动物生命的不同组合。

“就好像您要看一看陆地上生物量不多的所有地区,包括南极洲和撒哈拉沙漠,即使它们的生态系统完全不同,”前博士后迈克·索纳瓦尔德(Maike Sonnewald)说。麻省理工学院的地球,大气和行星科学系。

现在,麻省理工学院的Sonnewald和她的同事们开发了一种无监督的机器学习技术,该技术可以自动梳理一组非常复杂的全球海洋数据,根据它们的比例和多种浮游植物物种之间的相互作用来找到海洋位置之间的共性。通过他们的技术,研究人员发现,海洋可以分为100多种类型各异的“省份”,这些省份的生态构成各不相同。可以想象,海洋中任何给定的位置都可以容纳这100个生态省之一。

然后,研究人员在这100个省之间寻找相似之处,最终将它们分为12个更一般的类别。从这些“大省”中,他们可以看到,尽管有些人在一个区域内的生活总量相同,但他们的社区结构或动植物种类的平衡却大不相同。索纳瓦尔德说,捕捉这些生态微妙之处对于追踪海洋的健康和生产力至关重要。

“生态系统随着气候变化而变化,需要监测社区结构,以了解对渔业的冲击以及海洋吸收二氧化碳的能力,” Sonnewald说。“我们无法用传统方法完全理解这些至关重要的动力,迄今为止,还没有包括那里的生态。但是,我们的方法与卫星数据和其他工具相结合,可以提供重要的进步。”

索纳瓦尔德(Sonnewald)现在是普林斯顿大学的副研究员以及华盛顿大学的访问者,他今天在《科学进展》杂志上报道了这一结果。她在MIT的合著者是高级研究科学家Stephanie Dutkiewitz,首席研究工程师Christopher Hill和研究科学家Gael Forget。

推出数据球

团队的新机器学习技术(他们称为SAGE)适用于系统化聚合生态省方法,旨在处理大型,复杂的数据集,并有可能将该数据投影到一个更简单的低维数据集。

Sonnewald说:“这就像制作饼干一样。” “您需要收集这些极其复杂的数据并将其推出以揭示其元素。”

特别是,研究人员使用了Sonnewald所说的聚类算法,该算法旨在“沿着数据集爬行”并在点密度较大的区域中进行磨练-这表明这些点具有某些共同点。 

Sonnewald和她的同事们在麻省理工学院的达尔文项目的海洋数据上放宽了该算法,该项目是全球海洋的三维模型,将海洋气候模型(包括风,流和温度模式)与海洋生态模型结合在一起。该模型包括51种浮游植物,以及每种植物的生长和相互作用方式以及与周围气候和可用养分的相互作用方式。

Sonnewald说,如果人们试图浏览这个非常复杂的51层数据空间,以便对海洋中的每个可用点进行观察,以了解哪些点具有共同特征,那么这项任务将是“人类难以处理的”。使用该团队的无监督机器学习算法,这种共性“开始变得清晰起来”。

该小组的SAGE方法中的第一个“数据清理”步骤能够将全球海洋解析为大约100个不同的生态省,每个省的物种均具有明显的平衡。

研究人员将海洋模型中的每个可用位置分配给了100个省中的一个,并为每个省分配了一种颜色。然后,他们绘制了一张全球海洋地图,按省份类型进行了着色。  

Sonnewald说:“在南极洲周围的南大洋,在环绕着南极洲的这些条状条纹中,有勃艮第和橙色的形状影响了我们的期望。” “与其他功能一起,至少在模型中,这给了我们很大的信心,使我们的方法有效并且有意义。”

生态统一

然后,研究小组寻找方法来进一步简化他们确定的100多个省,以查看即使在这些生态截然不同的地区之间,他们是否也可以找出共同点。

“我们开始考虑类似的事情,如何将一群人彼此区分开?我们如何看待彼此之间的联系?我们使用这种直觉来了解我们是否可以量化不同省份在生态上的相似程度。” Sonnewald说。

为此,该团队应用了图论技术,根据生物量在一张图中代表了所有100个省。这类似于一个地区产生的叶绿素数量。他们选择将100个省分为12个大类,即“特大省”。当他们比较这些大型省份时,他们发现那些具有相似生物量的省份是由非常不同的生物物种组成的。

“例如,省D和K的生物量几乎相同,但是当我们深入研究时,K的硅藻几乎没有原核生物,而D的硅藻几乎没有,原核生物很多。但是从卫星看,它们看起来可能一样。”索纳瓦尔德说。“因此,我们的方法可以开始将生态信息添加到大量叶绿素措施中的过程,并最终有助于观察。”

该团队开发了一个在线小部件,研究人员可用来在100个省中查找其他相似之处。在他们的论文中,Sonnewald的同事选择将这些省分为12类。但是其他人可能希望将省份划分为更多的组,并深入研究数据以查看这些组之间共有的特征。

索纳瓦尔德(Sonnewald)正在与海洋学家共享该工具,这些海洋学家希望精确确定特定生态组成区域的位置,因此,他们可以例如在这些区域而不是在物种平衡可能略有不同的其他区域发送船只进行采样。

“与其使用基于大量叶绿素的工具指导采样,并猜测使用此方法可以发现有趣的生态学,还不如说是外科手术,说,'这就是模型在这里可能会发现的,'” Sonnewald说。“了解诸如海洋科学和全球渔业之类的物种组合的确非常重要。”

这项研究部分由NASA和喷气推进实验室资助。


已收藏 8
点赞 44

学术会议

【院士报告,EI稳定快检索】第七届先进材料与智能制造国际学术会议(ICAMIM 2026)
第七届先进材料和智能制造国际学术会议(ICAMIM 2026)将于2026年8月28-30日在中国广州召开。本次会议旨在加强世界各国的先进材料与智能制造技术交流。
2026-08-28
【往届会后3个月检索| 青岛农业大学主办 |ACM出版】第五届人工智能与智能信息处理国际学术会议(AIIIP 2026)
第五届人工智能与智能信息处理国际学术会议(AIIIP 2026)将于2026年7月24-26日在青岛召开,本次会议拟加强国内外相关学者之间的沟通与交流,着力反映智能信息处理研究的最新进展。
2026-07-24
第三届大数据与数字化管理国际学术会议(ICBDDM 2026)
第三届大数据与数字化管理国际学术会议(ICBDDM 2026),将于2026年8月14-16日在中国- 银川召开。 在当今这个数据驱动的时代,大数据与数字化管理已经成为推动组织变革
2026-08-14
【IEEE出版|往届2.5个月检索|中山大学主办】第六届计算机科学与区块链国际学术会议(CCSB 2026)
第六届计算机科学与区块链国际学术会议(CCSB 2026)定于2026年8月21-23日在珠海市召开。会议旨在为计算机科学与区块链相关领域的专家学者提供一个交流学术成果、促进合作交流的广泛平台。
2026-08-21
【IEEE出版|英国布鲁内尔大学主办】第七届计算机视觉与数据挖掘国际学术会议(ICCVDM 2026)
第七届计算机视觉与数据挖掘国际学术会议(ICCVDM 2026)定于2026年8月15-17日在英国伦敦召开。会议旨在为计算机视觉、数据挖掘等计算机领域的专家学者提供一个可交流学术成果、促进合作的平台
2026-08-15
【IEEE出版+国家级人才报告】第五届航空航天工程与系统国际研讨会(ISAES 2026)
由贵州理工学院主办的第五届航空航天工程与系统国际研讨会(ISAES 2026)于2026年7月24-26日在贵州贵阳市召开。涵盖多个领域的议题,航空器设计、航天器系统、航空动力推进、飞行控制技术等;
2026-07-24
相关资讯

SCI一区文章和二区文章有区别吗

SCI分区是众所周知的,一区文章和二区文章其实也是相对于期刊的分区来说的,一区文章就是发表在SCI一区期刊上的文章,二区文章就是发表在SCI二区期刊上的文章,由于SCI分区共分为四个区,一区学术价值最大。

367088

0

2021-04-21

hm² 是什么单位?hm² 怎样换算?

hm² 是一个什么单位呢?hm² 怎样换算?它与我们常见的单位的换算又是怎么样的?本期艾思科蓝​小编带大家了解一下hm² 这个单位。

149061

1

2021-11-17

学术会议上不能发言怎么办

你是否曾有过这样的体验:精心准备了学术会议的报告,最终却因时间限制、议题安排或其他原因未能获得发言机会?那种满怀期待却落空的感觉,确实令人失落。尤其在竞争激烈的学术圈,会议发言常被视为展示研究成果、建立学术联系的重要平台。但未能登台并不意味着此行毫无收获,关键在于调整心态并采取积极策略,将有限的参与转化为多维度的成长机会。

97

0

2026-07-03

国家级期刊的查询方法

在学术研究与职称评定的路上,发表论文是许多学者和专业技术人员必须面对的重要环节,而选择合适的国家级期刊则是其中关键一步。然而,面对数量庞大、种类繁多的刊物,如何准确、高效地查询并确认一本期刊是否为正规的国家级期刊,常常令人感到困惑。了解权威的查询途径和验证方法,不仅能避免落入虚假或低质刊物的陷阱,更能有效提升学术成果的传播价值与认定效率。

101

0

2026-07-03

什么是SCI二区以上

对于许多踏入学术研究领域的朋友来说,“SCI二区以上”这个说法常常出现在论文投稿、职称评定或学术评价的讨论中,但具体它指代什么、如何划分、又为何如此重要,可能不少人仍有些模糊。其实,这关系到科研工作者如何定位自己的研究成果水平,以及如何理解学术界对期刊质量的普遍衡量标准。

109

0

2026-07-03

自动化论文里的收敛速度怎么衡量怎么写

在自动化领域的学术论文中,算法的收敛速度分析往往是评估其性能与实用性的关键环节,它直接反映了算法从初始状态逼近最优解或平衡点的效率与能力。对于研究者而言,如何科学地衡量并清晰地呈现这一指标,是论文方法论部分需要精心处理的内容,不仅关系到审稿人对工作深度的评判,也影响着同行对研究成果的理解与应用。一篇优秀的自动化论文需要在这一部分展现出严谨的理论分析和扎实的实验验证。

98

0

2026-07-03
立即开启