AI 卷到正经「挖矿」业,卡内基科学研究所另辟蹊径,靠关联分析法找到新矿床

这篇具有很好参考价值的文章主要介绍了AI 卷到正经「挖矿」业,卡内基科学研究所另辟蹊径,靠关联分析法找到新矿床。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

内容一览:矿物为技术社会提供了重要的原材料,同时也是许多地质事件和古代环境的唯一证据。几个世纪以来,寻找矿产资源以及探寻其起源和分布的基本原理,一直是地质学的主要关注点。近期,美国国家科学院院刊子刊《PNAS Nexus》发布了一篇研究成果,利用机器学习模型,通过矿物关联分析来预测新矿床地址和矿物种类。

关键词:机器学习   关联分析   矿物勘探

本文首发自 HyperAI 超神经微信公众平台~文章来源地址https://www.toymoban.com/news/detail-604835.html

矿物在几十亿年前出现,并在生物进化过程中起到了至关重要的作用。目前的地质行业勘探技术虽然很多,但因矿产资源具有隐蔽性和不确定性等属性,矿产勘探过程非常曲折,同时面临风险高、投资周期长且找矿成功率低等多种挑战。

过去的研究中,科学家们发现,地球上超过 5,000 种矿物并非随机分布,很多都存在于共生关系 (paragenesis) 中。所谓的共生关系,是特定的物理化学规律下形成的矿物组合,例如矿物的形成与宿主岩石的化学成分和环境条件密切相关。

近期,华盛顿卡内基科学研究所 (Carnegie Institution for Science) 的 Morrison Shaunna M 联合来自亚利桑那大学 (University Of Arizona) 的 Prabhu Anirudh 等人,采用机器学习发现矿物组合规律,来预测矿物位置。目前研究成果已发布在《PNAS Nexus》期刊上,标题为「Predicting new mineral occurrences and planetary analog environments via mineral association analysis」。

AI 卷到正经「挖矿」业,卡内基科学研究所另辟蹊径,靠关联分析法找到新矿床,ScienceAI,人工智能,AI for Science,机器学习

该研究成果已发表在《PNAS Nexus》上

论文地址:

Predicting new mineral occurrences and planetary analog environments via mineral association analysis | PNAS Nexus | Oxford Academic

实验概述

研究人员开发了一个机器学习模型,使用矿物演化数据库的数据,根据关联规则预测矿物位置,并在特科帕盆地(一个著名的火星模拟环境)测试模型。实验结果显示,机器学习能有效预测出矿物位置、矿物种类及矿物量。

关联分析是一种机器学习方法,用于发现数据集中的关联规则和模式。它通过分析数据中项集之间的关联性,来揭示不同项集之间的相关性和依赖关系。

论文作者提出,如果有恰当的数据,矿物组合分析除了能够预测新矿产位置、矿物种类,还能够预测给定地点的矿物量。并且该模型不仅适用于地球,还适用于任何岩石行星体。

数据集 

本研究数据集包含大型矿物演化数据库 (Mineral Evolution Database) 的 5,478 种矿物、295,583 个矿物产地及 5,472 个矿物产地的年代信息 (associated age),这些信息包含了 810,907 个矿物-产地组合。由于数据规模维度较大,研究人员将其分为不同子集,并选择了其中的 3 个:

*  地理子集:研究人员选择了美国,该地矿物多样性高、地理覆盖范围广且记录齐全、地质环境广阔。该子集包含 2,622 种矿物种类、93,419 个矿点和 8,139,004 条关联规则。

*  地球化学子集:研究人员选择了铀矿,通过分析一种或多种以 U 为基本元素的矿物种类来检查含铀的矿物相。该子集包含 5,439 种矿物、11,729 个矿点和 60,589,982 条关联规则。

时间子集:研究人员选择了三个时间切片 (time slices),分别为太古代 (> 2.5 Ga)、元古代 (2.5 – 0.54 Ga) 和新生代 (< 0.54 Ga)。

模型开发 

基于上述数据集,研究人员开始进行模型开发以及效果验证,整个过程分为 3 步:

1. 矿物关联规则生成

研究人员采用了关联分析中常见的 Apriori 算法。该算法采用自下而上的方式,通过测试和比较频繁共现 (cooccurrence) 的项目集(如矿物组合),来生成关联规则,这些规则可以用于矿物关联分析。

2. 矿物关联规则可能性度量

研究人员设置了可能性指标来筛选出符合要求的关联规则。可能性指标是指对矿物之间关联关系进行量化和评估的指标,常见的可能性指标包括支持度 (Support)、置信度 (Confidence) 和提升度 (Lift) 等。

支持度是指在所有样本中同时包含两种或多种矿物的比例。支持度越高,表示这些矿物之间的关联关系越强。

AI 卷到正经「挖矿」业,卡内基科学研究所另辟蹊径,靠关联分析法找到新矿床,ScienceAI,人工智能,AI for Science,机器学习

图 2:支持度计算公式

置信度是指当一个矿物出现时,另一个矿物也出现的概率。置信度高表示两种矿物质之间存在较强的关联性。

AI 卷到正经「挖矿」业,卡内基科学研究所另辟蹊径,靠关联分析法找到新矿床,ScienceAI,人工智能,AI for Science,机器学习

图 3:置信度计算公式

提升度是指两种矿物质同时出现的概率与它们各自独立出现的概率之比。提升度大于 1 表示两种矿物质之间存在正向关联,小于 1 表示存在负向关联,等于 1 表示两者之间没有关联性。

AI 卷到正经「挖矿」业,卡内基科学研究所另辟蹊径,靠关联分析法找到新矿床,ScienceAI,人工智能,AI for Science,机器学习

图 4:提升度计算公式

3. 矿物关联规则预测矿物

在本研究中,研究人员通过挖掘和分析已有的矿物数据,为上述 3 个数据子集(地理、地球化学和时间)都生成了关联规则。他们将待预测地点的矿物出现情况与关联规则作分析比较,可预测任意地点的矿物种类、矿物组合和成矿环境等等。

实验结果

实验选择在美国加利福尼亚州的特科帕盆地进行结果验证,因为这里含有火山灰和钙华沉积物,而且附近有玄武岩熔岩流,可模拟火星环境。研究人员预测了将会出现在该地的矿物种类,如下表所示:

AI 卷到正经「挖矿」业,卡内基科学研究所另辟蹊径,靠关联分析法找到新矿床,ScienceAI,人工智能,AI for Science,机器学习

表 1:预测将会出现在特科帕盆地的矿物种类

表中显示了预测所依据的关联规则的相关置信度和提升度指标。

研究人员还预测了铀矿和其他几种关键矿物可能会出现的位置,并将预测结果在地图中作了标记。铀矿预测位置结果如下图所示。其中,2020 年 10 月至今,一些预测已得到证实,佐证了矿物关联分析的预测能力。

AI 卷到正经「挖矿」业,卡内基科学研究所另辟蹊径,靠关联分析法找到新矿床,ScienceAI,人工智能,AI for Science,机器学习

图 5:预测铀矿地理位置图

其他几种关键矿物预测位置结果如下图所示。

AI 卷到正经「挖矿」业,卡内基科学研究所另辟蹊径,靠关联分析法找到新矿床,ScienceAI,人工智能,AI for Science,机器学习

图 6:预测其他几种关键矿物地理位置图

截止 2021 年 10 月,经过证实的地点均标有 Mindat 徽标。 Mindat 是全球矿物数据库网站,当一个矿物在某地被发现时,会发表在该网站。

除此之外,为了进一步了解地球历史上矿物出现的变化,研究人员还研究了选定时间段内矿物关联规则,具体包括太古代 (>2.5 Ga)、元古代 (2.5-0.54 Ga) 和新生代 (<0.54 Ga) 。3 个时间段里矿物组合提升度如下图所示。

AI 卷到正经「挖矿」业,卡内基科学研究所另辟蹊径,靠关联分析法找到新矿床,ScienceAI,人工智能,AI for Science,机器学习

图 7:太古代 (a)、元古代 (b)、新生代 (c) 矿物组合提升度

提升度代表矿物组合之间的关联强度,可以看到在太古代、元古代和新生代中,矿物组合分布存在明显差异。此规律可用在未来的研究中,进一步探索环境、气候等多种因素对矿物组合的影响。

综合以上,矿物关联分析可应用于预测新的矿物种类及目标矿物位置等。

关联分析:信息挖掘领域最活跃方法之一

关联分析又称关联挖掘,是数据信息挖掘领域最活跃的研究方法之一,最早在 1993 年被提出。本论文作者在讨论部分提出,关联分析应用不应局限于矿物组合,还可以进一步应用在分析共生化石、微生物、分子和地质环境等其他属性。这是因为这一方法具有可扩展性和可转移性,能适用于众多领域,发挥重要意义。

除了本论文中讨论的关联分析在矿物勘探方向的应用,其在人类和动植物遗传学研究上的进展同样值得关注。目前,该领域的研究者已提出了一系列基于关联分析的新方法与软件。例如,较早开放使用的 PLINK 软件,可用于数据管理、群体结构评价、复杂性状和 case – control 数据的关联分析,也可处理基因型和表型大数据;浙江大学朱军教授实验室开发的 QTXNetwork 则是基于 GPU 计算的、可以处理大规模复杂性状组学数据的关联分析软件包。

随着数据量持续增多、计算机科学技术和统计学算法的不断更新,关联分析在各领域应用会进一步发展,新的高效、快速和海量标记的关联分析技术平台也会涌现。在此背景下,团队及个人选择工具时,需要根据业务实际需求进行评估对比。

参考链接:

[1]https://www.doc88.com/p-9788189626622.html?

[2]https://zwxb.chinacrops.org/article/2016/0496-3490-42-7-945.html

本文首发自 HyperAI 超神经微信公众平台~

到了这里,关于AI 卷到正经「挖矿」业,卡内基科学研究所另辟蹊径,靠关联分析法找到新矿床的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【深度学习】大模型卷到机器人上了

    当一项变革性技术出现后,以此为基础的技术就会像雨后春笋般蔓延。 就像Transformer出现后,以此为基础的大语言模型ChatGPT,视觉基础模型Segment Anything相继横空出世,并展现出强大的涌现能力。生成式AI可谓百花齐鸣,争相绽放。 继纯语言,纯视觉大模型后,多模态大模型

    2024年02月07日
    浏览(36)
  • 数据科学家对AI和机器学习的认知

    作者:禅与计算机程序设计艺术 数据科学家的角色如今已经越来越重要,越来越多的人选择从事这一职业。尽管数据科学家可能并不一定会涉及到所有具体的机器学习或深度学习技术,但他们肩负着许多核心责任,包括收集、分析、理解和处理海量数据、设计并实施有效的数

    2024年02月08日
    浏览(63)
  • 人工智能(AI)在材料科学方面的应用

    人工智能(AI)在材料科学方面的应用日益增多,主要包括以下几个方面: 材料设计和发现:通过机器学习和深度学习算法,预测材料的性质和特性,在材料研究和开发中起到重要的作用。例如,使用AI算法可以对材料的电子结构、晶体结构和热力学性质进行模拟和优化。 材

    2024年02月10日
    浏览(46)
  • 认知科学与AI:人工智能的新篇章

    人工智能(Artificial Intelligence, AI)是一门研究如何让计算机模拟人类智能的学科。人类智能可以分为两类:一类是通过经验和经训练而获得的,称为“学习”;另一类是通过基于理论和先验知识而获得的,称为“推理”。人工智能的目标是让计算机具备这两种智能。 认知科学

    2024年02月19日
    浏览(45)
  • Nat. Biotechnol. | 生成式AI在生物科学领域发展迅速

    在过去的一年中,人工智能迎来了突破性的技术,它们来自OpenAI的DALL-E2和ChatGPT。 Link: https://openai.com/dall-e-2 Link: https://openai.com/blog/chatgpt 或许你在网络上已经或多或少了解了一些,甚至已经在无意中使用过了这些技术所带来的成果。而这些技术,已经开始冲击传统的AI,并带

    2024年02月16日
    浏览(47)
  • AI大模型引领未来智慧科研暨ChatGPT自然科学应用

    以ChatGPT、LLaMA、Gemini、DALL·E、Midjourney、Stable Diffusion、星火大模型、文心一言、千问为代表AI大语言模型带来了新一波人工智能浪潮,可以 面向科研选题、思维导图、数据清洗、统计分析、高级编程、代码调试、算法学习、论文检索、写作、翻译、润色、文献辅助阅读、文献

    2024年04月17日
    浏览(44)
  • 优酷路由宝TF卡内存不够怎么办?路由宝更换TF卡的教程

    很多人在使用路由宝的时候,对内置的TF内存好奇始终没有停止过,大多数人都在猜想是不是更换容量更大的内存卡,就可以提高上传数据的速度,因此,在猜想与实际行动之间一直处于犹豫心理,关键不知道内存卡在哪里,怎么更换,哈哈!如果你对自己的动手能力有点信心把握的

    2024年02月08日
    浏览(48)
  • AI算力专题:生命科学算力解决方案白皮书

    今天分享的是 AI算力系列 深度研究报告:《 AI算力专题:生命科学算力解决方案白皮书 》。 (报告出品方:先进计算产业发展联盟) 报告共计: 43 页 生命科学领域是对微生物、动物和植物等所有生物进行研究的科学领域,同时也包括生物伦理学等相关领域。生命科学的研

    2024年02月20日
    浏览(39)
  • 创新指南|生成式AI实验 - 企业快速渐进采用人工智能的科学新方法

    生成式人工智能(Gen AI)正迅速成为各行各业的企业创新焦点。 生成式AI实验对于企业创新而言至关重要,不仅可以帮助企业识别最适合和最有影响的应用场景,还能促进组织沿着生成式 AI 学习曲线前进,建立早期的创新领导者和AI人才梯队,为未来的AI创新发展奠定基础。

    2024年03月09日
    浏览(60)
  • 上海交大 AI4S 团队提出「智能化科学设施」构想,建立跨学科 AI 科研助手

    作者:李宝珠 编辑:三羊 上海交大人工智能研究院 AI for Science 团队杨小康教授等人,提出一种智能化科学设施的建设构想,形成科学领域大模型、生成式模拟与反演、自主智能无人实验及大规模可信科研协作等创新功能。 近年来,人工智能在科研中的应用持续向纵深发展,

    2024年02月22日
    浏览(53)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包