Sora走红,浅谈GIS在AI方面的应用

这篇具有很好参考价值的文章主要介绍了Sora走红,浅谈GIS在AI方面的应用。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1. 龙年第一个爆火的,竟然是AI?

2024年2月16日,就在我们忙着过春节时,大洋彼岸,OpenAI又悄无声息地放出了“王炸”:颠覆人类对AI视频认知的文生视频大模型——Sora。

虽然未经提前预热,但Sora很快成为科技圈的重磅热点,引发360创始人周鸿祎等人下场讨论。

周鸿祎认为:Sora的诞生意味着AGI(通用人工智能)实现可能从10年缩短至一两年!

各社交媒体上,引发了大量关于sora的讨论:

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

短短数日,在抖音上,关于sora的讨论量也达到1.7亿:

 

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

2. Sora是什么?能做什么?

Sora,是指OpenAl在2024年2月16日发布的首个文本生成视频模型。Sora可以根据用户的提示,生成长达一分钟的视频,同时保持较高的视觉质量。

从2022年11月Chat GPT的横空出世,到2024年初Sora的爆火,再到国产AI软件层出不穷,AI技术正在以惊人的速度发展。

暂时抛开“版权”“隐私”和“伦理”问题,很明显,无论是否准备好,我们正在迅速迈向一个由AI驱动的世界。

AI的应用领域十分广泛,我们回归到熟悉的领域:地理信息系统。

那么,AI和GIS能擦出什么样的火花?AI能带动GIS发展吗?还是说GIS能助力AI,成为AI发展的王牌助手?

在讨论这个问题之前,我们先简单了解一下AI是什么?

 

3. 什么是AI?

人工智能(Artificial Intelligence,简称AI)是一门研究如何使计算机系统具备智能行为的学科。其目标是使机器能够执行需要智能的任务,模拟甚至超越人类的某些智能能力。人工智能涉及多个领域,包括机器学习、深度学习、自然语言处理、计算机视觉、专家系统等。

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

AI的发展历程

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

AI的市场规模

4. 什么是计算机视觉?

由于AI应用范围比较广泛,这里重点介绍计算机视觉方面,跟GIS联系较为紧密。

计算机视觉是AI领域的一个重要分支,致力于使计算机系统具备对图像和视频进行理解和解释的能力。

它涉及使用计算机算法和模型,使计算机能够模拟人类视觉系统的功能,从而实现对图像和视频的感知、分析和理解。

常见的计算机视觉任务,主要主要有四类:

图像分类:图像分类是将图像分为不同类别的任务,通过训练模型使计算机能够自动识别图像中的对象。

物体识别:物体识别涉及识别图像中的整个物体,并理解其在场景中的位置和角度。

目标检测目标检测是识别图像中特定物体或目标的过程,可以用于自动驾驶、安防监控等应用。

三维重建三维重建涉及从二维图像中还原出三维场景的空间结构,常用于计算机辅助设计和虚拟现实。

5. AI在GIS软件方面的应用

以mapgis为例,下面是AI在GIS方面应用的一个整体框架:

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

这个框架呢主要就是分了四层,第一底层是数据层,主要就是我们MapGIS SDE和MapGIS的data store;第二层是一个框架层,主要就是这些个人工智能的框架,能够对这些算法进行支持;主要我们使用的最多的应该是TensorFlow和PyTorch。

第三个就是针对不同任务,进行一个细致划分的一个功能层。主要包括模型库、流程工具和功能库,这个模型库里边,主要就是我们已经封装好的一些算法,比如说什么常见的一些CNN RNN,还有这个对抗生成网络GAN,还有这个长短长短期记忆网络,或者是YOLO。

这些网络流程工具主要用来处理视觉上面的一些数据。因为我们视觉方面的数据大部分都是一些遥感图像,所以就需要涉及到数据准备一些工作。

这些AI工具最擅长的是应用层主要就是什么地理实体提取和变化检测之类的一些数据处理方面,就是通过data store进行一个管理,主要管理的就是影像和矢量图层。

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

人工智能数据处理框架图

6. 这些工具主要有哪些功能呢?

标准数据增强:

主要包括线性拉伸、随机旋转、数据归一化等手段进行标准的数据增理

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

图像裁剪增强:

RandErasing方法,随机生成掩膜来增加模型对复杂地物的适应性

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

图像混叠类增强:

可增强模型的抗干扰能力

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

7. 常见的AI算法

说到底层技术,不得不谈到算法,AI的核心还是模型和算法。GIS方面应用较多的AI算法有以下几类,这里仅距离说明。

1、影像分类:

影像分类是指对影像的类别进行定性地分析,在多幅相似或不同的遥感影像中可以精确地分辨出遥感影像的类别(或影像所描述的场景),针对大范围影像分类结果返回一个大小均匀的矢量网格,每个网格带有其对应位置影像的类别标签:针对单张图片,影像分类结果返回的是图片的类别信息,总体来说影像分类是一种高于像元级别的粗粒度分类方法。

该方法不仅仅适用基于小范围遥感影像的语义分析对遥感影像数据进行分析和管理,还可以基于对图像的场景理解,对图像的类别做出评估。

自动化图像分类: 

图像分类网络通过学习大量标记好的图像数据,能够自动识别和分类图像中的内容。这使得大规模图像的分类工作可以高效自动完成,减轻了人工劳动负担。

提高图像识别准确性:

图像分类网络通过深度学习算法,能够学习图像中的复杂特征和模式,从而提高了图像识别的准确性。这对于各种应用场景,如医学影像、安防监控、自动驾驶等,具有重要意义。

推动深度学习发展:

图像分类网络是深度学习领域的代表性应用之一。其成功应用推动了深度学习技术的发展,为其他复杂任务的解决提供了经验和基础

2、语义分割

是计算机视觉领域中一种重要的图像分析任务,其目标是将图像中的每个像素分配到预定义的类别中,从而实现对图像的精细化理解。与目标检测不同,语义分割不仅关注物体的位置,还关注物体的边界和形状,使得每个像素都被赋予语义标签。

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

U-Net(全卷积网络)是一种用于图像分割任务的深度学习架构,由德国图灵奖获得者Ronneberger等人于2015年提出。U-Net的设计灵感来源于生物医学图像分割的需求,尤其是医学图像中器官和病变的精确分割。

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

U-net网络结构示意图

DeepLab是一系列用于语义分割任务的深度学习模型,由Google提出。这一系列模型以卷积神经网络为基础,通过引入深度可分离卷积和空洞卷积等技术,致力于解决图像分割中的细节捕捉和计算效率的问题。

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

DeepLab v2模型示意图

其他的这里就不一一赘述。

需要更多详细介绍的同学,可以戳下面备注【人工智能与GIS】,领取详细视频讲解:

免费领取GIS开发相关学习资料

8. AI在GIS中的应用

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

模型说明:

  • 适用功能:影像分析,二元分类和多元分类。

  • 适用场景建筑物、道路等地物提取。

输入数据类型:

  • 影像数据

算法特点:

  • 速度快、精度高、网络结构清晰

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

结果说明:

通过对测试数据进行预测后,计算出了精度(Accuracy)、召回率(Recall)和F1指标(F1 score)我们可以看出,加入了注意力机制,模型的精度极大提升。

9. AI未来的发展方向之:语言大模型(LLM)

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

最后,谈一下红极一时的chatgpt对人工智能发展的一些贡献和特点。

Chatgpt主要贡献:

  • 强化学习中引入人类反馈的学习方法

  • 高质量微调数据指令集的重要性

核心能力:生成、总结、提取、分类、检索和改写

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

10. ChatGPT的主要技术:

Transformer架构: ChatGPT基于Transformer架构。Transformer是一种使用自注意力机制(Self-Attention Mechanism)的深度学习模型,适用于处理序列数据,如自然语言。自监督预训练: ChatGPT采用了自监督预训练的方法。这意味着在模型在特定任务上进行微调之前,它首先在大规模的语料库上进行了预训练。GPT模型通过学习预测序列中缺失的一部分内容,从而学到了语言的结构和上下文理解。

大规模参数: GPT-3是一个参数规模庞大的模型,具有1750亿个参数,这使得家在各种任务上表现出色,包括聊天式对话。

微调: ChatGPT可能会在特定的任务上进行微调,以适应更具体的应用。微调过程通常涉及在特定任务的有标签数据上对模型进行额外的训练。

上下文处理: GPT模型使用自注意力机制,能够有效地处理长文本序列,这对于处理上下文丰富的对话非常有用。

12. GIS+GIS=GeoGPT:

将语言大模型和GIS工具集结合在一起,降低非专业用户解决地理空间任务的门槛。主要应用在:间数据抓取、空间查询、设施选址和制图等方面。

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

简单概括一下上述GIS tool pool的流程:

首先用户提需求,通过AI模型的反复分析,分解为各个指令,再从GIS的相关应用词里面抽取一部分符合任务描述要求的工具,组成一个流程图,最后输出的一个结果。

再看下面这个图:

sora与地理技术能怎样结合,webgis,人工智能,sora,webgis,GIS,AI,语义分割

这个图就是一个学校的选址的流程。

要求1:我想要离公园近一点;

要求2:我还想要离工厂远一点;

这里就涉及到GIS中的缓冲区的概念。

右边的图中可以看到公园和那个公交站的一个交叉区域,通过离工厂的一个半径,最后筛选出来,适合选址的一个区域。

这样做的主要优势在于,能够就是降低非专业用户的门槛——非GIS专业的认,也能够通关AI模型,解决地理空间任务和问题。

关于GIS和AI的内容,我们暂时介绍到这里。

想查看完整版视频讲解,请戳下方按钮备注【人工智能与GIS】即可获取。

免费领取GIS开发相关学习资料https://www.wjx.cn/vm/eqvTtp6.aspx# 

 

Sora大模型为数字经济创新发展打开了一扇大门,形成了引领人工智能产业发展的一个新的通道,这不仅带来很大启发,更大地带来了产业的冲击。”杭州新春第一会上市委书记刘捷这样说到:“杭州数字经济高速发展,在这一轮人工智能发展新机遇上,唯有加快改革、加快发展,适应和抢抓新机遇。”

在新型城镇化建设深入推进、“数字中国”战略持续实施、“双碳”目标加快落实、数字技术与实体经济深度融合、数字化转型全面提速的背景下,智慧城市建设迎来新机遇。

数字化经济不断发展,数字化人才的需求也逐渐浮出水面!

成为数字化人才的第一步,学习一项专业技能!

在新中地GIS开发特训营,各位学员通过渐进式的GIS开发技能提升、多层次的职场能力培养、全方位就业服务体系。他们不仅具备了GIS开发能力和丰富的项目经验,也具备了职场必需的表达沟通和总结汇报能力,在职业发展中极具竞争力!

7天免费试听GIS开发课程

☑0基础可学   ☑助力考研   ☑优选赛道

扫码填表即可免费获取7天课程

附送送海量GIS资料

2024GIS开发特训营免费体验券文章来源地址https://www.toymoban.com/news/detail-837361.html

到了这里,关于Sora走红,浅谈GIS在AI方面的应用的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 人工智能技术应用笔记(三):Sora内测资格申请方法(快去申请,不知道什么时候关闭!)

    openAI 已经开放了 sora 的测试资格申请,但是路径很深,很多人可能还不知道! 如何申请测试资格? https://openai.com/ 根据目前的热度,sora的内测渠道不知道什么时候就会关闭了,赶紧去试试吧! ————————————————————————————————————

    2024年03月15日
    浏览(43)
  • 当前爆火的:ChatGPT4、Claude3、Gemini、Sora、GPTs及AI领域中的集中大模型的最新技术

    原文链接:当前爆火的:ChatGPT4、Claude3、Gemini、Sora、GPTs及AI领域中的集中大模型的最新技术 第一: 2024年AI领域最新 技术 1. 最新超强模型Claude3使用 2.OpenAI新模型-GPT-5 3. 谷歌新模型-Gemini使用 4.Meta新模型-LLama3 5. 阿里巴巴-通义千问 6. 科大讯飞-星火认知 7. 百度-文心一言 8. M

    2024年03月24日
    浏览(53)
  • Sora是什么?Sora怎么使用?OpenAI最新文字转视频AI模型Sora,一句子生成60秒超逼画面

    Sora 是 OpenAI 开发的AI视频生成模型,它能够根据用户的文本描述生成 长达 60 秒 、1080P 高质量视频,其中包含 精细复杂的场景、生动的角色表情以及复杂的镜头运动 。 Sora能够创造出包含多个角色、特定动作类型以及与主题和背景相符的详细场景。这款模型不仅能理解用户的

    2024年02月20日
    浏览(52)
  • Sora 技术实现

    Sora 的发布宛如一枚核弹,受到各行各业的追捧和关注。不可否认,Sora 生成的视频效果确实太炸裂了,甩开之前文生视频模型几条街。下面是 Sora vs. Pika vs. RunwayML vs. Stable Video 生成视频效果对比 Sora vs. Pika vs. RunwayML vs. Stable Video 生成视频效果对比 很明显可以看出 Sora 无论从

    2024年02月21日
    浏览(39)
  • 深度解析Sora的核心技术

    Sora面临的挑战是将不同类型的视觉信息,如视频、文本、图像和声音等,整合为一种共同的表征形式。这种转换是实现统一训练过程的关键,旨在将各类数据集中到一个训练框架中,以便于进行大规模的统一学习。简而言之,OpenAI的目标是将视频数据和其他多种类型的数据结

    2024年02月22日
    浏览(54)
  • 51-28 Sora 文生视频背后的核心技术

    2024年2月16日,OpenAI发布Sora文生视频模型,一石激起千层浪,迅速刷屏爆火于整个AI圈。一方面,Sora从文本、图像迈向视频大模型,这可以说是通向通用人工智能的里程碑事件;另一方面,训练和推理需求从文本、图像又增加一个视频维度,将拉动AI芯片、AI应用雨后春笋般的

    2024年03月19日
    浏览(42)
  • OpenAI-Sora:60s超长长度、超强语义理解、世界模型。浅析文生视频模型Sora以及技术原理简介

    Sora官方链接:https://openai.com/sora   视频模型领头羊Runway Gen 2、Pika等AI视频工具,都还在突破几秒内的连贯性,而OpenAI,已经达到了史诗级的纪录。 OpenAI,永远快别人一步!!!! 像ChatGPT成功抢了Claude的头条一样,这一次,谷歌核弹级大杀器Gemini 1.5才推出没几个小时,全世

    2024年03月15日
    浏览(53)
  • OpenAI Sora出炉,视频鉴赏,详细介绍,小白看过来~~立即尝试Sora,开启您的AI视频创作之旅吧!

    OpenAI最新推出的视频创作的颠覆性产品:Sora,它开启了该行业的新纪元,吊打目前一众视频制作工具。 无论是专业人士还是爱好者,都可以轻松创作出高质量的视频内容。 Sora同样是一个根据文本指令创建逼真而富有想象力的场景的人工智能模型。 尽管仍有一些限制,但随

    2024年02月21日
    浏览(49)
  • Sora给中国AI带来的真实变化

    OpenAI的最新技术成果——文生视频模型Sora,在春节假期炸裂登场,令海内外的AI从业者、投资人彻夜难眠。 如果你还没有关注到这个新闻,简单介绍一下:Sora是OpenAI使用超大规模视频数据,训练出的一个通用视觉模型,可以理解和模拟运动中的物理世界,生成不同时间、纵

    2024年02月22日
    浏览(34)
  • Sora:探索AI视频模型的无限可能

    随着人工智能技术的不断突破,AI视频模型已经成为科技界的新宠。作为OpenAI推出的首个AI视频模型,Sora凭借其卓越的性能和前瞻性的技术,正引领着AI视频领域的创新发展。本文将深入探讨Sora的技术特点、应用场景以及对未来创作方式的深远影响。 Sora的技术架构融合了深度

    2024年03月14日
    浏览(46)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包