ChatGPT自从去年12月火爆以来一直热度不减,最近正好研读了科技之巅,书中详细阐述了人机交互、人工智能、算力算法等技术的发展历史,本文主要围绕ChatGPT引发的人机交互方面的思考。
在讨论人机交互之前,首先需要说明的一点,目前计算机发展的结果已经从原来作为科学计算工具转变为信息处理和信息交互工作,计算机通过软硬件帮助大家做业务研究或管理决策,目前大部分办公室白领、生产平台员工、智能工厂员工等从事的工作不是实际操作机器,而是要依赖一台计算机,甚至是一台能远程控制机器的计算机,计算机已经涉及人们的方方面面。
那么,人机交互是什么呢?人机交互是为了解决人类与机器(作为工具)之间的交流问题。人类和计算机的交流和互动是人机交互技术的核心,所有交互技术的发展都是用来提升人机交互的体验和效率。
人机交互从最初的穿孔卡片--》专用编程语言--》图形界面和鼠标操控--》Apple Siri/Google Assistant自然语言关键词交互--》ChatGPT自然语言理解交互--》Oculus Rift VR沉浸式虚拟现实--》Magic Leap Microsoft Hololens AR/MR增强/混合现实,使得人机交互更加符合人类自然的交互方式,从直观化和便捷化,发展到后来的可穿戴化,最后到达本能化和植入化。
应该说,ChatGPT彻底改变了以往我们使用计算机的应用入口,目前大家上互联网的入口主要还是搜索引擎,也有一些app,比如头条,小红书、b站等,但这些入口都有一个问题,主要还是通过关键词匹配内容,最多加入一些内容相关和个性化特征。但ChatGPT天生就是用大量语料训练的自然语言大模型,他解决了自然语言的分词、实体识别、关系识别、意图识别等等,而且ChatGPT是AIG的,即通用人工智能,解决大众普适的各类自然语言的问题,ChatGPT的受众更广泛,使用更自然,相比较以往的搜索引擎、语音助手、智能助手,ChatGPT更自然,正好是人机交互的发展所需,相当于是一种新的人机交互应用入口,大家称之为LUI(即Language User Interface),未来ChatGPT与各行各业的业务结合,一定会出现各种应用,比如ChatGPT+能源助手等。以下回顾了人机交互的发展历程。
1.结合手机的智能助手Apple Siri界面:Siri是2009年第一次出现在苹果手机,Siri不单单是一个搜索引擎,而是一个处理引擎,集成了AI、语音识别(与Nuance合作)、语音文字聊天服务和资源整合,人类通过与Siri大量的交流,Siri能够从交流中获取用户需求,并结合集成的各项技术和资源提供个性化答案。目前ChatGPT做到了更进一步,不单单是关键词,对整个语句进行了语义上下文理解,集合后端的大语言模型,提供有针对性的中性答案,人类也可以通过与ChatGPT互动,引导其提供某些倾向性的答案,相信后续的各种ChatGPT+业务应用场景会雨后春笋班的涌现出来。
2.手势界面:GUI界面需要键盘鼠标,触摸屏需要占用人类一两根手指,而手势界面是通过3D视觉识别技术实现的,核心是传感器和动作识别,所以,传感线和动作空间确定了手势界面的分层级别,平时玩游戏的游戏手柄相当于二维的触控手柄,而Microsoft Kinect体感游戏模块的动作识别就是三维空间的动作识别,Kinect通过深度摄像头,利用里面的红外线处理场景,获得物体景深信息并编码,再通过图像传感器读取编码后的场景,最后通过算法推算出场景的三维信息,非常复杂,要求高效,Kinect集成了动态捕捉、影像辨识、语音输入识别、多人互动等功能,应该是Kinect开启了人机交互的新纪元,但在三维空间中人机交互的动作识别和处理速度要求更高,XBOX就集成了Kinect,从而催生出手势界面和语音接口。
3.语音接口界面:语音接口其实是在AI、语音识别、自然语言处理和大语言模型技术催生下的产物,语音接口使得人机交互更加自然,计算机更贴心友好和个性化,而且受众用户也比图形用户界面广泛,比如老人、盲人,目前随着微信等即时通讯app的发展,语音接口已经成为人机交互的重要入口,特别是随着最近ChatGPT的火爆,后续一定会忘LUI方向发展,使得人机交互更加自然便捷。
4.智能可穿戴设备界面:目前大家每天用的最多的设备是手机,随着智能化可穿戴设备的出现,有可能有所转变,比如智能手表,智能手环,智能服饰,Google Glass眼镜,头盔等,这些设备或多或少具有语音识别、健康跟踪检测,健康指导指南、信息提醒等功能,我认为这些可穿戴设备都是一些过渡产品,未来可能会出现更加自然的人机融合产品。
5.沉浸式交互界面:VR是结合了众多人机交互接口技术的沉浸式超凡用户体验的核心技术,代表性产品是Oculus Rift VR;AR更进一步,是将虚拟事物加到现实世界中,代表性产品是Magic Leap或Microsoft Hololens,AR技术设计空间感知和光场显示技术,光场显示需要建立起四维的光场空间,使得虚拟物体与自然物体一样,在我们的视觉中有虚实变化,高低远近物体的聚焦变化等。这两项技术目前只在一些固定场景或游戏场景里面使用,针对消费类或工业类应用场景,实现通用的技术难度还是比较大,需要结合数字孪生,渲染引擎来做,目前在硬件、软件、产品定位和实际应用场景方面都存在大量未攻克的瓶颈,目前还做不到人类要求的自然人机交互水平,但后续的发展机会也非常多,现在国内外已经有很多结合头盔方面的产品和应用案例,因为我们实际业务中都得带头盔,相当于头盔是人从事工业工作得必需品,而这种设备相当于在头盔外面加一个附加设备。
因此,过去10年,人机交互技术发生了翻天覆地的变革,从最早的CLI(Command Line Interface)-->GUI(Graphical User Interface)-->VUI(Voice User Interface)-->LUI(Language User Interface),人机交互演进从直观化--》便捷化和集成化--》可穿戴化--》本能化和植入化
目前从人类五官(听觉、视觉、触觉、嗅觉和味觉)来分析,其实除了后面两个外,其他都已被人机交互技术涵盖了,只是精细度、自然性和一致性未达到人类要求,人机交互已经从一维/二维发展到三维或多维立体,也就是说,未来应该从感官层面向着脑意识层面转变,比如通过隐形眼镜、脑机接口真正实现人机融合,未来的人机交互技术或产品更加集成、便捷、可穿戴甚至植入。人机交互的未来发展趋势应该是交互的自然高效,形成高可用的自然交互技术,彻底实现人机融合,使得人类更高效的利用计算机这一集成工具。文章来源:https://www.toymoban.com/news/detail-423175.html
未来可期。文章来源地址https://www.toymoban.com/news/detail-423175.html
到了这里,关于ChatGPT引发的人机交互发展历程与升级思考的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!