微软:这个AI应用能帮助视障儿童找到社交自信

这篇具有很好参考价值的文章主要介绍了微软:这个AI应用能帮助视障儿童找到社交自信。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

在日常社交场合中,人们通常会采用各种形式的交流方式,除了文字交流、谈话等直接的方式,眼神、姿态、动作也是人与人沟通的关键方式。然而,正常的社交为盲人、视障人士带来诸多困难,就像电视里常演的那样,盲人在说话的时候通常不会对着其他人,因为他们难以定位周围人的位置,而且也无法确定对方是否在看着他说话。

微软:这个AI应用能帮助视障儿童找到社交自信

PeopleLens

对于天生失明的孩子来讲,与周围人社交、互动更加困难,在一群人交流的场景中,他们可能需要将头放在桌子上,用一只耳朵来定位周围讲话的人。而这就造成他们在正常社交技能上的缺失。也就是说,盲人/视障人难以像普通人一样专心交流,很难自然流畅的保持话题,进而产生社交障碍。

于是,为了训练失明/视障儿童的社交技能,帮助他们与同龄人正常互动和交流,微软研发了一种基于AR眼镜的人脸识别和定位系统:PeopleLens。该系统的特点是通过摄像头来定位周围的人,并将他们的坐标组成一个3D地图网络,帮助失明/视障儿童定位这些人。此外,它还可以帮助识别这些人的名字、眼神,并通过空间语音来提示用户。

具体来讲,其具有五大功能:识别眼前人的身份;提示你有人在看你;通过声音帮你定位周围的人;用声音引导你转头面向特定的人;用LED灯提示周围的人你在看他/她。

灵感来自残奥会

据青亭网了解,微软这一系列研究的灵感,实际上来自2016年的巴西里约热内卢残奥会,其目的是在很多人的社交场合中,帮助盲人/视障人士处理和不同人的对话,弥补眼神和肢体交流的缺失。

微软:这个AI应用能帮助视障儿童找到社交自信

Project Tokyo

在过去几年里,微软的AI团队持续利用计算机视觉技术来帮助盲人/视障人士感受世界,以及识别周围的人,曾推出可识别照片内容的Seeing AI应用,或是基于HoloLens的人脸识别系统Project Tokyo等等。

在Project Tokyo基础上,微软又研发了一款HoloLens人脸识别应用:PeopleLens。与Project Tokyo相似,PeopleLens也是通过计算机视觉来识别人脸,然后通过语音提示来帮助盲人/视障人士识别周围的人。区别在于,PeopleLens将周围的人定位,并生成一种地图网络(People Map),当HoloLens用户靠近周围人所在的位置时,系统便可以快速识别并说出这个人的名字。此外,还通过语音提示来引导HoloLens看向特定的人。

也就是说,PeopleLens不再只是单纯的识别人脸,而是进一步定位并保存周围人的位置,好处是响应速度更快。

微软:这个AI应用能帮助视障儿童找到社交自信

微软表示:PeopleLens通过定位和识别空间中的人,帮助盲人、视力障碍人士了解周围的社交环境。它还结合了基于心理学、语言治疗的研究和实验成果,通过一系列游戏来训练盲人/视障人士的社交技能,允许他们更好的与同龄人交流。

技术细节

据了解,PeopleLens是一个开放的AI系统,它可以增强盲人/视障人士的日常社交体验,帮助他们更好的感知世界。它需要结合AR头显来运行,比如Nreal Light。与基于HoloLens的Project Tokyo相比,PeopleLens更轻量化,Nreal Light更接近普通眼镜形态。

微软:这个AI应用能帮助视障儿童找到社交自信

PeopleLens采用了5种计算机视觉算法,可持续定位、识别、追踪和捕捉附近人的注视方向。也就是说,它可以帮你识别附近看你的人,并根据空间音频提示找到这个人。当你得到其他人注意力时再开启对话,体验感会更自然、效率也更高。

PeopleLens可以帮助盲人/视障人士建立一个3D社交地图,这个地图旨在帮助他们了解环境中不同人的定位、距离。创建地图的好处是,即使用户背对着其他人,或其他人不在HoloLens追踪范围内,其位置也会记录在实时更新的地图中。

细节方面,PeopleLens利用空间音频来念人名,也就是说将空间信息与人名结合,帮助用户根据声音传播方向来定位其他人的距离和所在地,并进行系统的记忆。

微软:这个AI应用能帮助视障儿童找到社交自信

AR眼镜还可以通过灯光等形式,提醒周围的人他们的追踪状态,如果你不想进入AR的定位范围,在看到LED灯光后可以躲开。这种方式可以一定程度上替代人与人互动时的眼神交流。(白光表示检测到人的位置,闪烁绿光代表人脸识别成功)

值得注意的是,PeopleLens的面部识别是基于自愿收集的,人们可以上传几张自己的照片来注册系统,这些照片不会被储存,而是被系统转换成可识别的面部数据。

PeopleLens在10米范围内识别到的人用撞击声表示,当这个人距离用户4米以内时,PeopleLens会念出其名字。如果这个人的脸没有正面对着PeopleLens的追踪范围,系统会通过声音来引导用户看向这个人,如果识别到注册的用户则会念出名字,如果识别到未注册的人则通过咔哒声来确认。

应用场景

对于盲人、视障人士,PeopleLens是一种寻找朋友的方式,也是一种提升反应能力和社交自信的工具。通过一系列培养注意力的交互游戏,还可以进一步提升盲人/视障人士的空间感知能力,让他们更容易和周围的环境互动。

此外,也可以通过交互游戏来训练盲人/视障人士的社交能力,比如PeopleLens在检测到周围有人时,会发出咔哒声,识别到人脸后,会播放碰撞声,然后念出这个人的名字。在听到咔哒声,想要寻找这个人时,会听到一种类似于橡皮筋拉伸的声音,其音量会根据你跟这个人之间的距离而变化,直到你面对着这个人时,会发出响亮的咔哒声,向你确认定位成功。

微软:这个AI应用能帮助视障儿童找到社交自信

这种声音提示,可以帮助盲人/视障人士快速发现周围的人,通过改变/引导注意力,来发起或结束对话。

科研人员解释,这参考了儿童学习的方式,比如当婴儿指着天空时,父母说“鸟”,他/她便会将语音和视觉匹配。而对于视力不佳的孩子来讲,他们的注意力通过听觉来表现,因此PeopleLens试图将听觉和空间方位结合,帮助他们在空间中导航。

微软:这个AI应用能帮助视障儿童找到社交自信

除此之外,用户还可以通过连续敲击声的次数来识别不同方向有多少个人,比如在教室里,如果一个方向有三个人,他们可能是在讨论题目,如果听到一连串敲击声,可能是一群孩子在课桌前看书。你还可以在周围寻找好友奥斯卡,当他看到AR头显上的LED灯光时,可以移动到头显摄像头可识别的位置,当你识别到奥斯卡后,可以根据奥斯卡的位置来分析他的姿态,如果奥斯卡在坐着,那么你也可以抓一把椅子坐在他旁边。参考:微软文章来源地址https://www.toymoban.com/news/detail-466982.html

到了这里,关于微软:这个AI应用能帮助视障儿童找到社交自信的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 有 AI,无障碍,AIoT 设备为视障人群提供便利

    据世界卫生组织统计,全球共 22 亿人视力受损,包含 2.85 亿视障人群和 3,900 万全盲人群。而且,这一数字将随老龄化加剧不断增加。 虽然视障人群面临着诸多不便,但是针对视障人群的辅助设备却存在成本高、维护困难、操作复杂等问题,很难满足他们的生活需求。 为此,

    2024年02月08日
    浏览(56)
  • 厉害了!这个工具帮助你生成朋友圈转发截图

    大家好,我是 Java陈序员 。 在日常的工作生活中,我们经常会遇到应付各类强制要求转发朋友圈的行为,或者是朋友圈集赞的行为。 今天,给大家介绍一个工具,可以帮助你生成朋友圈转发截图。 关注微信公众号:【Java陈序员】,获取 开源项目分享、AI副业分享、超200本经

    2024年04月28日
    浏览(33)
  • 出现身份验证错误,无法连接到本地安全机构 顺利解决这个问题希望能帮助大家

    出现身份验证错误,无法连接到本地安全机构,远程计算机:XX,这可能是由于密码过期,如果密码已过期请更新密码。 我们可以在系统属性中对远程进行设置,以解决远程桌面无法连接到本地安全机构这一问题。 步骤1.  按 “Windows + R” 键,并输入 “sysdm.cpl” ,点击 “确

    2024年03月22日
    浏览(52)
  • 微软HTML帮助集(CHM文件)

    微软HTML幫助集 ,即 已編譯的HTML說明檔案 (英語:),是微軟继承早先的WinHelp發展的一种檔案格式,用来提供線上幫助,是一种应用较广泛的文件格式。因为CHM檔案如一本書一樣,可以提供內容目錄、索引和搜尋等功能,所以也常被用来制作电子书。[3]實際上,微軟閱讀器

    2024年01月19日
    浏览(24)
  • 【每周AI简讯】微软Copilot上线安卓和iOS应用

    微软Copilot上线安卓和iOS应用 微软在其 Google Play 商店列表中将 Copilot 描述为:“Copilot 是微软的一款开创性聊天助手,由最新的 OpenAI 模型、GPT-4 和 DALL·E 3 提供支持。这些先进的人工智能技术提供快速、复杂和精确的响应,以及从简单的文本描述创建令人惊叹的视觉效果的能

    2024年02月03日
    浏览(46)
  • 深入浅出落地应用分析:AI数字人「微软小冰」

    hi,各位,今天要聊的是AI小冰,机缘巧合,投递了这家公司的产品,正好最近在看数字人相关的,就详细剖析下这款产品! 小冰,全称为北京红棉小冰科技有限公司,前身为微软(亚洲)互联网工程院人工智能小冰团队,是微软全球最大的人工智能独立产品研发团队。作为

    2024年03月20日
    浏览(37)
  • 人类反馈强化学习RLHF;微软应用商店推出AI摘要功能

    🦉 AI新闻 🚀 微软应用商店推出AI摘要功能,快速总结用户对App的评价 摘要 :微软应用商店正式推出了AI摘要功能,该功能能够将数千条在线评论总结成一段精练的文字,为用户选择和下载新应用和游戏提供参考。该功能目前只适用于美国Windows 11用户,并有望向更多国家和

    2024年02月12日
    浏览(41)
  • 微软发布最新.NET 8长期支持版本,云计算、AI应用支持再强化

    11 月 15 日开始的为期三天的 .NET Conf 在线活动的开幕日上,.NET 8作为微软的开源跨平台开发平台正式发布。.NET 团队着重强调云、性能、全栈 Blazor、AI 和 .NET MAUI 是.NET 8的主要亮点。.NET团队在 .NET Conf 2023 [1]活动开幕式上表示:“通过这个版本,.NET 重塑了我们构建按需扩展的

    2024年02月05日
    浏览(37)
  • Python速查表;腾讯大佬的AIGC设计应用汇总;这个世界需要10亿开发者;67个最常用AI工具清单 | ShowMeAI日报

    👀 日报周刊合集 | 🎡 生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 随着AIGC浪潮的兴起,越来越多小伙伴尝试着使用 GPT 类工具开发小程序、网页、小游戏等应用,也意识到 Python 编程是绕不过去知识门槛。 推荐一份 ShowMeAI 制作的 Pyhton 速查表,涵盖了 Python 3 编

    2024年02月06日
    浏览(50)
  • AI绘画做儿童故事账号爆款思路

    你好 还是老规矩,AI写的爽文放在第二篇里面,这个部分直到我写满50篇才会公布AI写小说的完整逻辑。 AI绘画的变现是不少设计师很头疼的一个点,很多人的账号点赞和粉丝都不小,但是粉丝人群很杂,这种账号即使做起来,最大的价值就是收徒卖教程,这种卖一个少一个,

    2024年04月26日
    浏览(36)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包