万万没想到,我用文心一言开发了一个儿童小玩具

这篇具有很好参考价值的文章主要介绍了万万没想到,我用文心一言开发了一个儿童小玩具。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

最近关注到一年一度的百度世界大会今年将于10月17日在北京首钢园举办,本期大会的主题是“生成未来(PROMPT THE WORLD)”。会上,李彦宏会做主题为「手把手教你做AI原生应用」的演讲,比较期待 Robin 会怎么展示。据说,大会当天百度还会发布文心4.0版本,估计要炸一波街。

万万没想到,我用文心一言开发了一个儿童小玩具,人工智能,百度大模型,文心一言,千帆大模型,语音识别,图像识别,游戏,文心4.0,原力计划

作为一名对人工智能技术深感兴趣的开发者,我相信这次大会将带来各种新颖的想法和独特的观点,激发参会者们探索AI技术更广阔应用场景的热情。也很期待从李彦宏和其他嘉宾的分享中汲取灵感并拓宽视野,进一步认识到AI技术带给我们的巨大机遇。

想法由来

文心大模型覆盖了很多AI应用场景,有NLP大模型、CV大模型、跨模态大模型等等。今年3月,百度发布了大模型服务平台文心千帆,纳入管理包括文心大模型在内的国内外主流大模型,对于除文心大模型之外的第三方大模型,千帆平台不只是简单的接入,还提供中文增强、性能增强、上下文增强等能力。比如,原来要用英文对话效果才好的 Llama2 等国外大模型,现在用中文也一样好。

看到文心提供的强大功能,感觉不做点什么都觉得对不起它。想到最近工作比较忙,没时间陪伴自己的女儿,她现在正是需要益智小游戏的年龄段,于是就有了开发一款适用于婴幼儿的【看图语音识别】小游戏的创意。

实现流程构想

  • 程序弹出小动物的图片;
  • 孩子发出“小动物名字”的语音;
  • 程序识别语音并告知孩子是否回答正确;
  • 正确则切换下一张图片,错误则告知孩子请重新作答;

小游戏应用实现流程

准备工作:SDK安装及使用流程

(1)安装SDK

pip install qianfan

这里需要注意:目前支持 Python >= 3.7版本。且调用SDK前,需确保已完成SDK安装。

(2)调用SDK(具体操作步骤)

  • 步骤一,在百度千帆大模型平台创建应用,获取应用API Key(AK) 和 Secret Key(SK)。
  • 步骤二,初始化AK 和 SK。
  • 步骤三,调用SDK。

第一步,随机展示动物图片

我们先搜集几张不同的动物图片,然后用动物的名字来命名,将它们放在程序的固定路径下。

from PIL import Image
import os
import random

# 指定图片文件夹路径
img_folder = "path/to/image/folder"

# 获取图片列表
img_list = os.listdir(img_folder)

# 从列表中随机选择一张图片
img_name = random.choice(img_list)

# 打开并显示选中的图片
img_path = os.path.join(img_folder, img_name)
img = Image.open(img_path)
img.show()

万万没想到,我用文心一言开发了一个儿童小玩具,人工智能,百度大模型,文心一言,千帆大模型,语音识别,图像识别,游戏,文心4.0,原力计划

第二步,完成图像识别

首先通过应用的API_KEY和SECRET_KEY 获取应用的 access_token。

def get_access_token():
    # 使用 AK,SK 生成鉴权签名(Access Token)
    # return: access_token,或是None(如果错误)
    url = "https://aip.baidubce.com/oauth/2.0/token"
    params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}
    return str(requests.post(url, params=params).json().get("access_token"))

然后根据图片获取到对应的base64编码:

def get_file_content_as_base64(path, urlencoded=False):
   
    # 获取文件base64编码
    # :param path: 文件路径
    # :param urlencoded: 是否对结果进行urlencoded
    # :return: base64编码信息
  
    with open(path, "rb") as f:
        content = base64.b64encode(f.read()).decode("utf8")
        if urlencoded:
            content = urllib.parse.quote_plus(content)
    return content

最后调用图片识别接口,获取图片识别的动物名称

def get_result():

   url = "https://aip.baidubce.com/rest/2.0/image-classify/v1/animal?access_token=" + get_access_token()

   # 获取图片的base64编码
   payload= get_file_content_as_base64("C://path//to//image//folder//斑马.jpg",True)
   headers = {
       'Content-Type': 'application/x-www-form-urlencoded',
       'Accept': 'application/json'
   }

   response = requests.request("POST", url, headers=headers, data=payload)

   print(response.text)

打印结果如下,返回结果对应不同score,我们取score最高的作为返回结果即“斑马”。

{
    "result": [
        {
            "score": "0.948385",
            "name": "斑马"
        },
        {
            "score": "0.0410539",
            "name": "平原斑马"
        },
        {
            "score": "0.00519192",
            "name": "细纹斑马"
        },
        {
            "score": "0.000554136",
            "name": "斑马驴"
        },
        {
            "score": "0.000273289",
            "name": "斑驴"
        },
        {
            "score": "0.000155838",
            "name": "孟加拉虎"
        }
    ],
    "log_id": "1710925525288202877"
}

第三步,识别小朋友的语音

万万没想到,我用文心一言开发了一个儿童小玩具,人工智能,百度大模型,文心一言,千帆大模型,语音识别,图像识别,游戏,文心4.0,原力计划
在孩子看到图片之后用语音的方式说出动物的名字,此时我们需要将孩子的语音文件进行 base64 转码处理。

def get_file_content_as_base64(path, urlencoded=False):
    
    # 获取文件base64编码
    # :param path: 文件路径
    # :param urlencoded: 是否对结果进行urlencoded
    # :return: base64编码信息
   
    with open(path, "rb") as f:
        content = base64.b64encode(f.read()).decode("utf8")
        if urlencoded:
            content = urllib.parse.quote_plus(content)
    return content

然后需要将该语音文件转化为文本:

def get_text():
    url = "https://vop.baidu.com/server_api"
    speech = get_file_content_as_base64("C://path//to//image//folder//banma.m4a",False)
    payload = json.dumps({
        "format": "pcm",
        "rate": 16000,
        "channel": 1,
        "cuid": "0kGgQCWS6F1A7lYR5sBQCVT3Id4TsEY4",
        "token": get_access_token(),
        "speech": speech,
        "len": 36414
    })
    headers = {
        'Content-Type': 'application/json',
        'Accept': 'application/json'
    }
    response = requests.request("POST", url, headers=headers, data=payload)
    print(response.text)

打印结果如下,我们根据返回的结果将 result 中的数据取出来,即“斑马”。

{
    "corpus_no": "7287496064443398818",
    "err_msg": "success.",
    "err_no": 0,
    "result": [
        "斑马"
    ],
    "sn": "928281938221696752399"
}

最后就需要我们把“通过图像识别出来的文字”和“通过语音识别出来的文字”进行比对,如果一致就切换下一张图片,不一致则告知孩子请重新作答。

到这儿,我的创意就全部实现了,虽然只是简单的软件层面的实现,但是我希望以后儿童玩具厂商可以把它来最终落地,毕竟这种AI原生应用小玩具肯定会广受儿童喜欢的。它到底是“斑马”还是“马”呢?让程序告诉小朋友吧。

最后多啰嗦几句,很期待在百度世界大会上看到更多的AI原生应用,包括智能家居、智能医疗、智能零售、智能交通等领域的创新应用。这些应用将有望在未来实现更好的人机交互、智能化的自动化流程、个性化的服务和体验,推动产业升级和社会进步。同时,我们也期待看到更多企业和开发者加入到AI原生应用的创新行列中,共同推动人工智能技术向前发展。文章来源地址https://www.toymoban.com/news/detail-712791.html

到了这里,关于万万没想到,我用文心一言开发了一个儿童小玩具的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 没想到还有这种骚操作~如何使用Golang实现无头浏览器截图?

    在Web开发中,有时需要对网页进行截图,以便进行页面预览、测试等操作。 而使用无头浏览器来实现截图功能,可以避免手动操作的繁琐和不稳定性。 这篇文章将介绍: 使用Golang进行无头浏览器的截图,轻松实现页面预览、测试和模拟用户操作。 这篇文章发完,有朋友在朋

    2024年02月05日
    浏览(49)
  • 真没想到啊!无需服务器,五分钟部署公众号机器人

    大家好,我是编程哥。一个寻求破圈,不断淬炼自己的人,关注我一起进步。 目前各大模型都比较火,作为一名程序员,对大模型的了解也是蠢蠢欲动,尤其是对于机器人自动问答这一项。所以在朋友的推荐下,了解了一个无需服务器,快速搭建公众号机器人的教程,现在分

    2024年02月03日
    浏览(36)
  • 没想到,JDBC 驱动会偷偷修改 sql_mode 的会话值

    最近碰到一个 case,值得分享一下。 现象就是一个 update 操作,在 mysql 客户端中执行提示 warning,但在 java 程序中执行却又报错。 update 语句中使用 STR_TO_DATE 函数将字符串转换为日期时间格式。 但因为这个格式字符串 \\\'%Y-%m-%d %H:%i:%s\\\' 没有对日期字符串中的毫秒部分 .0 进行解析

    2024年03月09日
    浏览(40)
  • 作为所有类的顶层父类,没想到Object的魔力如此之大!

    在上一篇博文中我们提到了Java面向对象的四大特性,其中谈及“抽象”特性时做了一个引子,引出今天的主人公Object,作为所有类的顶级父类,Object被视为是James.Gosling的哲学思考,它高度概括了事务的自然与社会行为。 跟进Object类的源码中我们可以看到,类的注释中对它做

    2024年02月01日
    浏览(39)
  • 5年测试经验怎么着我也能要个20K吧?没想到被阿里P8问傻了

    都说金三银四是跳槽涨薪季,我也是着急忙慌的准备简历—— 5年软件测试经验,可独立测试大型产品项目,熟悉项目测试流程…薪资要求?5年测试经验起码能要个20K吧? 我加班肝了一页半简历,投出去一周,面试电话倒是不少,自信满满去面试,现场被问了这么几个问题—

    2024年02月08日
    浏览(45)
  • 5年测试经验怎么着我也能要个20K吧?没想到被阿里P8问傻了····

    都说金三银四是跳槽涨薪季,我也是着急忙慌的准备简历—— 5年软件测试经验,可独立测试大型产品项目,熟悉项目测试流程…薪资要求?5年测试经验起码能要个20K吧? 我加班肝了一页半简历,投出去一周,面试电话倒是不少,自信满满去面试,现场被问了这么几个问题—

    2024年02月08日
    浏览(41)
  • [链表OJ题 8] 用栈实现队列,没想到你小子的基础这么好,这么快就做对了

    目录 题目来源: 代码实现: 思路分析: 实现过程: 力扣 - 232.用栈实现队列 题目描述: 我们这里的栈已经写好了,如果对栈还不是很懂的可以看看这篇文章:CSDN - [数据结构 -- C语言] 栈(stack) 我们知道 队列的特性:先入先出;栈的特性:先入后出。 因此我们定义两个栈

    2024年02月06日
    浏览(73)
  • 如何用文心一言开发前端代码

    随着chatGPT的火爆,大家越来越认识到到语言大模型的潜力,国内的类chatGPT的生成式语言大模型(LLM)也如雨后春笋般冒出来。 如今大家都在探索各种prompt的技巧,其实从我个人看来,LLM其实也是一种检索模型,只不过它的检索粒度更加细致,更加语义化,尽管如此,现如今

    2024年02月12日
    浏览(40)
  • 文心一言插件开发全流程,ERNIE-Bot-SDK可以调用文心一言的能力

    2023年8月31日, 文心一言 率先向全社会全面开放。 随之而来的便是向开发者开放 插件 生态。 如果说文心一言是一个智能中枢大脑,插件就是文心一言的耳、目、手。插件将“文心一言”AI能力与外部应用相结合,既能丰富大模型的能力和应用场景,也能利用大模型的生成能

    2024年02月09日
    浏览(129)
  • 文心一言大模型应用开发入门

    本文原创作者:谷哥的小弟 作者博客地址:http://blog.csdn.net/lfdfhl 今天,项目甲方问我要一个电子签名;公司美工又休假。没办法,只好自己做一个啰。 尝试了几个地方工具,最好用最方便的是520transform;链接如下: http://www.520transform.cn/ 如果不使用第三方工具,需要自己开

    2024年02月04日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包