文心一言4 测评

这篇具有很好参考价值的文章主要介绍了文心一言4 测评。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

中文语句理解

其他广泛使用的大语言模型(如ChatGPT)在复杂的中文语句理解上存在一些问题,例如一词多义等。以下使用若干样例对文心一言的中文语句理解能力进行测试。

“我一把把把把住了”

文心一言4 测评,文心一言,人工智能
可以看出,文心一言不仅能够准确理解其中每个“把”字的含义,甚至了解这句话本身已经成为了一个“一词多义”带有幽默感的特殊情况。

“别别别的”

文心一言4 测评,文心一言,人工智能
可以看出其同样给出了准确的回答。

藏头诗

可以看出其完成了藏头诗的格式,且诗的内容非常符合藏头的内容
文心一言4 测评,文心一言,人工智能

文案策划

组会汇报文档

文心一言4 测评,文心一言,人工智能
文心一言4 测评,文心一言,人工智能
文心一言4 测评,文心一言,人工智能
文心一言4 测评,文心一言,人工智能
文心一言4 测评,文心一言,人工智能
可以看到,文心一言的回答满足了提出的要求,且通过多轮对话变更要求时,它也可以对回答做出对应的更改。

视频文案

文心一言4 测评,文心一言,人工智能
文心一言4 测评,文心一言,人工智能

可以看到,在编写视频文案时,文心一言可以很好地对视频内容进行安排,同时也能理解视频的主题,并可以详细地给出视频的流程。

课程大纲设计

C++考点设计

文心一言4 测评,文心一言,人工智能
文心一言4 测评,文心一言,人工智能
文心一言4 测评,文心一言,人工智能

在给出章节名称时,文心一言可以很好地理解对应的课程内容,还能给出该课程的重点难点,并根据考点展示对应的例题。

人工智能引论

文心一言4 测评,文心一言,人工智能文心一言4 测评,文心一言,人工智能文心一言4 测评,文心一言,人工智能文心一言4 测评,文心一言,人工智能文心一言4 测评,文心一言,人工智能文心一言4 测评,文心一言,人工智能文心一言4 测评,文心一言,人工智能文心一言4 测评,文心一言,人工智能文心一言4 测评,文心一言,人工智能文心一言4 测评,文心一言,人工智能文心一言4 测评,文心一言,人工智能文心一言4 测评,文心一言,人工智能

可以看到,文心一言可以理解提出的课程“人工智能引论”的主题,同时可以结合课程需要生成初步的课程大纲;当我们提出具体要求时,它可以及时进行反馈;但当我们给出的要求较为开放时,如将两个大纲进行综合时,它的表现较为一般。

生活场景

旅游计划

文心一言4 测评,文心一言,人工智能
文心一言4 测评,文心一言,人工智能文心一言4 测评,文心一言,人工智能
文心一言4 测评,文心一言,人工智能文心一言4 测评,文心一言,人工智能

在进行杭州7日游的安排时,文心一言给出的初版答案基本涵盖了杭州的著名景点,美中不足的是第五天的断桥和白堤都在西湖,可归入第一天下午的安排中;我们也可以假设旅途会出现某些特殊情况,从上述的例子中可以看出,针对这些特殊情况,文心一言都能给出不错的应对措施。

代码生成与分析

样例1:python多进程程序

对话及生成的代码如下。整体来说生成的内容还是可以的,主要思路没错,也可以跑通

  • 问题1:请编写一个python多进程程序,来处理列表中的1000个样本。每个样本都经过func()函数处理,返回值为处理之后的样本。要求将处理后的样本放到列表中。请提供完整的程序,然后在下面进行解释。其生成的代码如下
import multiprocessing  
  ''
# 定义处理函数  
def func(x):  
    return x * 2  
  
if __name__ == '__main__':  
    # 创建包含1000个样本的列表  
    samples = list(range(1000))  
  
    # 创建进程池  
    pool = multiprocessing.Pool()  
  
    # 使用map函数将处理函数应用到每个样本上  
    processed_samples = pool.map(func, samples)  
  
    # 关闭进程池  
    pool.close()  
  
    # 等待所有进程完成  
    pool.join()  
  
    # 输出处理后的样本列表  
    print(processed_samples)
  • 问题2:很好,你做的很对。但是我现在需要一个进度条来显示处理数据的情况,请修改以上代码来完成这个功能。其生成的代码如下

import multiprocessing  
from tqdm import tqdm  
  
# 定义处理函数  
def func(x):  
    return x * 2  
  
if __name__ == '__main__':  
    # 创建包含1000个样本的列表  
    samples = list(range(1000))  
  
    # 创建进程池  
    pool = multiprocessing.Pool()  
  
    # 使用map函数将处理函数应用到每个样本上,并使用tqdm显示进度条  
    processed_samples = list(tqdm(pool.imap(func, samples), total=len(samples)))  
  
    # 关闭进程池  
    pool.close()  
  
    # 等待所有进程完成  
    pool.join()  
  
    # 输出处理后的样本列表  
    print(processed_samples)
  • 问题3:我想用32个进程来进行并行操作。其生成的代码如下
import multiprocessing  
from tqdm import tqdm  
  
# 定义处理函数  
def func(x):  
    return x * 2  
  
if __name__ == '__main__':  
    # 创建包含1000个样本的列表  
    samples = list(range(1000))  
  
    # 创建进程池,并指定进程数量为32  
    pool = multiprocessing.Pool(processes=32)  
  
    # 使用map函数将处理函数应用到每个样本上,并使用tqdm显示进度条  
    processed_samples = list(tqdm(pool.imap(func, samples), total=len(samples)))  
  
    # 关闭进程池  
    pool.close()  
  
    # 等待所有进程完成  
    pool.join()  
  
    # 输出处理后的样本列表  
    print(processed_samples)

样例2:数据处理程序分析

  • 问题:作为资深算法工程师,请解释以下代码。
while image_token_indices.numel() > 0:
    cur_image_features = image_features[cur_image_idx]
    image_token_start = image_token_indices[0]
    if getattr(self.config, 'tune_mm_mlp_adapter', False) and getattr(self.config, 'mm_use_im_start_end', False):
        cur_new_input_embeds.append(self.get_model().embed_tokens(cur_input_ids[:image_token_start-1]).detach())
        cur_new_input_embeds.append(self.get_model().embed_tokens(cur_input_ids[image_token_start-1:image_token_start]))
        cur_new_input_embeds.append(cur_image_features)
        cur_new_input_embeds.append(self.get_model().embed_tokens(cur_input_ids[image_token_start+1:image_token_start+2]))
        if labels is not None:
            cur_new_labels.append(cur_labels[:image_token_start])
            cur_new_labels.append(torch.full((cur_image_features.shape[0],), IGNORE_INDEX, device=labels.device, dtype=labels.dtype))
            cur_new_labels.append(cur_labels[image_token_start:image_token_start+1])
            cur_labels = cur_labels[image_token_start+2:]
    else:
        cur_new_input_embeds.append(self.get_model().embed_tokens(cur_input_ids[:image_token_start]))
        cur_new_input_embeds.append(cur_image_features)
        if labels is not None:
            cur_new_labels.append(cur_labels[:image_token_start])
            cur_new_labels.append(torch.full((cur_image_features.shape[0],), IGNORE_INDEX, device=labels.device, dtype=labels.dtype))
            cur_labels = cur_labels[image_token_start+1:]
    cur_image_idx += 1
    if getattr(self.config, 'tune_mm_mlp_adapter', False) and getattr(self.config, 'mm_use_im_start_end', False):
        cur_input_ids = cur_input_ids[image_token_start+2:]
    else:
        cur_input_ids = cur_input_ids[image_token_start+1:]
    image_token_indices = torch.where(cur_input_ids == IMAGE_TOKEN_INDEX)[0]
  • 文心一言回答如下

这段代码似乎是处理多模态数据(例如文本和图像)的一部分,特别是在文本和图像嵌入的结合中。以下是对代码的详细解释:

  1. 初始化:
    - image_token_indices 似乎是一个包含图像令牌索引的张量。
    - image_features 可能是从某种图像模型中提取的图像特征。
    - cur_image_idx 是当前处理的图像的索引。
    - cur_input_ids 是当前输入(可能是文本)的令牌ID。
    - cur_new_input_embeds 是一个列表,用于存储新的输入嵌入,其中包括文本和图像嵌入。
    - cur_new_labels 是一个列表,用于存储与 cur_new_input_embeds 对应的标签。
    - labels 是输入的标签。
    - IGNORE_INDEX 是一个特定的索引值,可能用于在标签中标记要忽略的位置。
    2. 主循环:
    这段代码使用 while 循环遍历所有的图像令牌索引。在每次迭代中,它都会处理一个图像令牌及其周围的文本令牌。
    3. 获取当前图像特征:
    cur_image_features = image_features[cur_image_idx]
    这行代码从 image_features 中获取当前图像的特征。
    4. 处理配置选项:
    代码中有两个配置选项 tune_mm_mlp_adapter 和 mm_use_im_start_end,它们似乎控制如何处理图像令牌周围的文本令牌。
    1. 构建新的输入嵌入:
    根据配置选项的值,代码将文本令牌嵌入和图像特征嵌入组合到 cur_new_input_embeds 中。如果启用了上述配置选项,代码会更细致地处理图像令牌前后的文本令牌。
    2. 处理标签:
    如果提供了标签,代码会相应地调整它们,为新的输入嵌入生成新的标签列表 cur_new_labels。对于图像令牌的位置,它使用 IGNORE_INDEX 标记。
    3. 更新索引和令牌:
    在处理完一个图像令牌后,代码会更新 cur_image_idx、cur_input_ids 和 image_token_indices 以进行下一次迭代。
    4. 结束条件:
    循环会一直执行,直到没有更多的图像令牌要处理(即 image_token_indices.numel() > 0 为假)。
    总之,这段代码的主要目的是将文本令牌嵌入和图像特征嵌入组合成一个统一的输入序列,同时相应地调整标签。这种处理对于多模态任务(如视觉问答、图像标注等)是非常有用的。

图像理解

样例1:太阳图像

文心一言4 测评,文心一言,人工智能
从上述样例中可以发现,文心一言对自然图像的具有不错的理解能力,且可以生成详尽的图像描述,也能对图片的内容进行分析,完成一些针对图像的问答。不过对于较为专业的问题(例如是否有太阳活动),其仍缺乏对应专业知识。

样例2:军火铺

文心一言4 测评,文心一言,人工智能

文心一言4 测评,文心一言,人工智能

这是一张讽刺俄乌战争的漫画图,可以看到,文心一言很好地理解了漫画的主题,即“战争”,以及图上涉及的三个国家——美国、俄罗斯和乌克兰,它对漫画寓意的理解也十分透彻。

样例3:召回率

文心一言4 测评,文心一言,人工智能

文心一言4 测评,文心一言,人工智能

可以看到,文心一言可以很好地理解图像横坐标以及纵坐标的含义,同时也能根据曲线的变化趋势描述查全率和查准率之间的关系。

图像生成

样例1:超现实主义

文心一言4 测评,文心一言,人工智能

可以看到,文心一言具备基础的绘图能力,它可以理解画面中应该出现的主要元素,即“鸟”、“时钟”、“树枝”、“荒漠”、“天空”,但它对位置信息的理解有些许偏差。

样例2:离离原上草

文心一言4 测评,文心一言,人工智能

这个例子难度较大,文心一言也是可以理解画面中的主要元素,即“草”,但它对于诗句中后两句的演绎较差,并没有很好地体现“野火”与“春风”这两个元素。

插件(其他功能)

快读插件

快读插件可以通过仅输入网址,提取网页内容的关键词、摘要、大纲以及脑图
文心一言4 测评,文心一言,人工智能
文心一言4 测评,文心一言,人工智能
文心一言4 测评,文心一言,人工智能

AI视频助理

AI视频助理插件可以通过输入视频链接,自动总结视频内容
文心一言4 测评,文心一言,人工智能
文心一言4 测评,文心一言,人工智能

总结

从上述样例中可以看出,文心一言4.0在各个场景中均有出色的表现:它涵盖的知识非常丰富,可以解决多个领域的问题,包括日常生活的需要、学术领域的需要,以及更为关键的代码编程需要;它的对话能力非常强大,用户可以通过与之交流,使文心一言的回答越来越接近用户的实际需要;它也配备了强大的推理能力,对于一些需要理解与思考的问题,文言一心可以进行缜密的分析,得出正确的答案;它还具备一定的图像能力,可以理解部分图表的内容以及主题,同时也可以根据用户的要求直接生成相关图片。

在上面这些例子中,可以发现文言一心在中文语句理解方面有着尤为出色的表现,而国外的一些主流模型在这方面的能力较为欠缺。文言一心的一个美中不足之处为它在图像生成任务上表现平平,并不能生成完全符合描述的图片,这一点可能需要稍加改进。另外,在交互设计上,仍然有不够“丝滑”的地方和不一致的问题,例如网页端无法同时输入图片和文字、app端无法根据指令生成图片等。文章来源地址https://www.toymoban.com/news/detail-768044.html

到了这里,关于文心一言4 测评的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 百度一下文心一言app:探索人工智能的无限可能

    大家好,小发猫降ai今天来聊聊百度一下文心一言app:探索人工智能的无限可能,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 百度一下文心一言app:探索人工智能的无限可能 在数字化浪潮中

    2024年04月12日
    浏览(56)
  • 文心一言APP官网:一站式人工智能体验平台

    大家好,小发猫降ai今天来聊聊文心一言APP官网:一站式人工智能体验平台,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 文心一言APP官网:一站式人工智能体验平台 在当今数字化时代,人工

    2024年03月14日
    浏览(58)
  • 和AI人工智能快乐玩耍,拿到文心一言内测,试验一下~

    问: ChatGPT和早先的人工智能概念有什么不同呢? ChatGPT: ChatGPT使用的是GPT-3.5等先进的人工智能技术,与早先的人工智能概念存在很大的不同。 早期的人工智能技术主要还是基于规则、逻辑推理、决策树、人工神经网络等方式,由程序员或专家知识库直接编写程序来完成各

    2024年02月09日
    浏览(54)
  • 文心一言网页版:探索人工智能边界的全方位指南

    大家好,小发猫降ai今天来聊聊文心一言网页版:探索人工智能边界的全方位指南,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 文心一言网页版:探索人工智能边界的全方位指南 在数字化时

    2024年03月16日
    浏览(94)
  • ChatGPT与文心一言:人工智能技术在商业领域的应用探究

    人工智能技术的发展为商业领域的创新和应用带来了重大的机遇和挑战。本文将围绕聊天生成语言模型ChatGPT和短文本生成AI模型文心一言,分析其在商业领域中的应用场景和商业价值,并讨论中国版ChatGPT在未来的发展前景。 :人工智能技术、商业领域、ChatGPT、文心一

    2023年04月26日
    浏览(99)
  • 用友大易接入百度文心一言,打造数智招聘人工智能全新服务

    近日, 用友大易宣布与百度文心一言(英文名:ERNIE Bot)达成战略生态合作。后续,用友大易智能招聘云将全面接入文心一言的能力,持续探索新人工智能时代下的招聘服务与体验。 文心一言(英文名:ERNIE Bot)是百度基于文心大模型技术推出的生成式对话产品。百度在人

    2024年02月04日
    浏览(47)
  • 文心一言与中国版ChatGPT在人工智能市场中的发展前景

    【摘要】 近年来,中国的人工智能领域发展迅速,越来越多的企业开始涉足人工智能领域,希望能够在这个领域中占据一定的市场份额。在这个背景下,像文心一言这样的人工智能产品更是备受关注,因为它们不仅可以帮助用户提升写作效率,还可以为企业带来商业机会。

    2024年02月13日
    浏览(49)
  • 人工智能AI大战:BARD、ChatGPT、Bing和文心一言谁更具有优势?

    首先在开始对比之前我首先要吐槽,不管是bard还是百度的AI现在都得等待候补,也就是排队,所以目前只能无限期等待下去,但是第一批用户已经在查通过平台上遨游了好几个月了,从商业的角度来看,几个月或许不长,但是足以失去了超过80%的用户,所以chatgpt目前可以独占

    2023年04月24日
    浏览(60)
  • 人工智能帮我建商城——文心一言代写基于jeecgboot的商城系统【springboot】

    如果大家有什么意见,可以评论区讨论 本篇文章是一个新坑,主要针对商城进行框架设计,时间跨度可能需要3个月,(实际可能需要3年左右)。 我将不断对其进行完善,框架内容我会酌情放在gitee上,我会尽力采用我目前所有的技术完成它。 后端:jeecgboot(springboot、redi

    2024年02月03日
    浏览(70)
  • 除了chatGPT网站外,国内有些可以使用的AI网站 文心一言 讯飞星火 豆包 通义千问 人工智能网站 AI网站

    2023年随着人工智能技术的不断发展,AI网站如ChatGPT等越来越受到人们的关注。这些网站具有多种作用,可以帮助人们更方便地获取信息、解决问题,甚至进行创作。 首先,AI网站可以提供智能问答服务。与传统的搜索引擎相比,AI网站能够更好地理解用户的问题,并提供更为

    2024年02月04日
    浏览(91)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包