OpenAI Embedding:基于人工智能的搜索新篇章

这篇具有很好参考价值的文章主要介绍了OpenAI Embedding:基于人工智能的搜索新篇章。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


theme: orange

本文正在参加「金石计划」

Embedding模型在许多应用场景中都有广泛的应用。在OpenAI中,文本嵌入技术主要用于衡量文本字符串之间的相关性。

什么是Embedding

嵌入(Embeddings)是一种将离散变量表示为连续向量的方法。它在机器学习中起到了不可或缺的作用。例如,在机器翻译中的词嵌入和分类变量中的实体嵌入都是嵌入的成功应用。

OpenAI Embedding:基于人工智能的搜索新篇章

嵌入的本质是“压缩”,用较低维度的k维特征去描述有冗余信息的较高维度的n维特征,也可以叫用较低维度的k维空间去描述较高维度的n维空间。在思想上,与线性代数的主成分分析PCA,奇异值分解SVD异曲同工,事实上,PCA和SVD也可以叫做Embedding方法。

OpenAI 早先提供了第一代模型(在模型ID中用-001表示),包括text-similarity-davinci-001和davinci-001嵌入等等,而后在2022年12月将嵌入模型更新为text-embedding-ada-002(在模型ID中用-002表示)。新模型拥有较小的嵌入大小,新嵌入只有1536维,并且提供:

  • 价格降低了90%-99.8%
  • 嵌入维度大小减少了1/8,降低了向量数据库成本
  • 端点统一,便于使用
  • 在文本搜索、代码搜索和句子相似性方面具有最先进的性能
  • 上下文窗口从2048增加到8192

总的来说,建议对几乎所有用例使用text-embedding-ada-002。它更好,更便宜,更简单使用。

Embedding 应用场景

Embedding模型在许多应用场景中都有广泛的应用。在OpenAI中,文本嵌入技术主要用于衡量文本字符串之间的相关性。以下是一些常见的应用场景: 

  1. 搜索(Search):根据与查询字符串的相关性对搜索结果进行排序。
  2. 聚类(Clustering):将文本字符串按照相似性进行分组。
  3. 推荐(Recommendations):推荐与给定文本字符串相关的项目。
  4. 异常检测(Anomaly Detection):识别与其他文本字符串相关性较低的异常值。
  5. 多样性测量(Diversity Measurement):分析文本字符串之间相似性的分布。
  6. 分类(Classification):根据文本字符串与各标签的相似性进行分类。 

嵌入模型将文本字符串转换为浮点数向量(列表),向量之间的距离衡量它们的相关性。较小的距离表示高相关性,而较大的距离表示低相关性。 

需要特别注意的是,Embedding模型是基于包含一些关于现实世界事件的信息的数据集进行训练的,直到2020年8月为止。您需要处理涉及最近事件的任务,模型可能无法表现出最佳效果。

下面是一种常见的应用场景,将知识数据通过嵌入模型查询出向量,并映射保存,然后在应用时将问题也转换成嵌入式,通过相似度算法(比如余弦相似度)对比前期保存的向量,找出TopN的数据,即得到与问题最关联的内容。

OpenAI Embedding:基于人工智能的搜索新篇章


接下来的文章,我将通过代码构建一个基于OpenAI 嵌入(Embeddings)模型实现的应用场景,请持续关注!文章来源地址https://www.toymoban.com/news/detail-442459.html

到了这里,关于OpenAI Embedding:基于人工智能的搜索新篇章的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • AI+低代码:开启普惠人工智能时代的新篇章

    🌷🍁 博主猫头虎 带您 Go to New World.✨🍁 🦄 博客首页——猫头虎的博客🎐 🐳《面试题大全专栏》 文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~🌺 🌊 《IDEA开发秘籍专栏》学会IDEA常用操作,工作效率翻倍~💐 🌊 《100天精通Golang(基础入门篇)》学会Golang语言

    2024年02月15日
    浏览(43)
  • 实在智能RPA亮相2023全球人工智能技术博览会,“能对话的数字员工”引领智能自动化新篇章

    随着ChatGPT火爆全网,人工智能再次成为学术界和科技领域“新宠”,一场“智能革命”的序幕悄然掀开。 6月13日,“智能驱动 砥砺前行”为主题的2023全球人工智能技术博览会在杭州未来科技城学术交流中心圆满落下帷幕。此次博览会以展示智能科技创新前沿为目标,集合了

    2024年02月10日
    浏览(61)
  • 人工智能的新篇章:深入了解大型语言模型(LLM)的应用与前景

    项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域) :汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用 CSDN 平台,自主完成项目设计升级,提升自

    2024年02月04日
    浏览(54)
  • ChatGPT——OpenAI推出的人工智能聊天机器人

    ChatGPT——OpenAI推出的人工智能聊天机器人 [ 编辑] ChatGPT 全称为“chat Generative Pre-trained Transformer”,翻译成中文就是生成型预训练变换模型。它是美国公司OpenAI在2022年11月30日发布研发的聊天机器人程序,能用于问答、文本摘要生成、机器翻译、分类、代码生成和对话AI。 [1

    2024年02月04日
    浏览(69)
  • OpenAI的人工智能语音识别模型Whisper详解及使用

            拥有ChatGPT语言模型的OpenAI公司,开源了 Whisper 自动语音识别系统,OpenAI 强调 Whisper 的语音识别能力已达到人类水准。         Whisper是一个通用的语音识别模型,它使用了大量的多语言和多任务的监督数据来训练,能够在英语语音识别上达到接近人类水平的鲁

    2024年02月09日
    浏览(44)
  • 怎么获取OpenAI的api-key【人工智能】

    2024-4-11 11:32:06 以下内容源自《【人工智能】》 仅供学习交流使用 禁止其他平台发布时删除以下此话 本文首次发布于CSDN平台 作者是CSDN@日星月云 博客主页是https://jsss-1.blog.csdn.net 禁止其他平台发布时删除以上此话 小白如何设置openai api key的环境变量 https://platform.openai.com/do

    2024年04月27日
    浏览(44)
  • 搭建Gpt OpenAI 人工智能写作助手和内容创SaaS系统

    该源码是一个SaaS平台,允许你的用户使用OpenAI人工智能技术来生成独特的内容和图像。它可以生成新的无抄袭内容,并以多种语言改进现有内容。用户还可以通过OpenAI DALL-E和稳定扩散,通过描述图像来生成图像。用户还可以通过OpenAi Whisper模型,用语音转文本功能创建音频和

    2024年02月15日
    浏览(47)
  • OpenAI的新语言模型升级是否会改变人工智能领域的格局?

    近年来,人工智能领域取得了巨大的进展,其中语言模型的发展尤为引人注目。而在这个领域的重要参与者之一,OpenAI近期宣布了其大型语言模型API的重大升级,引发了业界的广泛关注。随着GPT-4和gpt-3.5-turbo等新版本的推出,一个重要的问题浮现:OpenAI的新语言模型升级是否

    2024年02月13日
    浏览(42)
  • 探索OpenAI-Unity:融合人工智能与游戏开发的新纪元

    项目地址:https://gitcode.com/srcnalt/OpenAI-Unity OpenAI-Unity 是一个激动人心的开源项目,它将OpenAI Gym的机器学习环境与Unity游戏引擎相结合,为开发者和研究者提供了一个在虚拟世界中训练和测试人工智能模型的强大平台。通过这个项目,您可以利用Unity的强大图形渲染能力和物理模

    2024年04月28日
    浏览(41)
  • 人工智能在法律智能搜索中的应用

    作者:禅与计算机程序设计艺术 《人工智能在法律智能搜索中的应用》 1.1. 背景介绍 随着人工智能技术的快速发展,自然语言处理、机器学习、深度学习等技术已经在人们的生活中发挥了越来越重要的作用。在法律领域,人工智能技术可以高效地帮助律师和法律从业人员进

    2024年02月09日
    浏览(58)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包