Vector Search with OpenAI Embeddings: Lucene Is All You Need

1年前作者：UnknownBody分类：Toy博客阅读(10)违法举报

这篇具有很好参考价值的文章主要介绍了Vector Search with OpenAI Embeddings: Lucene Is All You Need。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

本文是LLM系列文章，针对《Vector Search with OpenAI Embeddings: Lucene Is All You Need》的翻译。

摘要

我们在流行的MS MARCO文章排名测试集上使用Lucene提供了一个可复制的、端到端的OpenAI嵌入向量搜索演示。我们工作的主要目标是挑战主流的说法，即专用向量存储是利用深度神经网络应用于搜索的最新进展所必需的。恰恰相反，我们表明Lucene中的分层可导航小世界网络（HNSW）索引足以在标准双编码器架构中提供向量搜索功能。这表明，从简单的成本效益分析来看，似乎没有令人信服的理由将专用向量存储引入现代“人工智能堆栈”中进行搜索，因为这些应用程序已经在现有的、广泛部署的基础设施中获得了大量投资。

1 引言

2 从架构到实现

3 实验

4 讨论

5 结论

毫无疑问，密集向量的操作是当今搜索的重要组成部分。我们要解决的核心争论是如何在生产系统中实施和部署这些功能。主流的说法是，你需要一个新的、独特的添加到你的企业“AI堆栈”中——一个向量存储。我们提出的另一种选择是：如果你已经构建了搜索应用程序，那么你很可能已经投资于Lucene生态系统。在这种情况下，Lucene就是您所需要的全部。当然，时间会告诉我们谁是对的。文章来源地址https://www.toymoban.com/news/detail-687095.html

到了这里，关于Vector Search with OpenAI Embeddings: Lucene Is All You Need的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

【论文阅读笔记】Attention Is All You Need
这是17年的老论文了，Transformer的出处，刚发布时的应用场景是文字翻译。BLUE是机器翻译任务中常用的一个衡量标准。在此论文之前，序列翻译的主导模型是RNN或者使用编解码器结构的CNN。本文提出的Transformer结构不需要使用循环和卷积结构，是完全基于注意力机制
2024年04月13日
浏览(17)
详细了解Transformer：Attention Is All You Need
在机器翻译任务下，RNN、LSTM、GRU等序列模型在NLP中取得了巨大的成功，但是这些模型的训练是通常沿着输入和输出序列的符号位置进行计算的顺序计算，无法并行。文中提出了名为Transformer的模型架构，完全依赖注意力机制（Attention Mechanisms），构建输入与输出间的依赖关系
2024年02月08日
浏览(8)
大语言模型之一 Attention is all you need ---Transformer
大语言模型已经在很多领域大显身手，其应用包括只能写作、音乐创作、知识问答、聊天、客服、广告文案、论文、新闻、小说创作、润色、会议/文章摘要等等领域。在商业上模型即产品、服务即产品、插件即产品，任何形态的用户可触及的都可以是产品，商业付费一般都是
2024年02月12日
浏览(9)
【Transformer开山之作】Attention is all you need原文解读
Attention Is All You Need Transformer原文解读与细节复现在Transformer出现以前，深度学习的基础主流模型可分为卷积神经网络CNN、循环神经网络RNN、图对抗神经网络GAN。而Transformer的横空出世，吸引了越来越多的研究者的关注：Transformer不仅在NLP领域取得了耀眼的成绩，近年来甚至一
2023年04月08日
浏览(9)
P11-Transformer学习1.1-《Attention Is All You Need》
Transformer目录:《Transformer Paper》1.0 CV Transformer必读论文5篇_汉卿HanQ的博客-CSDN博客前文参考:Transformer1.0-预热_汉卿HanQ的博客-CSDN博客全文1w3字左右，按照论文翻译+个人理解精读，如果对你有所帮助，欢迎点个赞哦！目录 Abstract 一.Introduction 二.Background 三.Model Architecture 3.1Enc
2024年02月13日
浏览(9)
翻译: 详细图解Transformer多头自注意力机制 Attention Is All You Need
The Transformer——一个使用注意力来提高这些模型的训练速度的模型。Transformer 在特定任务中的表现优于谷歌神经机器翻译模型。然而，最大的好处来自于 The Transformer 如何使自己适合并行化。事实上，Google Cloud 建议使用 The Transformer 作为参考模型来使用他们的Cloud TPU产品。所
2023年04月08日
浏览(12)
LLM架构自注意力机制Transformers architecture Attention is all you need
使用Transformers架构构建大型语言模型显著提高了自然语言任务的性能，超过了之前的RNNs，并导致了再生能力的爆炸。 Transformers架构的力量在于其学习句子中所有单词的相关性和上下文的能力。不仅仅是您在这里看到的，与它的邻居每个词相邻，而是与句子中的每个其他词。
2024年02月12日
浏览(10)
【深度学习】语义分割：论文阅读（NeurIPS 2021）MaskFormer: per-pixel classification is not all you need
论文：Per-Pixel Classification is Not All You Need for Semantic Segmentation / MaskFormer 代码：代码官方-代码笔记：作者笔记说明【论文笔记】MaskFormer: Per-Pixel Classification is Not All You Need for Semantic Segmentation 总结思路清晰-简洁【MaskFormer】Per-Pixel Classification is Not All You Needfor Semantic Segmenta
2024年02月04日
浏览(11)
【安全】被黑客要挟的一天，All your data is a backed up. You must pay 0.25BTC
【写在前面】All your data is a backed up. You must pay 0.25 BTC to xxxxxx 48 hours for recover it. After 48 hours expiration we will sell all your data on dark markets and the database dump will be dropped from our server! 被黑客盯上的一天，之前自己搭建了一套数据库，今天一看数据表不见了，居然多了一份这个表Z_R
2024年02月15日
浏览(10)
【论文笔记】OpenAI宫斗背后：发现了可能优于小鸡毛表现的机器人，AGI的希望 Q* search and Q transformer(A star search with Q-Learning)
最近OpenAI的宫斗剧上演的精妙绝伦，简直就是《硅谷》+《继承》，强烈推荐这两部剧集。AIGC的群里都在说Q*是揭示AI接近AGI的一篇论文，那就费点时间拨开云雾吧。为了方便大众更好地理解Q*，本人在快速浏览过论文后首先得出此结论公式： Q* = (1992年的
2024年02月05日
浏览(11)