向量数据库

10月前作者：beingstrong 分类：Toy博客阅读(13) 违法举报

这篇具有很好参考价值的文章主要介绍了向量数据库。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

向量数据库可以做哪些事情

存储和索引向量
检索相似向量，还具有过滤功能
自动将文档转变成向量，所以会自动化分词、向量化、索引等操作

目前存在的向量数据库：

名称	github	开源协议
chroma	https://github.com/chroma-core/chroma	Apache 2.0
Milvus	https://github.com/milvus-io/milvus	Apache 2.0
Pinecone	未开源	/
weaviate	https://github.com/weaviate/weaviate	BSD-3-Clause license
qdrant	https://github.com/qdrant/qdrant	Apache 2.0
vespa	https://github.com/vespa-engine/vespa	Apache 2.0
zilliz	基于Milvus的商业版向量数据库	/

其他跟向量数据库相关，严格来说不算向量数据库

Faiss 是一个提供高维向量相似性搜索和聚类的算法库，不算向量数据库，向量数据库的相似性检索可以使用到Faiss中的算法。
ScaNN 是google开源的相似向量搜索方法
vald 是一个可扩展的向量搜索引擎
pgvector 为Postgres 提供向量相似度搜索的库
typesense 可替代ElasticSearch，也有向量搜索功能

对于文本，如何挑选向量类型，可参考比较基准：MTEB: Massive Text Embedding Benchmark

参考资料文章来源地址https://www.toymoban.com/news/detail-464223.html

https://towardsdatascience.com/milvus-pinecone-vespa-weaviate-vald-gsi-what-unites-these-buzz-words-and-what-makes-each-9c65a3bd0696
https://byby.dev/vector-databases
https://platform.openai.com/docs/guides/embeddings/what-are-embeddings

到了这里，关于向量数据库的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

《向量数据库指南》——开源框架NVIDIA Merlin & 向量数据库Milvus

推荐系统 pipeline 中至关重要的一环便是为用户检索并找到最相关的商品。为了实现这一目标，通常会使用低维向量（embedding）表示商品，使用数据库存储及索引数据，最终对数据库中数据进行近似最近邻（ANN）搜索。这些向量表示是通过深度学习模型获取的，而这些深度学习

2024年02月05日
浏览(58)
《向量数据库指南》——AI原生向量数据库Milvus Cloud 2.3新功能

支持用户通过 upsert 接口更新或插入数据。已知限制，自增 id 不支持 upsert；upsert 是内部实现是 delete + insert所以性能上会有一定损耗，如果明确知道是写入数据的场景请继续使用 insert。支持用户通过输入参数指定 search 的 distance 进行查询，返回所有与目标向量距离位于某一

2024年02月09日
浏览(43)
【向量数据库】相似向量检索Faiss数据库的安装及余弦相似度计算（C++）

Faiss 是一个强大的向量相似度搜索库，具有以下优点：高效的搜索性能：Faiss 在处理大规模向量数据时表现出色。它利用了高度优化的索引结构和近似搜索算法，可以快速地执行最近邻搜索和相似度匹配，具有很低的查询延迟。高度可扩展：Faiss 提供了多种索引结构和算法

2024年02月07日
浏览(55)
《向量数据库指南》——腾讯云向量数据库（Tencent Cloud VectorDB） SDK 正式开源

腾讯云向量数据库 SDK 宣布正式开源。根据介绍，腾讯云向量数据库（Tencent Cloud VectorDB）的 Python SDK 与 Java SDK 是基于数据库设计模型，遵循 HTTP 协议，将 API 封装成易于使用的 Python 与 Java 函数或类，为开发者提供了更加友好、更加便捷的数据库使用和管理方式。腾讯云向量

2024年02月10日
浏览(54)
向量数据库：使用Elasticsearch实现向量数据存储与搜索

Here’s the table of contents: Elasticsearch在7.x的版本中支持向量检索。在向量函数的计算过程中，会对所有匹配的文档进行线性扫描。因此，查询预计时间会随着匹配文档的数量线性增长。出于这个原因，建议使用查询参数来限制匹配文档的数量（类似二次查找的逻辑，先使

2024年02月07日
浏览(61)
【大模型向量库】从向量搜索到向量数据库

向量伴随着 AI 模型的发展而发展。向量：AI 理解世界的通用数据形式，是多模态数据的压缩。比如大模型输入输出都是文字文本，但模型实际接触和学习数据是向量化文本。这个步骤叫 Embedding（嵌入），将文字文本转化为保留语义关系的向量文本。 embedding 模型对自然语

2024年02月20日
浏览(41)
《向量数据库指南》——腾讯云向量数据库Tencent Cloud VectorDB产品特性，架构和应用场景

腾讯云向量数据库（Tencent Cloud VectorDB）是一款全托管的自研企业级分布式数据库服务，专用于存储、检索、分析多维向量数据。该数据库支持多种索引类型和相似度计算方法，单索引支持 10 亿级向量规模，可支持百万级 QPS 及毫秒级查询延迟。腾讯云向量数据库不仅能为大模

2024年02月14日
浏览(51)
《向量数据库》——怎么安装向量检索库Faiss？

装 Faiss 以下教程将展示如何在 Linux 系统上安装 Faiss： 1. 安装 Conda。在安装 Faiss 之前，先在系统上安装 Conda。Conda 是一个开源软件包和环境管理系统，可在 Windows、macOS 和 Linux 操作系统上运行。根据以下步骤在 Linux 系统上安装 Conda。 2. 从官网下载 Miniconda 安装包（

2024年02月13日
浏览(37)
向量数据库~milvus

本文主要基于milvus官方的材料外加自己的一些理解整理而来，欢迎交流云原生：存算分离; 读写分离; 增量存量分离; 微服务架构，极致弹性；日志即数据：通过message queue解耦生产者、消费着，降低系统复杂度; 提升index、data、query模块弹性; 流批一体：表和日志二象性；流式

2024年02月03日
浏览(49)
向量数据库:Milvus

Milvus由Go(63.4%),Python(17.0%),C++(16.6%),Shell(1.3%)等语言开发开发，支持python，go，java接口(C++,Rust,c#等语言还在开发中)，支持单机、集群部署，支持CPU、GPU运算。Milvus 中的所有搜索和查询操作都在内存中执行。,当前支持的Dimensions of a vector的最大值为32,768。其他限制。

2024年01月23日
浏览(57)