您可以在此处找到有关 glove100_angular 的更多信息

A comprehensive collection of phone data for research analysis.
Post Reply
suchona.kani.z
Posts: 106
Joined: Sat Dec 21, 2024 6:08 am

您可以在此处找到有关 glove100_angular 的更多信息

Post by suchona.kani.z »

实验在我们的基准测试中,我们测试了 Chroma、Qdrant 和 Weaviate 在使用 GloVe 100 角度数据集加载和检索矢量数据时的性能。该数据集是使用 GloVe 算法作为单词表示获得的 110 万个 100 维向量的集合。


为了测试向量插入性能,将 1,183,514 个 100 维向量以大约 1,000 个向量的批次加载到每个测试基础设施上的每个数据库中。这允许测试数据库快速有效地插入数据的能力。对于涉及大量数据的用例来说,这是一个重要指标。

对于矢量搜索,对加载的数据执行了 10,000 次查询。这是数据库搜索速度的衡量标准,这对于需要为用户查询提供快速结果的应用程序至关重要。

我们测试的基础架构包括三种大小的 Azure 虚拟机 (VM):小型 (S)、中型 (M) 和大型 (L)。每个虚拟机均使用硬盘驱动器 (HDD) 和固态驱动器 (SSD) 进行测试。每个 VM 大小的规格为:


基准测试结果显示 Chroma、Qdrant 和 Weaviate 之间的上传性能存 哥伦比亚 whatsapp 数据​ 在显着差异。 Chroma(单线程)在带有硬盘驱动器 (HDD) 的 S 层虚拟机 (VM) 上实现了 268 分钟的峰值上传时间。在配备固态硬盘 (SSD) 的 L 级计算机上,该时间降至 39 分钟。随着时间的推移,S 层机器的性能会随着堆栈的不同而显着下降,各个堆栈之间的波动特别大。然而,在所有计算机中,与 HDD 相比,Chroma SSD 的性能明显更好。


相比之下,Qdrant 和 Weaviate 都以多线程模式运行,加载时间更快。根据机器级别,Qdrant 的加载时间在 13 到 6 分钟之间变化,而 Weaviate 的加载时间在 30 到 10 分钟之间变化。 Weaviate 的上传性能随着时间的推移保持相对稳定,并且 SSD 和 HDD 使用之间的差异很小。

Qdrant 的与众不同之处在于,由于上传和索引步骤的内部分离,它几乎可以立即批量上传。总体而言,Qdrant 在上传性能方面轻松超越 Weaviate。

查询性能

矢量数据库查询性能基准评估了 10,000 个查询的执行时间,以找到最接近的矢量。观察结果表明,所有测试的系统(Chroma、Weaviate 和 Qdrant)在所有机器级别上都在不到两分钟的时间内完成了任务。

然而,在考虑最短执行时间时,出现了差异。 Chroma 至少需要一分钟,而 Weaviate 至少需要 35 秒。效率最高的是Qdrant,它只用了十秒就完成了任务。

结论
总之,我们对矢量数据库 Chroma、Weaviate 和 Qdrant 的基准测试可以比较它们的上传速度和查询性能。机器级别、磁盘类型和线程配置等因素对上传性能有重大影响,Qdrant 以其令人印象深刻的上传速度脱颖而出。同时,这三个数据库都具有高效的查询性能,其中 Qdrant 再次拥有最高的速度。

这些结果凸显了在为以人工智能为中心的应用程序选择矢量数据库时考虑特定操作要求、成本效益和数据库功能的重要性。虽然没有一刀切的解决方案,但我们的基准测试结果可以深入了解这些数据库的优点和缺点,以便感兴趣的各方可以做出最适合其个人需求的明智决策。
Post Reply