共计 289 个字符,预计需要花费 1 分钟才能阅读完成。
背景:
- 根据一段文案(假设为商品标题)的向量值在 es 中查询出相似的文案 (商品) knn_search
- 向量维度是 1024 维度 余弦函数计算距离
- 目前已有数据是 600w 左右 整体 es 数据量在 250g 左右
- es 节点 8c32g *3
问题
目前想前台使用这种向量查询的结果 但是问题是目前单次查询的效率很低基本上得 60s 左右才能返回。
- 有大佬有经验这种量级的查询大概需要升配到什么配置吗?
- 或者有什么其他的查询优化方案吗?
其他
- 为啥非得用 es 不用其他向量库 例如 milvus?:因为存量数据在这儿,所以暂时没有迁移。
- 另外我看到的有限的返回结果中,很多文案相近但是不是同一个商品的也会被查询出来,准确率其实有待考证。
正文完