求推荐一个轻量 RAG LLM chat 的部署方案

16次阅读

共计 206 个字符,预计需要花费 1 分钟才能阅读完成。

需求:

  1. 构建英文 pdf 知识库,一次对话讨论可以涉及多个文件
  2. 向量数据库最好本地化
  3. 不需要本地部署模型,所有 embed, rerank, chat models 都用 api
  4. 不需要用户管理等冗余功能

看好多方案,ragflow fastgpt langchain-chatchat,不知道实际用起来如何?或者有其他推荐的方案?

ChatGPT-Next-Web-langchain 感觉在上游的简单前端框架下加 rag 的逻辑,还是有点勉强了。

正文完
 0