求推荐一个轻量 RAG LLM chat 的部署方案

16次阅读

共计 206 个字符，预计需要花费 1 分钟才能阅读完成。

需求：

构建英文 pdf 知识库，一次对话讨论可以涉及多个文件
向量数据库最好本地化
不需要本地部署模型，所有 embed, rerank, chat models 都用 api
不需要用户管理等冗余功能

看好多方案，ragflow fastgpt langchain-chatchat，不知道实际用起来如何？或者有其他推荐的方案？

ChatGPT-Next-Web-langchain 感觉在上游的简单前端框架下加 rag 的逻辑，还是有点勉强了。

正文完

chat langchain rag

发表至： V2EX

2024-07-15

0

在纠结是买 15 的欧版还是日版

集思广益, 软工毕业,研究生要转人工智能吗?

PLEX 是被墙了吗？

Mac 外接 T7 写入速度突然只有 100MB/s 了是什么原因

求推荐一个音箱

关于铠侠一个固态硬盘的故障问题

热门文章