爬 gov cn 网站上的公开数据然后交给大模型向量化处理,是否有风险

10次阅读

共计 120 个字符,预计需要花费 1 分钟才能阅读完成。

个人感觉有两个风险

  • 第一个是爬虫 gov cn 网站本身就有风险
  • 第二个是爬到的数据交给大模型处理会有数据泄漏的风险(虽然都是公开的数据),特别是如果使用的是境外的大模型接口

所以有点犹豫。如果只是参与这个项目的其他部分,不涉及爬虫这块,是否有风险呢?

正文完
 0