C++部署 pytorch 模型问题

8次阅读

共计 376 个字符,预计需要花费 1 分钟才能阅读完成。

目前采用的是使用 libtorch 加载 TorchScript 文件,然后 forward(input) 完整这个过程,但问题来了:

  1. torch script 文件是使用 python 代码将 pt 文件转换过来的,我已经在代码中指定了 cuda 设备编号为 4,部署上去后也在 c++ 代码中把所有的 tensor、model 全部转移到 cuda:4 上去了,运行的时候还是会报错说有 hidden tensor 在 cuda:0 上,搞不懂
  2. 我有 8 个 CUDA 设备,怎么样将它们全部利用起来跑我的数据?(又如何解决设备不一致的问题?)
  3. 如何采用多线程跑 CUDA 任务

其实对于上面的问题不一定,得到答案不是最重要的,重要的是有没有前辈有这方面经验能多指教一下呢,torch 官方这方面的文档基本等于没有。(翻了又翻,文档全部是一些函数签名,没啥价值)

前辈们都是哪儿去找这方面的参考资料,可以分享一些吗,十分感谢

正文完
 0