目前最快的模型, 微软 Phi-3

12次阅读

共计 56 个字符,预计需要花费 1 分钟才能阅读完成。

在我的 3060 6G GPU , 基本能即时响应. 使用 ollama run phi3 即可体验, llama3 测试起来就没那么快

正文完
 0