当前位置：小健博客 > 未分类 > 正文

为了改一行代码，我花了10多天时间，让性能提升了40多倍—Pascal架构GPU在vllm下的模型推理优化

2025-01-13 分类：未分类阅读(6) 评论(0)

家里有张Pascal架构的显卡【划重点，后面要考】，最近发现本地大模型的性能在蹭蹭往上涨，于是开始研究下是否能在本地跑大模型。

未经允许不得转载：小健博客 » 为了改一行代码，我花了10多天时间，让性能提升了40多倍—Pascal架构GPU在vllm下的模型推理优化

相关推荐

大前端WP主题更专业更方便

联系我们联系我们

QQ咨询
QQ咨询
回顶
回顶部