欢迎光临
我们一直在努力

让 LLM 来评判 | 评估你的评估结果

注:
如果评估模型的输出结果是二元分类,那么评估会相对简单,因为可使用的解释性分类指标有很多 (如准确率、召回率和精确率)。但如果输出是在某个范围内的分数,评估起来就会困难一些,因为模型输出和参考答案的相关性指标很难与分数映射的非常准确。

未经允许不得转载:小健博客 » 让 LLM 来评判 | 评估你的评估结果
分享到: 更多 (0)

大前端WP主题 更专业 更方便

联系我们联系我们