Warning: Missing argument 3 for write(), called in /www/wwwroot/shijiebei05.com/incs/robot.php on line 68 and defined in /www/wwwroot/shijiebei05.com/incs/data.php on line 487 TechCrunch:Meta 新AI模型的性能测试有点误导人作者:Kyle WiggersMeta 上周六发布了一款旗舰AI模型——Maverick。在人类评审员对不同AI模型生成内容进行比较的LM Arena排行榜中,这款模型排名第二。但实际上,Meta 提供给 LM Arena 测试的 Maverick
Meta 此次做法的问题在于,他们针对基准测试优化了模型,提供给LM Arena后,却向开发者发布了未经特别优化的“基础版”。这种方式容易造成误导,也会让开发者难以准确预测模型在实际应用场景中的表现。理想情况下,虽然目前基准测试工具存在诸多不足,但至少可以帮助人们大致了解某个模型在不同任务中的优缺点。