桥水与Thinking Machines Lab发现微调开源模型在金融筛选任务中优于GPT等大模型

2026年7月,桥水基金AIA Labs联合Thinking Machines Lab测试GPT、Claude、Gemini等前沿大模型在六项基础金融信息筛选任务中的表现,平均准确率仅50%,优化后达70%,未达80%部署阈值。团队基于Qwen3-235B开源模型,通过Tinker平台微调,采用争议样本专家校正机制及多项训练优化技术,最终模型准确率达84.7%,错误率降低29.8%,推理成本仅为前沿模型的1/14。该模型已投入桥水日常使用,凸显‘差异化智能’在专业场景中的优势。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

公众号
公众号
新媒体群
新媒体群
联系邮箱

1284674160@qq.com

分享本页
返回顶部