桥水与Thinking Machines Lab发现微调开源模型在金融筛选任务中优于GPT等大模型

2026年7月，桥水基金AIA Labs联合Thinking Machines Lab测试GPT、Claude、Gemini等前沿大模型在六项基础金融信息筛选任务中的表现，平均准确率仅50%，优化后达70%，未达80%部署阈值。团队基于Qwen3-235B开源模型，通过Tinker平台微调，采用争议样本专家校正机制及多项训练优化技术，最终模型准确率达84.7%，错误率降低29.8%，推理成本仅为前沿模型的1/14。该模型已投入桥水日常使用，凸显‘差异化智能’在专业场景中的优势。

桥水与Thinking Machines Lab发现微调开源模型在金融筛选任务中优于GPT等大模型

发表回复