

OpenAI于4月15日凌晨正式推出GPT-4.1系列模型,由中科大校友Jiahui Yu领衔的团队开发。该系列包含旗舰版GPT-4.1、轻量级GPT-4.1 mini和性价比突出的GPT-4.1 nano,均支持100万Token的上下文窗口,知识截止日期更新至2024年6月。
编程能力全面碾压前代
在反映真实工程能力的SWE-bench Verified测试中,GPT-4.1以54.6%的得分超越GPT-4o达21.4%,并能通过单次提示生成完整网页应用。Aider多语言编码基准测试中,其表现达到GPT-4o的2倍,且代码修改冗余率从9%降至2%。
指令跟随与长上下文突破
通过内部评估体系测试,GPT-4.1在困难指令场景的正确率提升至49%。在Scale的MultiChallenge基准中,其得分较GPT-4o提高10.5%。长上下文处理方面,100万Token容量相当于React代码库的8倍,且在OpenAI-MRCR多轮指代测试中保持稳定性能。
价格与多模态优势
GPT-4.1的输入/输出定价为每百万Token 2美元和8美元,较GPT-4o降低26%。GPT-4.1 nano则以0.1美元/百万Token的输入成本成为最快廉价选择。多模态任务中,GPT-4.1在Video-MME无字幕视频问答测试中以72.0%刷新纪录。
OpenAI同时确认,GPT-4.5 Preview将于7月14日停用,但其核心特性将融入后续模型。目前GPT-4.1系列已全面开放API访问。
