
【CNMO科技音讯】5月20日,阿里云峰会证实开幕,阿里巴巴集团副总裁、阿里云智能CTO、阿里巴迎合伙东说念主周靖东说念主在会上告示,通义千问Qwen3.7系列大模子证实发布。旗舰版Qwen3.7-Max以"万能智能体基座"为定位,在编程、推理、器用调用等智力上收场了越过式升级,并在多项寰宇巨擘评测中刷新了国产模子的排行记载。

千问
开云kaiyun(中国)体育官网从空洞排行来看,Qwen3.7-Max在Arena AI寰宇大模子文本总榜中位列第13位,超越了Gemini 3 Flash和GPT-5.5等海外模子,豪门国际官网娱乐网成为榜单前15名中独一的国产模子。细分规模不异知道亮眼:数学智力寰宇第7,编程智力寰宇第10,群众级哄骗与软件及IT规模均位列第9。视觉方面,AG真人·(中国)官方网站Qwen3.7-Plus预览版在视觉总榜排行第16,鼓动阿里实践室视觉智力跃升至寰宇第5。在常识和逻辑推理等主流评测中,Qwen3.7全面当先Kimi K2.6、智谱GLM5.1、DeepSeek V4 Pro、opus4.6-Max等国内及海外最新模子,稳居国内第一。
器用调用和编程智力是本次升级的重头戏。Qwen3.7的编程智能体相沿复杂工程设置,在TerminalBench 2.0测试中得分69.7,超越DS-V4-ProMax的67.9分;在SWE-Pro得分60.6、SciCode得分53.5等编程基准中不异当先。更值得关怀的是,在一项捏续35小时、超越1000次器用调用的长周期实践中,Qwen3.7保捏了放心的推奢睿力,收场了端到端任务闭环。办公自动化方面,SpreadsheetBench-V1得分87.0AG真人·(中国)官方网站,处于行业顶尖水平。

