除夕再迎重磅开源模型军工霸业免费阅读

来源: 搜狐专栏
2026-02-18 07:34:07

最佳回答

“军工霸业免费阅读” 除夕再迎重磅开源模型军工霸业免费阅读

  北京2月17日电 (记者 尹倩芸)中国科技公司又“过大年”。

  除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,该版本总参数3970亿,激活仅170亿,部署显存占用降低60%,在保持能力的同时优化速度与成本。

  Qwen3.5-Plus整体能力媲美Gemini3 Pro,在多项权威基准测试中刷新开源模型纪录,API(应用程序接口)价格每百万Token(字符)低至0.8元,仅为Gemini3 Pro的1/18。

  值得注意的是,千问3.5在文本和视觉的混合数据上预训练,实现了原生多模态的新突破,在推理、编程、Agent智能体等全方位基准评估中均表现优异,并在视觉理解能力的权威评测中斩获数项性能最佳。

  在春节假期到来前,中国科技公司就已开始密集“上新”:智谱宣布上线并开源GLM-5,并称这款模型为“Agentic Engineering时代最好的开源模型”;科大讯飞和MiniMax也带来新模型,分别是基于全国产算力训练的星火X2大模型和M2.5模型,而M2.5在处理复杂任务时展现出了更高的决策成熟度。

  字节跳动新一代AI视频生成模型Seedance2.0近期也站到了聚光灯下,其凭借多模态创作方式、自带运镜的呈现效果,迅速在全球范围内引发高度关注。

  这并非中国科技公司第一押注“春节档”,回望2025年的春节假期,彼时阿里云通义团队发布Qwen2.5-Max,这是其大模型的全新版本升级,DeepSeek(深度求索)迎来大量新平台的接入上架,热度持续升温。

  上海财经大学特聘教授胡延平认为,今年发的新模型都越来越“多能实用”,原生多模态+智能体能力,代码、多语言等方面表现均衡,甚至空间智能、视觉推理也可用,同等“质素”只需过去三分之一的体量,解码吞吐量却又数倍增长,这些都让部署和使用省去很多麻烦,效率也提高很多。

  业界认为,Qwen3.5的意义不止于“又刷新了一次榜单”。过去两年,大模型行业信奉“大力出奇迹”,参数从千亿堆向万亿,性能在涨,但代价也在涨。部署应用专用集群,推理要烧算力,中小企业用不起,技术越来越强,但离真正好用越来越远。Qwen3.5的思路则是,不比谁更大,而是比谁更聪明,比谁能用相对更小的模型,借助技术创新,获得更大的智能。

  融合亦是另一大看点,也远远超出“读懂一张图”。Qwen3.5能对图像进行像素级空间定位与代码级精细处理,能理解长达2小时视频中的时序演变与因果关系,能将一张手绘草图直接转化为可运行的前端代码,甚至可以作为视觉智能体自主操控手机与电脑、跨应用完成多步骤复杂任务。

  如此从识别到理解、从单模态到跨模态推理,这料将为后续更自然、更一致的多模态生成与推理打下了坚实基础。

  目前,千问模型的开源数量超400个,衍生模型数量突破20万个,下载量突破10亿次,远超美国的Llama,包括李飞飞团队、爱彼迎等全球公司和机构都在使用千问模型。

  中国工程院院士倪光南近期就表示,开源已经成为全球信息技术发展的强大动力,在新兴的、大模型引领的人工智能领域,开源表现强劲。中国已经成为全球开源大模型的最大提供者,如中国的 Qwen、DeepSeek、Kimi等都在 AI模型评估平台 LMArena的排名中名列前茅。

  他还提到,一些中国企业引领的开源社区在国际上蓬勃发展,在 AI时代展现出勃勃生机。中国企业积极拥抱开源理念,成为全球开源大模型创新的引领者。(完)

发布于:北京市
声明:该文观点仅代表作者本人,搜狐系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有