4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量为DeepSeek-R1的1/3,成本大幅下降。千问3是“混合推理模型”,“快思考”与“慢思考”集成进同一个模型全国十大配资平台,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,节省算力消耗。
千问3总参数量235B,激活仅需22B。阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。
千问3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。API可按需设置“思考预算”(即预期最大深度思考的tokens数量),进行不同程度的思考,满足AI应用和不同场景对性能和成本的多样需求。比如,4B模型面向手机端,8B可在电脑和汽车端侧部署应用等。
举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。如需获得授权请联系第一财经版权部:banquan@yicai.com 文章作者一财科技
相关阅读腾讯混元3D生成模型发布2.5版本新模型;小鹏自研通用模型今年或对公众开放;OpenAI重组为营利性公司的目标遇阻。
89 04-23 20:54针对开发者面临的数据难获取、模型难训练、开发成本高、工程门槛高等问题,Genie Studio推出“数据采集、模型训练,仿真评测、模型推理”四大核心模块。
82 04-21 17:02弘信电子2025年一季度归母净利润同比大幅下滑75.8%,毛利率下滑3.49个百分点,AI算力业务的可持续性和盈利水平存疑。
59 04-16 13:35莲花控股今年以来终止的算力服务合同金额达2.52亿元。
208 04-07 17:59据悉该模型参数为6850亿全国十大配资平台。
240 03-25 07:58 一财最热 点击关闭配配查提示:文章来自网络,不代表本站观点。