每经AI快讯,2月16日,阿里千问正式发布Qwen3.5,并推出Qwen3.5系列的第一款模型Qwen3.5-397B-A17B的开放权重版本。该模型采用创新的混合架构,将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)相结合,实现出色的推理效率:总参数量达3970亿,每次前向传播仅激活170亿参数,在保持能力的同时优化速度与成本。
广瑞网配资提示:文章来自网络,不代表本站观点。
本文评分*
评论内容*
你的昵称*
你的邮箱*