阿里通義千問發(fā)布小尺寸模型Qwen3
阿里通義千問8月7日宣布,其新發(fā)布的Qwen3-4B模型系列中的兩個新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507——已經(jīng)在魔搭社區(qū)和HuggingFace平臺上正式開源。Qwen3-4B-Instruct-2507全面超越了閉源的小尺寸模型GPT4.1-Nano,并在性能上接近中等規(guī)模的Qwen3-30B-A3B(non-thinking)。在推理領(lǐng)域,Qwen3-4B-Thinking-2507的表現(xiàn)甚至可以與Qwen3-30B-A3B(thinking)相媲美。官方指出,2507版本的Qwen3-4B模型特別適合在手機等端側(cè)硬件上部署,這將使得手機等移動設(shè)備能夠高效地運行這些模型。
文章評價

發(fā)布
發(fā)布