本来用下来对Qwen3印象不太好,但30B A3B这个惊呆了,台式机265k用cpu跑都有30多的速度,得益于Moe架构,每次只激活3b参数,压力很低,可用度非常高。
虽然经常吐槽qwen模型思考链又臭又长来刷分,但也是对比deepseek 671b版来说的,但只看开源小模型,32b模型它家之前qwq 包括这次的qwen3 32b和30b没啥好挑的了。
。
本来用下来对Qwen3印象不太好,但30B A3B这个惊呆了,台式机265k用cpu跑都有30多的速度,得益于Moe架构,每次只激活3b参数,压力很低,可用度非常高。
虽然经常吐槽qwen模型思考链又臭又长来刷分,但也是对比deepseek 671b版来说的,但只看开源小模型,32b模型它家之前qwq 包括这次的qwen3 32b和30b没啥好挑的了。
。
如果你做过几年职场,一定见过那种“Excel大神”——没装管...
2025-06-23阅读全文 >>我博客的第一篇文章是2006年9月9日发的,最新一篇是202...
2025-06-23阅读全文 >>太多啦太多啦!宝藏其实就在GitHub上,两个仓库直接承包了...
2025-06-23阅读全文 >>概览小伙伴们都知道,为了将 SwiftUI 中多如牛毛的视图...
2025-06-23阅读全文 >>作为每天处理大量数据的职场人,我经常看到同事为了查找匹配数据...
2025-06-23阅读全文 >>