本来用下来对Qwen3印象不太好,但30B A3B这个惊呆了,台式机265k用cpu跑都有30多的速度,得益于Moe架构,每次只激活3b参数,压力很低,可用度非常高。
虽然经常吐槽qwen模型思考链又臭又长来刷分,但也是对比deepseek 671b版来说的,但只看开源小模型,32b模型它家之前qwq 包括这次的qwen3 32b和30b没啥好挑的了。
。
本来用下来对Qwen3印象不太好,但30B A3B这个惊呆了,台式机265k用cpu跑都有30多的速度,得益于Moe架构,每次只激活3b参数,压力很低,可用度非常高。
虽然经常吐槽qwen模型思考链又臭又长来刷分,但也是对比deepseek 671b版来说的,但只看开源小模型,32b模型它家之前qwq 包括这次的qwen3 32b和30b没啥好挑的了。
。
就上周六,我的kioxia的nvme盘给我来了个掉盘,我连夜...
2025-06-27阅读全文 >>没上过B2, 上过B29。 驾驶舱空间极其富裕,驾驶舱后面...
2025-06-27阅读全文 >>2022年,大一第一学期快结束的时候,我和他在一起了。 ...
2025-06-27阅读全文 >>我有几件门面房,有一个原来是个餐馆,后来餐馆倒闭了,还有一年...
2025-06-27阅读全文 >>主要是只有nodejs能实现一份代码前后端共用,省了不少事。...
2025-06-27阅读全文 >>