最近几年精力有限比较少在知乎上回答问题了,不过每次看到精彩的问题和回答还是会手痒。
趁这次MiniCPM-4模型发布,集中分享下最近一年多来的感悟和想法,也是最近跟同学朋友经常探讨的话题,抛砖引玉一起交流。
为什么做端侧模型 规模法则可持续发展问题。
大模型在规模法则(Scaling Law)的指引下,参数规模从2018年的千万量级发展到2024年的千亿量级(Llama3.1-405B)。
到了2024年下半年,逐渐出现规模法则是否可持续的大讨论…。
最近几年精力有限比较少在知乎上回答问题了,不过每次看到精彩的问题和回答还是会手痒。
趁这次MiniCPM-4模型发布,集中分享下最近一年多来的感悟和想法,也是最近跟同学朋友经常探讨的话题,抛砖引玉一起交流。
为什么做端侧模型 规模法则可持续发展问题。
大模型在规模法则(Scaling Law)的指引下,参数规模从2018年的千万量级发展到2024年的千亿量级(Llama3.1-405B)。
到了2024年下半年,逐渐出现规模法则是否可持续的大讨论…。
终于集齐三大女神。 张靓颖的眼镜,戴与不戴真的是判若两人。...
2025-06-21阅读全文 >>去闲鱼上搜 MacBook Pro M1,都是某互联网大厂满...
2025-06-21阅读全文 >>很罕见,真的非常罕见, 罕见的不是你的技术,也不是你的线条,...
2025-06-21阅读全文 >>武汉有三大央企总部,不要觉得三个太少,三个在全国能排第四,前...
2025-06-21阅读全文 >>如何选择你的 Golang 后端开发框架引言与 J***a ...
2025-06-21阅读全文 >>