核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
作为作者之一,我主要讲讲写这篇论文的动机。 这篇论文中我们毫...
2025-06-24阅读全文 >>如果Electron可以被Tauri取代,那么他也可以被Wa...
2025-06-24阅读全文 >>我自觉是无法参与基础设施建设的开发者,所以对 Rust 不是...
2025-06-24阅读全文 >>我这里有一个。 后端基于:go,go-kratos,wir...
2025-06-24阅读全文 >>如果你做过几年职场,一定见过那种“Excel大神”——没装管...
2025-06-24阅读全文 >>