形式上,OneRec是TIGER范式的生成式召回延续,这部分技术其实没什么可说的,有QARM之后,做这个应该是水到渠成的事。
但这次的根本的蜕变在于,通过与RL范式完成了 召回-排序 的联动,在真实业务上打开了新的增量空间和视角;利用P-Score(引了另一篇盖坤大佬的工作)将Ranking Model改造为线上融合分预估模型(应该可以理解为就是精排提供reward),这样OneRec能够一定程度上生成线上需要的item,有了对约束项进行控制的方式。
…。
形式上,OneRec是TIGER范式的生成式召回延续,这部分技术其实没什么可说的,有QARM之后,做这个应该是水到渠成的事。
但这次的根本的蜕变在于,通过与RL范式完成了 召回-排序 的联动,在真实业务上打开了新的增量空间和视角;利用P-Score(引了另一篇盖坤大佬的工作)将Ranking Model改造为线上融合分预估模型(应该可以理解为就是精排提供reward),这样OneRec能够一定程度上生成线上需要的item,有了对约束项进行控制的方式。
…。
说实话,这段时间 快被 Claude Code 折磨疯了。 ...
2025-06-27阅读全文 >>这我不同意了,当年传奇模拟器 VisualBoyAdvanc...
2025-06-27阅读全文 >>因为这摧毁了整个nba一直以来的评价体系。 mvp+fmv...
2025-06-27阅读全文 >>主板有VGA灯? 你用的VGA接口? 无论是用VGA DVI...
2025-06-27阅读全文 >>啧……你识字不? 这个图其实相当有意思,跟一桩网络悬案有...
2025-06-27阅读全文 >>