苹果测试工程师的日常
13:39 · 2025年1月31日 · 周五
https://fxtwitter.com/virushuo/status/1885159010074083376
🧵
Thread • FxTwitter / FixupX
virushuo (@virushuo)
我们做了一个很有意思的东西。你可以用它来调整R1输出的速度,从而让自己的思考和r1的<think>同步,可以随时暂停修正你觉得R1思考错误的地方,把一些你的思想"植入"R1的思考过程中,最后得到最好的结果。似乎是R1特殊的训练方式,在其他reasoning模型上都很难做到这个。大家可以来玩玩。
Quoting Intelligent Internet (@ii_posts)
DeepSeek R1 is great. How do humans think with reasoning machines…
Home
Powered by
BroadcastChannel
&
Sepia