苹果测试工程师的日常 听说 M5 芯片的 AI 性能有了很大提升?(出处:极客湾) 实测:unsloth 优化过的 GGUF 4B 小模型。51 tokens 耗时 2888ms 😂(这个结果是反复测试以后的最优值,模型已经预加载进内存)