苹果测试工程师的日常
none optimization vs just enable MTP 创建 token 的速度有 0.5 倍的提升
qwen 3.5 9b 原版 vs qwopus v3.5
模型加载参数用的是 unsloth 推荐的 nonthinking / reasoning task 参数
尚不清楚这种退化是因为参数选的不合适还是真的 qwopus 不行
 
 
Back to Top