苹果测试工程师的日常
qwen 3.5 9b 原版 vs qwopus v3.5 模型加载参数用的是 unsloth 推荐的 nonthinking / reasoning task 参数 尚不清楚这种退化是因为参数选的不合适还是真的 qwopus 不行
找网友帮忙测试下 thinking / general tasks 的参数配置,因为电脑太烫跑不下去了
我这边下午针对 nonthinking / reasoning tasks 补充了一些测试,到现在还没跑完(目前出来的结果可以看截图)。说实话跑到这里我已经对 qwopus 没什么信心了,既然网友不想测了我干脆也放弃这个模型了
明天测下 qwen 3.6 原版的智商,不出意外之后 local LLM 就跑它了
 
 
Back to Top