苹果测试工程师的日常 找网友帮忙测试下 thinking / general tasks 的参数配置,因为电脑太烫跑不下去了 我这边下午针对 nonthinking / reasoning tasks 补充了一些测试,到现在还没跑完(目前出来的结果可以看截图)。说实话跑到这里我已经对 qwopus 没什么信心了,既然网友不想测了我干脆也放弃这个模型了 明天测下 qwen 3.6 原版的智商,不出意外之后 local LLM 就跑它了