九维我操你爹
苹果测试工程师的日常
none optimization vs just enable MTP 创建 token 的速度有 0.5 倍的提升
qwen 3.5 9b 原版 vs qwopus v3.5
模型加载参数用的是 unsloth 推荐的 nonthinking / reasoning task 参数
尚不清楚这种退化是因为参数选的不合适还是真的 qwopus 不行
https://rancher.github.io/elemental-toolkit/docs/

有没有人认识 rancher 的朋友,他们的文档站有两个 js 资源 404 了,样式加载不出来很影响阅读

// 或许这是在催促读者适应时代潮流,该让 AI 来看文档了
主要是这一套用词在德语区已经完全成体系了,而且如果员工发现离职的时候 HR 用的副词等级不够甚至可以起诉公司修改推荐信
#TIL Zeugnissprache(暗语)

离职时瑞士/德国公司给的 Arbeitszeugnis (推荐信/工作证明)里由于法律规定不能出现负面词汇(必须善意 Wohlwollend),导致 HR 体系里发展出了一套用副词和语气定义评价标准的暗语……

比如工作表现评价里必须有 stets/always 和 vollsten/fullest 才是满分,少了一个就是降级……

再比如行为举止评价,必须按照上级 > 同事 > 客户的顺序罗列,如果颠倒顺序就是暗示和上级有矛盾……

哇你们德语区人的 yygq 和官僚主义我受不了了
如果你正在使用 bub 或者对 bub 背后的一些设计想法感兴趣,这里有一个微信群可以讨论

不过这个群不是工单群和 7*24h 响应,issue 需要转 github

(逃
日本零食制造商卡乐比计划将其部分产品的包装改为黑白版本,理由是中东局势导致印刷油墨和其他材料的采购不稳定。
谁懂老家的垃圾网络连上 hf-mirror 都要翻墙的感受((
这是本又好看又好睡的书,两个看似矛盾的事情在这本书上神奇的统一了。看名字以为是本很工程的书,可在介绍概念的时候用的全是生活化的例子。我一般不喜欢这样的写法,总觉得这样无法准确描述概念,但神奇的是作者在这里用到的生活化的例子都精准无比,让人拍案叫绝。我好几次都是在感叹怎么能想出这么有生活气息有这么精准的例子的赞叹中睡过去的。作者通过一个个小的例子,展示了整个系统的相互耦合和复杂,水平真的是高到不知道哪里去了。
我以为去年对观众比中指已经够逆天了。
none optimization
vs
just enable MTP

创建 token 的速度有 0.5 倍的提升
Back to Top