苹果测试工程师的日常 - 九维我操你爹

九维我操你爹

14:58 · 2026年5月21日 · 周四

今天的社交能量用尽了……我要挑些旅游的时候故意压着没发的照片出来欣赏了
顺便创死路过的还在上班的网友

12:17 · 2026年5月21日 · 周四

https://fixupx.com/i/status/2057252814410355044

神经啊……

mitsu (@Kuala546277741)

mitsu (@Kuala546277741)

日本語の「乃至(ないし)」は9割以上の確率で「or」の意味なの、中華圏の人には初見殺しなのでは？

「このコースでは数学乃至物理を学べます」

と書いてあったら、(数学を学んだ後、物理も学べるのか)と思ってしまいそうです。

おはようございます！

13:31 · 2026年5月20日 · 周三

https://mp.weixin.qq.com/s/vDBDMTOhIrYlekkGwaVn0w

榫卯（sǔn mǎo）的英文是？

13:29 · 2026年5月20日 · 周三

变好玩了 🤣 railway 估计也没想到还有我这种记性好的

https://x.com/i/status/2056923699836563798

X (formerly Twitter)

Jintao Zhang 张晋涛 (@aiandcloud) on X

虽然我的旧账号还没恢复，但幸好我还有 tg 会同步发些内容。

Railway是我用过也一直都在关注的一家厂商，今天它们遇到了服务中断，公告说是Google封禁了它们的账户。

然后我就想起来了，我之前分享过他们一篇关于自建机房的博客，其实还有25年的review文章，说已经完全做了迁移。

这个事情变好玩了

18:10 · 2026年5月19日 · 周二

https://rawkode.academy/read/cgroups-from-chaos-to-control

Rawkode Academy

Linux cgroups v2: Docker & Kubernetes Resource Control

Linux cgroups v2: Docker & Kubernetes Resource Control

Learn Linux cgroups v2 through Docker and Kubernetes examples: memory.max, pids.max, cgroup.subtree_control, OOM kills, and resource-limit debugging.

19:50 · 2026年5月18日 · 周一

@yzqzss 吃吃吃我最会吃了🥺

15:59 · 2026年5月18日 · 周一

https://fixupx.com/i/status/2056274328002396449

FixupX · netresec.com

𝙽𝙴𝚃𝚁𝙴𝚂𝙴𝙲 (@netresec)

PolarProxy 2.0 TLS inspection proxy released
📦️Single self-contained binary release
🔀 Improved HTTP proxy
🐳 Builds for Linux musl (Alpine) ARM/ARM64
🪄 Simplified deployment
🔪 Flow cutoff in output PCAP
https://netresec.com/?b=2658a26

12:50 · 2026年5月18日 · 周一

新的博文《我的欧洲生活奥地利》发布了
https://dmesg.app/europe-at.html

我的欧洲生活奥地利 | 土豆不好吃

如果你的嘴巴或者耳朵不太利索，英文水平稍微差点，说自己要去奥地利和维也纳的时候一定要小心，因为很容易会被听成要去澳大利亚或越南 ……

11:56 · 2026年5月18日 · 周一

ctf 的人被别人 ctf 了

https://fixupx.com/i/status/2056186126243918319

SEEM@cyclens (@SEEMsec)

探姬的推特被盗了，请不要相信他发送的任何内容，为什么会被盗？问题来自于之前的一个github投毒项目，请勿盲目相信所有的ai项目即使他star很高😅

引用探姬 | Hello-CTF 🚩 (@seamed_mast)

When my portfolio is up I can't sleep from excitement, when it's down I can't sleep from anxiety 😅 Crypto really said "rest is for the stable…

11:08 · 2026年5月18日 · 周一

这个挺好的
https://github.com/ndrewh/pyda

GitHub - ndrewh/pyda: Write dynamic binary analysis tools in Python

Write dynamic binary analysis tools in Python. Contribute to ndrewh/pyda development by creating an account on GitHub.

23:13 · 2026年5月17日 · 周日

从前车马慢
洇在纸上的情意，把滚烫的念想放凉了再写，写完了还要再等，那迢递信件
所谓江海万里，心中念你，便不觉遥远

14:23 · 2026年5月17日 · 周日

苹果测试工程师的日常

params recommended for thinking/general tasks works well however the benchmark were like running forever

qwen3.5-9b original
→
qwopus-9b-v3.5
（thinking/general tasks）

MMLU↓
CMMLU↓
JMMLU↑
TRUTHFULQA↓
HUMANEVAL↑

gain more than loss, yet not very impressive

13:44 · 2026年5月17日 · 周日

https://fixupx.com/i/status/2055841151970930785

肝胆香皂草

中国ほのぼの商品館 (@honobonochina)

中国ほのぼの商品館 (@honobonochina)

肝臓胆嚢石鹸
1167円

23:52 · 2026年5月15日 · 周五

https://mp.weixin.qq.com/s/0qt9NOovocqxGRM5RbZMcA

天声人语 2026.05.15｜名为“治安维持”的恶龙

22:31 · 2026年5月15日 · 周五

20:15 · 2026年5月15日 · 周五

https://mp.weixin.qq.com/s/7EDO2rTjxl49Y4od65xYog

“青色”是 green 还是 blue？

19:37 · 2026年5月15日 · 周五

开启思考后 general/coding tasks 的参数表现都不错，之前不开思考的时候得到的结果就惨不忍睹了……朋友们 qwopus 千万要打开思考开关用啊
跑这么点基准测试在顶配 M5 无印上需要 20 个小时，明天会拿原版 qwen 3.5 9B 的测试结果做最后的对比，看看到底 qwopus v3.5 是否真的提升了模型表现

19:36 · 2026年5月15日 · 周五

苹果测试工程师的日常

params recommended for thinking/general tasks works well however the benchmark were like running forever

Intelligence Benchmark Comparison

              Mode    Sampled         Qwopus3.5-9B-v3.5-oQ8-mtp
---------------------------------------------------------------
MMLU          Sample  1000/14042                          86.3%
CMMLU         Sample  300/11582                           82.3%
JMMLU         Sample  300/7536                            83.0%
TRUTHFULQA    Full    817                                 82.4%
HUMANEVAL     Full    164                                 88.4%

--- Detail ---

Model: Qwopus3.5-9B-v3.5-oQ8-mtp
Benchmark         Accuracy   Correct   Total   Time(s)   Think
--------------------------------------------------------------
MMLU                 86.3%       863    1000   27876.7     Yes
CMMLU                82.3%       247     300    7532.3     Yes
JMMLU                83.0%       249     300    8052.7     Yes
TRUTHFULQA           82.4%       673     817   20773.1     Yes
HUMANEVAL            88.4%       145     164      6723     Yes

19:26 · 2026年5月15日 · 周五

hf-mirror 的 hfd.sh 加速脚本小心用吧……
脚本下载模型失败了它会静默自动清理目录，但是连路径里的空格都没处理。这个脚本质量也是醉了
哪天真的 rm -rf / usr/local 就好玩了

17:58 · 2026年5月15日 · 周五

Welcome to the Black Parade

这个问题的迷人之处在于，甚至 StackOverflow 都无法给出正确的回答： https://stackoverflow.com/questions/47968861/does-python-logging-support-multiprocessing: 高赞回答全错 https://stackoverflow.com/questions/1154446/is-file-append-atomic-in-unix: 高赞回答全错其中有个回答非常具有迷惑性，这个博客 (https://www.no…

但其实第二高赞的回答是正确的

Powered by BroadcastChannel & Sepia