苹果测试工程师的日常
10:07 · 2025年5月10日 · 周六
https://fixupx.com/9hills/status/1920736475454283969
FixupX
九原客 (@9hills)
推荐一个计算大模型推理和训练所占内存的网页:
https://apxml.com/tools/vram-calculator
是我见到的计算最准确的,能计算MoE的模型,会算不同的attention机制,支持修改batch size、seq length和并发。(bug修的也快,前几天DeepSeek 671B就算错,现在已经修了)
Home
Powered by
BroadcastChannel
&
Sepia