国产模型霸榜 OpenClaw 评测:MiniMax、Kimi 成功率超 93%,速度碾压国际大厂
PinchBench 是首个专为 OpenClaw 智能体设计的评测榜单,由 Agent 基础设施创业团队 Kilo AI 推出。与传统大模型 Benchmark 不同,它不测试知识问答或数学推理,而是通过 23 个真实任务(查资料、写邮件...
阅读全文