KAT-Dev-72B-Exp是一个专门为软件工程师定制的,在SWE-Bench Verified的硬核编程能力测试里,拿到了74.6%的准确率。这个分数,直接登顶了所有开源代码模型的第一名,并且跟闭源GPT-5的74.9%成绩,就差了那么一丁点儿。