排序: 最新 热门 引用
cs.SE 2603.23448

Code Review Agent Benchmark

c-CRAB数据集评估代码审查代理的能力,现有代理仅解决40%的任务。

Yuntong Zhang, Zhiyuan Pan, Imam Nur Bani Yusuf 等

2026-03-25 50