NEAT-NC: NEAT guided Navigation Cells for Robot Path Planning
NEAT-NC通过导航细胞改进NEAT算法,实现动态环境下的路径规划。
Hibatallah Meliani, Khadija Slimani, Samira Khoulji
NEAT-NC通过导航细胞改进NEAT算法,实现动态环境下的路径规划。
Hibatallah Meliani, Khadija Slimani, Samira Khoulji
HippoCamp基准测试评估多模态文件管理代理,揭示当前模型在用户环境中的局限性,最高准确率仅48.3%。
Zhe Yang, Shulin Tian, Kairui Hu 等
提出了一种马尔可夫框架,用于审计代理AI的可靠性和监督成本,提升了12.53%的状态-动作盲点质量。
Biplab Pal, Santanu Bhattacharya
Latent-WAM通过空间感知和动态信息的潜在世界表示,实现高效的端到端自动驾驶,NAVSIM v2上得分89.3。
Linbo Wang, Yupeng Zheng, Qiang Chen 等
研究发现,RAG系统的检索改进未必提升问答性能,尤其在AI政策分析中。
Saahil Mathur, Ryan David Rittner, Vedant Ajit Thakur 等
MARCH框架通过多智能体强化自检显著减少LLM幻觉,提升8B参数模型的事实一致性。
Zhuo Li, Yupeng Zhang, Pengyu Cheng 等
EndoVGGT通过DeGAT模块提升手术3D重建的深度估计,PSNR提高24.6%,SSIM提高9.1%。
Falong Fan, Yi Xie, Arnis Lektauers 等
Chameleon通过几何基础的多模态记忆增强机器人操控,提升长时间任务的决策可靠性。
Xinying Guo, Chenxi Jiang, Hyun Bin Kim 等
VFIG利用视觉-语言模型将复杂图形转换为SVG,VLM-Judge得分0.829。
Qijia He, Xunmei Liu, Hammaad Memon 等
自蒸馏在数学推理中可能降低LLM性能,因抑制不确定性表达。
Jeonghye Kim, Xufang Luo, Minbeom Kim 等
MedObvious通过临床分诊揭示VLMs中的医疗Moravec悖论,提出1880项任务基准测试。
Ufaq Khan, Umair Nawaz, L D M S S Teja 等
UniGRPO通过GRPO优化文本和图像生成策略,提升推理驱动的视觉生成质量。
Jie Liu, Zilyu Ye, Linxiao Yuan 等
DA-Flow结合扩散模型与卷积特征,显著提升退化视频的光流估计精度。
Jaewon Min, Jaeeun Lee, Yeji Choi 等
WildWorld数据集提供了450多种动作和显式状态注释,支持生成式ARPG的动态世界建模。
Zhen Li, Zian Meng, Shuwei Shi 等
VISOR方法通过稀疏选择视觉语言交互,提升大规模视觉语言模型效率,减少推理成本。
Adrian Bulat, Alberto Baldrati, Ioannis Maniadis Metaxas 等
AgentRVOS通过SAM3和MLLM结合,实现零样本视频对象分割,性能领先。
Woojeong Jin, Jaeho Lee, Heeseong Shin 等
CSTS通过实体关系抽象提高跨环境AI检测的稳定性,解决了模式扰动下的崩溃问题。
Abdul Rahman
c-CRAB数据集评估代码审查代理的能力,现有代理仅解决40%的任务。
Yuntong Zhang, Zhiyuan Pan, Imam Nur Bani Yusuf 等
3DCity-LLM通过粗到细特征编码策略提升3D城市级感知与理解,数据集达1.2M样本。
Yiping Chen, Jinpeng Li, Wenyu Ke 等
研究表明,LLM在软件演化下的测试生成表现不佳,尤其在语义改变时,测试通过率降至66%。
Sabaat Haroon, Mohammad Taha Khan, Muhammad Ali Gulzar