Paper 解读 - Arxiv 论文中文解读平台

cs.IR 2606.06225

Bridging the Semantic-Collaborative Gap: An Asymmetric Graph Architecture for Cold-Start Item Recommendation

提出非对称图架构Shallow-RHS，用于新内容冷启动推荐，依赖内容特征映射到协同过滤空间。

Anh Truong, John Trenkle, Yuanbo Chen 等

2026-06-04 134

cs.NE 2606.06198

Hub-Aware Hybrid Search: Accelerating the Locally Aligned Ant Technique

提出Hub-Aware混合搜索策略，结合预处理和Likelihood-pheromone引导LAAT，有效提升宇宙大尺度结构检测效率。

Simone Vilardi, Reynier Peletier, Felipe Contreras 等

2026-06-04 109

cs.RO 2606.06041

Sample-efficient Low-level Motion Planning for Robotic Manipulation Tasks via Zero-shot Transfer Learning

提出iCEM+TL框架，通过迁移学习提升机器人低级运动规划成功率达23%，实现复杂任务的高效零样本迁移。

Yuanzhi He, Victor Romero-Cano, José J. Patiño 等

2026-06-04 78

cs.LG 2606.05693

MolE-RAG: Molecular Structure-Enhanced Retrieval-Augmented Generation for Chemistry

MolE-RAG结合化学文献、分子特征和结构相似性，显著提升LLMs的分子性质预测性能，分类任务ROC-AUC提升至28个百分点。

Joey Chan, Wonbin Kweon, Ashley Shin 等

2026-06-04 130

cs.LG 2606.05152

Reinforcement Learning from Rich Feedback with Distributional DAgger

提出基于分布式DAgger的丰富反馈强化学习方法DistIL，保证单调改进并提升Pass@N指标。

Rishabh Agrawal, Jacob Fein-Ashley, Paria Rashidinejad

2026-06-04 112

cs.RO 2606.03985

Humanoid-GPT: Scaling Data and Structure for Zero-Shot Motion Tracking

Humanoid-GPT采用大规模2B帧运动数据和GPT结构，实现零样本高动态运动追踪，超越传统MLP追踪器。

Zekun Qi, Xuchuan Chen, Dairu Liu 等

2026-06-03 66

cs.LG 2606.03980

Skill-RM: Unifying Heterogeneous Evaluation Criteria via Agent Skill

Skill-RM通过Agent技能统一多样评价标准，在奖励模型中实现动态资源调度，提升性能，实验中在RewardBench2等基准上优于传统方法。

Tao Chen, Gangwei Jiang, Pengyu Cheng 等

2026-06-03 138

cs.LG 2606.03979

Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories

引入“睡眠”范式，通过知识播种与梦境机制实现大模型的持续学习与记忆巩固。

Ali Behrouz, Farnoosh Hashemi, Vahab Mirrokni

2026-06-03 2 引用 64

cs.LG 2606.03962

Using Reward Uncertainty to Induce Diverse Behaviour in Reinforcement Learning

提出基于奖励不确定性的多样行为引导框架ROSA，通过奖励分布实现行为多样性，无性能折损。

Anthony GX-Chen, Ankit Anand, Gheorghe Comanici 等

2026-06-03 68

cs.RO 2606.03949

Preference-Calibrated Human-in-the-Loop Reinforcement Learning for Robotic Manipulation

提出偏好校准的HIL-RL框架PACT，通过识别次优段落校正Q值，提升机器人操作成功率24.5%，收敛速度提升1.3倍。

Zeyi Liu, Guangyao Liu, Yinuo Qu 等

2026-06-03 84

eess.IV 2606.03940

SEAOTTER: Sensor Embedded Autoencoding with One-Time Transcode for Efficient Reconstruction

提出SEAOTTER框架，结合学习的JPEG编码与一次性转码，实现200:1压缩比下的高效图像重建，编码速度提升7倍，准确率提升8%。

Dan Jacobellis, Neeraja J. Yadwadkar

2026-06-03 69

cs.LG 2606.03584

Training a Predictive Coding Network on ImageNet using Equilibrium Propagation

本文提出基于平衡传播（EP）训练预测编码网络（PCN），在ImageNet上实现10层卷积模型，达13.23% Top-5误差，接近反向传播（12.2%）。

Tugdual Kerjan, Rasmus Høier, Benjamin Scellier

2026-06-02 61

cs.CV 2606.02580

Thinking in Blender: Staged Executable Inverse Graphics with Vision-Language Models

提出SEIG框架，利用预训练视觉-语言模型（VLM）实现单图反向图形，逐步细化几何、材质、布局和光照，生成可编辑的Blender程序。

Guangzhao He, Rundong Luo, Wei-Chiu Ma 等

2026-06-02 189

cs.CV 2606.02569

AdaCodec: A Predictive Visual Code for Video MLLMs

AdaCodec采用预测性视觉编码，仅在预测成本高时使用完整视觉标记，显著提升长视频理解效率，平均节省84.7%的视觉Token。

Haowen Hou, Zhen Huang, Zheming Liang 等

2026-06-02 269

cs.CV 2606.02564

VLMs are Good Teachers for Video Reasoning via Adaptive Test-Time Optimization

本文提出VLM作为视频推理的教师，通过测试时在线优化，提升模型性能16.7分，超越传统方案。

Junhao Cheng, Liang Hou, Tianxiong Zhong 等

2026-06-02 112

cs.CL 2606.02559

From Layers to Submodules: Rethinking Granularity in Replacement-Based LLM Compression

提出SubFit方法，在LLM中以非连续子模块级别替换，显著提升压缩效果，25%稀疏下保持84.6%准确率。

Elia Cunegatti, Marcus Vukojevic, Erik Nielsen 等

2026-06-02 121

cs.CL 2606.02548

SN-WER: Script-Normalized WER for Multi-Script Indic ASR Evaluation

提出脚本归一化的WER（SN-WER），在五种印地语系语言中通过转写减少多达12%的脚本偏差影响，提升多脚本ASR评估的准确性。

Priyaranjan Pattnayak

2026-06-02 110

cs.CL 2606.02544

SimSD: Simple Speculative Decoding in Diffusion Language Models

SimSD采用插拔式掩码策略，为扩散式大语言模型引入令时间有效的逐词验证，实现最高7.46倍的解码吞吐提升。

Junxia Cui, Haotian Ye, Runchu Tian 等

2026-06-02 160

cs.AI 2606.02530

SafeSteer: Localized On-Policy Distillation for Efficient Safety Alignment

SafeSteer通过局部化的策略蒸馏，仅在安全标记上调整，有效平衡安全性与模型能力，显著减少对通用数据的依赖。

Hao Li, Jingkun An, Zijun Song 等

2026-06-02 183

cs.AI 2606.02484

Iteris: Agentic Research Loops for Computational Mathematics

Iteris为计算数学中的开放问题设计的智能研究系统，通过生成数值证据和证明草稿，辅以专家验证，推动理论验证。

Leheng Chen, Zihao Liu, Wanyi He 等

2026-06-02 302