Paper Insights - AI Arxiv Paper Analysis

cs.CL 2603.17942

Efficient Training-Free Multi-Token Prediction via Embedding-Space Probing

Efficient training-free multi-token prediction via embedding-space probing, improving LLaMA3 acceptance length by 12%.

Raghavv Goel, Mukul Gagrani, Mingu Lee et al.

2026-03-19 190

cs.LG 2603.17891

RAMP: Reinforcement Adaptive Mixed Precision Quantization for Efficient On Device LLM Inference

RAMP uses reinforcement learning for adaptive mixed-precision quantization, achieving 6% size and 1-3% quality improvements for on-device LLM inference.

Arpit Singh Gautam, Saurabh Jha

2026-03-19 1 citations 116

cs.AI 2603.18104

Adaptive Domain Models: Bayesian Evolution, Warm Rotation, and Principled Training for Geometric and Neuromorphic AI

Adaptive Domain Models leverage Bayesian distillation and warm rotation for efficient training in geometric and neuromorphic AI.

Houston Haynes

2026-03-18 1 citations 99

cs.NE 2603.17444

Large Language Models as a Semantic Interface and Ethical Mediator in Neuro-Digital Ecosystems: Conceptual Foundations and a Regulatory Imperative

LLMs as semantic interfaces and ethical mediators in neuro-digital ecosystems, introducing Neuro-Linguistic Integration.

Alexander V. Shenderuk-Zhidkov, Alexander E. Hramov

2026-03-18 113

cs.NE 2603.18066

A Synthesizable RTL Implementation of Predictive Coding Networks

A synthesizable RTL architecture for predictive coding networks, supporting local prediction-error dynamics, executed directly in hardware.

Timothy Oh

2026-03-18 104

cs.NE 2603.17163

Quadratic Surrogate Attractor for Particle Swarm Optimization

Utilizing a Quadratic Surrogate Attractor to enhance Particle Swarm Optimization's global convergence and robustness.

Maurizio Clemente, Marcello Canova

2026-03-18 90

physics.flu-dyn 2603.17057

Optimization-Embedded Active Multi-Fidelity Surrogate Learning for Multi-Condition Airfoil Shape Optimization

Optimization-embedded active multi-fidelity surrogate learning for airfoil shape optimization improves cruise efficiency by 41.05% and take-off lift by 20.75%.

Isaac Robledo, Alberto Vilariño, Arnau Miró et al.

2026-03-18 70

physics.optics 2603.17049

Attractor-Keyed Memory

Attractor-Keyed Memory merges selection and memory access, reducing latency and energy in sparse routing architectures.

Natalia G. Berloff

2026-03-18 79

cs.CV 2603.16870

Demystifing Video Reasoning

Video models exhibit reasoning via Chain-of-Steps mechanism during diffusion denoising steps.

Ruisi Wang, Zhongang Cai, Fanyi Pu et al.

2026-03-18 1 citations 126

cs.CV 2603.16868

MessyKitchens: Contact-rich object-level 3D scene reconstruction

MessyKitchens achieves high-precision monocular 3D scene reconstruction using the MOD algorithm, significantly enhancing the physical plausibility of inter-object contacts.

Junaid Ahmed Ansari, Ran Ding, Fabio Pizzati et al.

2026-03-18 79

cs.LG 2603.16867

Efficient Reasoning on the Edge

Efficient reasoning in small LLMs using LoRA adapters and RL, significantly reducing response length.

Yelysei Bondarenko, Thomas Hehn, Rob Hesselink et al.

2026-03-18 108

cs.CV 2603.16869

SegviGen: Repurposing 3D Generative Model for Part Segmentation

SegviGen repurposes 3D generative models for part segmentation, achieving a 40% improvement in interactive segmentation using only 0.32% labeled data.

Lin Li, Haoran Feng, Zehuan Huang et al.

2026-03-18 184

cs.RO 2603.16866

ManiTwin: Scaling Data-Generation-Ready Digital Object Dataset to 100K

ManiTwin generates 100K high-quality 3D digital assets from a single image for large-scale robotic manipulation data generation.

Kaixuan Wang, Tianxing Chen, Jiawei Liu et al.

2026-03-18 192

cs.RO 2603.16853

BrickSim: A Physics-Based Simulator for Manipulating Interlocking Brick Assemblies

BrickSim is a physics-based simulator for real-time simulation of brick assemblies, achieving 100% accuracy.

Haowei Wen, Ruixuan Liu, Weiyi Piao et al.

2026-03-18 77

cs.CV 2603.16844

M^3: Dense Matching Meets Multi-View Foundation Models for Monocular Gaussian Splatting SLAM

M^3 integrates multi-view foundation models with monocular Gaussian splatting SLAM, reducing ATE RMSE by 64.3%.

Kerui Ren, Guanghao Li, Changjian Jiang et al.

2026-03-18 138

cs.AI 2603.16843

Internalizing Agency from Reflective Experience

LEAFE framework internalizes recovery agency from reflective experience, enhancing Pass@k performance in long-horizon tasks.

Rui Ge, Yichao Fu, Yuyang Qian et al.

2026-03-18 1 citations 141

cs.RO 2603.16279

Agile Interception of a Flying Target using Competitive Reinforcement Learning

Achieved superior drone interception using PPO-based competitive reinforcement learning with high catch rates.

Timothée Gavin, Simon Lacroix, Murat Bronz

2026-03-17 94

cs.CV 2603.15620

Towards Generalizable Robotic Manipulation in Dynamic Environments

PUMA model improves success rate by 6.3% in dynamic environments using historical optical flow and world queries.

Heng Fang, Shangru Li, Shuhan Wang et al.

2026-03-17 1 citations 247

cs.CL 2603.15619

Mixture-of-Depths Attention

Mixture-of-Depths Attention (MoDA) improves downstream task performance by 2.11% on a 1.5B-parameter model with only a 3.7% increase in FLOPs.

Lianghui Zhu, Yuxin Fang, Bencheng Liao et al.

2026-03-17 106

cs.LG 2603.15617

HorizonMath: Measuring AI Progress Toward Mathematical Discovery with Automatic Verification

HorizonMath evaluates AI progress in mathematical discovery using an automated verification framework, with GPT 5.4 Pro achieving breakthroughs on two problems.

Erik Y. Wang, Sumeet Motwani, James V. Roggeveen et al.

2026-03-17 110