論文 Hugging Face 発表: 2026-06-09 HF ↑26

Reason, Then Re-reason: Cross-view Revisiting Improves Spatial Reasoning

著者: Chaofan Ma, Zhenjie Mao, Yuhuan Yang, Fanqin Zeng, Yue Shi ほか3名

要約

Spatial reasoning from egocentric videos is inherently challenging because the observable evidence is constrained by the camera trajectory. Existing methods rely on single-turn inference, forcing models to resolve geometric ambiguity through semantic priors rather than verifiable evidence. We argue …

#llm#benchmark

Reason, Then Re-reason: Cross-view Revisiting Improves Spatial Reasoning

要約

同じカテゴリの記事

Claw-SWE-Bench: A Benchmark for Evaluating OpenClaw-style Agent Harnesses on Coding Tasks

On-Policy Self-Evolution via Failure Trajectories for Agentic Safety Alignment

World-R1: テキストから動画生成における3D制約の強化学習による整合