AI跨视角视觉理解取得新突破
2025-10-22 11:20
14585
INSAIT与复旦大学等单位联合提出的ObjectRelator框架,首次实现了第一人称与第三人称视角下同一物体的精准匹配,显著提升了视觉理解的连贯性与准确性。该框架通过引入语言描述与视觉特征融合,以及自监督对齐策略,解决了背景干扰和视觉变换问题,在多个基准测试中刷新了当前最佳性能(SOTA)。
2
表情