国产化驱动经济自主性与科技创新的未来之路
1485
2022-09-04
Stanford cars-数据集
本数据集包含 196 种汽车类别的图像数据集,共有 16,185 张图像,分别为 8,144 张训练图像和 8,041 张测试图像,每个 类别的图像类型比例基本上都是五五开。本数据集的类别主要基于汽车的牌子、车型以及年份进行划分。
While 3D object representations are being revived in thecontext of multi-view object class detection and scene understanding, they have not yet attained wide-spread usein fine-grained categorization. State-of-the-art approachesachieve remarkable performance when training data isplentiful, but they are typically tied to flat, 2D representations that model objects as a collection of unconnectedviews, limiting their ability to generalize across viewpoints.In this paper, we therefore lift two state-of-the-art 2D objectrepresentations to 3D, on the level of both local feature appearance and location. In extensive experiments on existingand newly proposed datasets, we show our 3D object representations outperform their state-of-the-art 2D counterparts for fine-grained categorization and demonstrate theirefficacy for estimating 3D geometry from images via ultrawide baseline matching and 3D reconstruction.
译:
当三维对象表示在多视点背景下的物体类检测和场景理解,目前还没有得到广泛的应用在细粒度分类中。最先进的方法当训练数据很多,但它们通常与平面二维表示相关联,后者将对象建模为未连接的集合视图,限制了它们在不同观点之间进行概括的能力。在本文中,我们提出了两个最先进的二维物体三维表示,在局部特征外观和位置级别上。在广泛的实验中对于最新提出的数据集,我们展示了我们的3D对象表示在细粒度分类方面优于其最先进的2D对象表示,并展示了它们通过超宽基线匹配和三维重建从图像估计三维几何的有效性。
只要自己有时间,都尽量写写文章,与大家交流分享。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~