这篇文章主要讲解了“GVCNN的网络结构是怎样的”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“GVCNN的网络结构是怎样的”吧!
网络结构:
觉得眼熟吗?看看前端输入的一排图片,是不是和MVCNN非常像。来看一下MVCNN的网络结构:
你可能已经猜到了,其实GVCNN就是对MVCNN做了改进。
MVCNN又是什么来路呢?
它可是最早将深度学习引入到三维形状识别中来的,早在ICCV2015会议上发表出来,当时就已经能在ModelNet40数据集上跑出90.1%的成绩了,可以说是师爷级的网络了。
后续的各种处理点云的方法,都会与它做比较。
它的思路其实很简单,对于三维物体,从多个视角去‘拍照’,得到12幅图片,然后码12个VGG网络上来,进行特征提取,把12组特征进行池化后,进行分类。
所以,MVCNN的缺点也很明显,网络巨大。这与当今小型化的趋势明显不符嘛!这么大的网络,别说往移动终端部署了,就是桌面电脑,跑起来都费劲。所以,这个网络的follower一直也不多。
笔者倒是见过一篇比较老的论文,是把三维物体往球形上面做投影,同样是把三维转换成多个二维图像去处理,跟MVCNN的区别是,往球型投影比平面投影更能反映三维物体的属性
再来看今天的主角GVCNN,它的改进是,把12幅图片进行了分组、加权。
作者考虑到,MVCNN中的12幅图像其实权重是一样的,但是实际当中肯定12幅图像对于分类的贡献是有高有低,通过合理加权,自然可以提高分类准确率。
具体操作就如上图,每个图片得到一组特征值,通过FC层获得分数,对分数进行分组,比如图中分成了三组。
然后,在组内按照MVCNN原来的池化操作进行。组间则是加权后在平均池化,得到最后结果。
下面是结果了:
可以看到,提升效果还是很明显的。
感谢各位的阅读,以上就是“GVCNN的网络结构是怎样的”的内容了,经过本文的学习后,相信大家对GVCNN的网络结构是怎样的这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。