这篇文章主要介绍“pytorch tensor计算三通道均值方式是什么”,在日常操作中,相信很多人在pytorch tensor计算三通道均值方式是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”pytorch tensor计算三通道均值方式是什么”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
今天用pytorch处理图像时,涉及到了计算均值的问题,整理一下解决思路。
tensor转换为numpy再进行处理
import torch import cv2 img = cv2.imread("image path") tensor_img = torch.from_numpy((img[:, :, ::-1] / 255.0)[None, ...].transpose(0, 3, 1, 2)).cuda() ... numpy_img = (tensor_img.detach().cpu().numpy().transpose(2, 3, 1, 0).squeeze() * 255)[:, :, ::-1] ave_color = np.mean(numpy_img , axis=(0, 1))
如果图像里有0值,不想计入运算:
numpy_img[numpy_img == 0] = np.nan ave_color = np.nanmean(numpy_img, axis=(0, 1))
由于tensor和numpy来回转换会消耗资源、性能。
又查了一番,直接在tensor中计算(非零均值计算)
reshape_tensor_img = tensor_img.view(tensor_img.size(0), tensor_img.size(1), -1) ave_color = reshape_tensor_img.mean(2) # mean value without 0 non_zero_img = reshape_tensor_img[reshape_tensor_img.nonzero(as_tuple=True)] ave_color = non_zero_img.view(reshape_tensor_img.size(0), reshape_tensor_img.size(1), -1).mean(2)
计算完均值,想要加法运算的时候也会碰上一点维度上的麻烦,需要维度转换一下。
reshape_ave_color = ave_color.view(ave_color.size(0), ave_color.size(1), 1, 1) add_img = tensor_img + reshape_ave_color
1. 新建
A、torch.Tensor(shape)/torch.FloatTensor(shape):随机初始化一个维度为shape的张量。
B、torch.randn(shape):用均值为0,方差为1的高斯分布初始化一个shape的张量。
C、torch.rand(shape):在区间[0,1]上均匀分布,初始化一个shape的张量。
2、Tensor的变换
A、view / reshape
两个用法差不多,都是用来改变一个张量的数据分布。
注:(2,-1)中的-1会自动计算剩下的维度。
B、squeeze / unsqueeze
第一个是用来压缩维度为1的张量,如(6,1,32,32).squeeze()之后就变为(6,32,32);第二个是用来增加一个维度。具体看实例如下:
注:squeeze中不带参数,是将所有维度为1的地方去掉,带参数是去指定维度为1的地方,若指定的维度不为1,则不变。
注:在指定的维度上插入一个大小为1的新维度。
C、expand / repeat
这两个都是进行数据的扩充操作,第一个是扩充到指定的维度大小,第二个函数的参数维度上扩充的倍数。一般结合上面2.B中的函数使用。
D、 t / transpose / permute
这三个函数用来数据维度之间的调整,第一个只能用于2D。
E、broadcasting机制
相当于自动完成了unsqueeze+expand的操作,但是相比节省内存空间。
通过broadcasting机制,张量可以直接和标量进行相加。
到此,关于“pytorch tensor计算三通道均值方式是什么”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注亿速云网站,小编会继续努力为大家带来更多实用的文章!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。