PyTorch中,你可以使用torchvision.transforms
模块中的预定义函数来对图像进行增强。以下是一些常用的图像增强参数及其设置方法:
RandomHorizontalFlip
:随机水平翻转图像。
transform = transforms.Compose([
transforms.RandomHorizontalFlip()
])
RandomRotation
:随机旋转图像。
transform = transforms.Compose([
transforms.RandomRotation(degrees=10) # degrees表示旋转的角度范围
])
ColorJitter
:随机调整图像的亮度、对比度、饱和度和色调。
transform = transforms.Compose([
transforms.ColorJitter(brightness=0.2, contrast=0.2, saturation=0.2, hue=0.1)
])
RandomResizedCrop
:随机裁剪图像并调整大小。
transform = transforms.Compose([
transforms.RandomResizedCrop(size=(224, 224)) # size表示目标图像的大小
])
ToTensor
:将图像转换为PyTorch张量。
transform = transforms.Compose([
transforms.ToTensor()
])
Normalize
:对图像进行归一化处理。
transform = transforms.Compose([
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])
你可以根据需要组合这些增强参数,例如:
transform = transforms.Compose([
transforms.RandomHorizontalFlip(),
transforms.RandomRotation(degrees=10),
transforms.ColorJitter(brightness=0.2, contrast=0.2, saturation=0.2, hue=0.1),
transforms.RandomResizedCrop(size=(224, 224)),
transforms.ToTensor(),
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])
请注意,这些参数的默认值可能不适用于所有情况。你可以根据需要调整它们的值以获得最佳性能。