在PyTorch中,动量(Momentum)是一种用于加速SGD优化的技术。动量的核心思想是利用之前的梯度来平滑更新过程,从而减少在高曲率区域里的震荡。动量的默认值通常为0.9,但你可以根据你的具体任务和数据集进行调整。
要在PyTorch中设置动量,你需要在创建优化器时设置momentum
参数。以下是一个示例:
import torch
import torch.optim as optim
# 创建一个简单的模型
model = torch.nn.Linear(10, 1)
# 定义损失函数和优化器,设置动量为0.5
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.5)
在这个例子中,我们创建了一个线性模型,并使用带有动量的SGD优化器进行训练。我们将动量设置为0.5,你可以根据你的需求调整这个值。
请注意,动量的最佳值通常取决于具体问题和数据集。你可能需要进行多次实验来确定最佳的动量值。