doxygen-c/html/adam_8cpp_source.html

 #include <torch/optim/adam.h>

 #include <torch/csrc/autograd/variable.h>
 #include <torch/nn/module.h>
 #include <torch/serialize/archive.h>
 #include <torch/utils.h>

 #include <ATen/ATen.h>

 #include <cmath>
 #include <functional>

 namespace torch {
 namespace optim {
 AdamOptions::AdamOptions(double learning_rate)
     : learning_rate_(learning_rate) {}

 void Adam::step() {
   for (size_t i = 0; i < parameters_.size(); ++i) {
     Tensor p = parameters_.at(i);
     if (!p.grad().defined()) {
       continue;
     }

     if (options.weight_decay_ > 0) {
       p.grad() = p.grad() + options.weight_decay_ * p;
     }

     auto& exp_average = buffer_at(exp_average_buffers, i);
     auto& exp_average_sq = buffer_at(exp_average_sq_buffers, i);

     buffer_at(step_buffers, i) += 1;

     exp_average.mul_(options.beta1_).add_(p.grad(), 1 - options.beta1_);
     exp_average_sq.mul_(options.beta2_)
         .addcmul_(p.grad(), p.grad(), 1 - options.beta2_);

     Tensor denom = exp_average_sq;
     if (options.amsgrad_) {
       auto& max_exp_average_sq = buffer_at(max_exp_average_sq_buffers, i);
       max_exp_average_sq = torch::max(max_exp_average_sq, exp_average_sq);
       denom = max_exp_average_sq;
     }

     const auto bias_correction1 =
         1 - std::pow(options.beta1_, buffer_at(step_buffers, i));
     const auto bias_correction2 =
         1 - std::pow(options.beta2_, buffer_at(step_buffers, i));
     const auto step_size =
         options.learning_rate_ * std::sqrt(bias_correction2) / bias_correction1;

     NoGradGuard guard;
     p.addcdiv_(exp_average, denom.sqrt() + options.eps_, -step_size);
   }
 }

 void Adam::save(serialize::OutputArchive& archive) const {
   serialize(*this, archive);
 }

 void Adam::load(serialize::InputArchive& archive) {
   serialize(*this, archive);
 }
 } // namespace optim
 } // namespace torch
torch::optim::Adam::load
void load(serialize::InputArchive &archive) override
Deserializes the optimizer state from the given archive.
Definition: adam.cpp:61

torch::serialize::OutputArchive
Definition: output-archive.h:25

torch::optim::detail::OptimizerBase::parameters_
std::vector< Tensor > parameters_
The parameters this optimizer optimizes.
Definition: optimizer.h:83

torch::optim::Adam::save
void save(serialize::OutputArchive &archive) const override
Serializes the optimizer state into the given archive.
Definition: adam.cpp:57

Tensor
Definition: ios_caffe_predictor.h:9

torch::optim::detail::OptimizerBase::buffer_at
T & buffer_at(std::vector< T > &buffers, size_t index)
Accesses a buffer at the given index.
Definition: optimizer.h:68

torch
Definition: jit_type.h:17

torch::serialize::InputArchive
A recursive representation of tensors that can be deserialized from a file or stream.
Definition: input-archive.h:32