doxygen-c/html/torch_2csrc_2api_2src_2nn_2init_8cpp_source.html

 #include <torch/nn/init.h>

 #include <torch/types.h>
 #include <torch/utils.h>

 #include <ATen/ATen.h>
 #include <c10/util/Exception.h>

 #include <algorithm>
 #include <cmath>
 #include <cstddef>
 #include <tuple>

 namespace torch {
 namespace nn {
 namespace init {
 namespace {
 struct Fan {
   explicit Fan(Tensor& tensor) {
     const auto dimensions = tensor.ndimension();
     AT_CHECK(
         dimensions >= 2,
         "Fan in and fan out can not be computed for tensor with fewer than 2 dimensions");

     if (dimensions == 2) {
       in = tensor.size(1);
       out = tensor.size(0);
     } else {
       in = tensor.size(1) * tensor[0][0].numel();
       out = tensor.size(0) * tensor[0][0].numel();
     }
   }

   int64_t in;
   int64_t out;
 };

 double calculate_kaiming_std(
     Tensor tensor,
     double a,
     FanMode mode,
     Nonlinearity nonlinearity) {
   NoGradGuard guard;
   Fan fan(tensor);
   const auto gain = calculate_gain(nonlinearity, a);
   double std = 0.0;
   if (mode == FanMode::FanIn) {
     std = gain / std::sqrt(fan.in);
   } else {
     std = gain / std::sqrt(fan.out);
   }
   return std;
 }
 } // namespace

 double calculate_gain(Nonlinearity nonlinearity, double param) {
   if (nonlinearity == Nonlinearity::Tanh) {
     return 5.0 / 3.0;
   } else if (nonlinearity == Nonlinearity::ReLU) {
     return std::sqrt(2.0);
   } else if (nonlinearity == Nonlinearity::LeakyReLU) {
     return std::sqrt(2.0 / (1 + pow(param, 2)));
   }

   return 1.0;
 }

 Tensor constant_(Tensor tensor, Scalar value) {
   NoGradGuard guard;
   return tensor.fill_(value);
 }

 Tensor dirac_(Tensor tensor) {
   NoGradGuard guard;

   AT_CHECK(
       tensor.ndimension() >= 3 && tensor.ndimension() <= 5,
       "Only tensors with 3, 4, or 5 dimensions are supported");

   const auto sizes = tensor.sizes();
   const auto min_dim = std::min(sizes[0], sizes[1]);

   tensor.zero_();
   for (int64_t d = 0; d < min_dim; ++d) {
     switch (tensor.ndimension()) {
       case 3: // Temporal convolution
         tensor[d][d][sizes[2] / 2] = 1;
         break;
       case 4: // Spatial convolution
         tensor[d][d][sizes[2] / 2][sizes[3] / 2] = 1;
         break;
       case 5: // Volumetric convolution
         tensor[d][d][sizes[2] / 2][sizes[3] / 2][sizes[4] / 2] = 1;
         break;
     }
   }

   return tensor;
 }

 Tensor eye_(Tensor matrix) {
   NoGradGuard guard;
   AT_CHECK(
       matrix.ndimension() == 2, "Only tensors with 2 dimensions are supported");
   return torch::eye_out(matrix, matrix.size(0), matrix.size(1));
 }

 Tensor normal_(Tensor tensor, double mean, double std) {
   NoGradGuard guard;
   return tensor.normal_(mean, std);
 }

 Tensor ones_(Tensor tensor) {
   NoGradGuard guard;
   return tensor.fill_(1);
 }

 Tensor orthogonal_(Tensor tensor, double gain) {
   NoGradGuard guard;

   AT_CHECK(
       tensor.ndimension() >= 2,
       "Only tensors with 2 or more dimensions are supported");

   const auto rows = tensor.size(0);
   const auto columns = tensor.size(1);
   auto flattened = torch::randn({rows, columns});

   if (rows < columns) {
     flattened.t_();
   }

   // Compute the qr factorization
   Tensor q, r;
   std::tie(q, r) = torch::qr(flattened);
   // Make Q uniform according to https://arxiv.org/pdf/math-ph/0609050.pdf
   auto d = torch::diag(r, 0);
   auto ph = d.sign();
   q *= ph;

   if (rows < columns) {
     q.t_();
   }

   tensor.view_as(q).copy_(q);
   tensor.mul_(gain);

   return tensor;
 }

 Tensor sparse_(Tensor tensor, double sparsity, double std) {
   NoGradGuard guard;

   AT_CHECK(
       tensor.ndimension() == 2, "Only tensors with 2 dimensions are supported");

   const auto rows = tensor.size(0);
   const auto columns = tensor.size(1);
   const int64_t num_zeros = std::ceil(sparsity * rows);
   tensor.normal_(0, std);
   for (int64_t column = 0; column < columns; ++column) {
     auto row_indices = torch::randperm(rows, tensor.options().dtype(kLong));
     auto zero_indices =
         row_indices.slice(/*dim=*/0, /*start=*/0, /*end=*/num_zeros);
     tensor.index_put_(
         {zero_indices, torch::tensor(column, tensor.options().dtype(kLong))},
         torch::zeros(num_zeros, tensor.options()));
   }

   return tensor;
 }

 Tensor uniform_(Tensor tensor, double low, double high) {
   NoGradGuard guard;
   return tensor.uniform_(low, high);
 }

 Tensor kaiming_uniform_(
     Tensor tensor,
     double a,
     FanMode mode,
     Nonlinearity nonlinearity) {
   NoGradGuard guard;
   auto std = calculate_kaiming_std(tensor, a, mode, nonlinearity);
   // Calculate uniform bounds from standard deviation
   const auto bound = std::sqrt(3.0) * std;
   return tensor.uniform_(-bound, bound);
 }

 Tensor kaiming_normal_(
     Tensor tensor,
     double a,
     FanMode mode,
     Nonlinearity nonlinearity) {
   NoGradGuard guard;

   auto std = calculate_kaiming_std(tensor, a, mode, nonlinearity);
   return tensor.normal_(0, std);
 }

 Tensor xavier_normal_(Tensor tensor, double gain) {
   NoGradGuard guard;

   Fan fan(tensor);
   const auto std = gain * std::sqrt(2.0 / (fan.in + fan.out));
   return tensor.normal_(0, std);
 }

 Tensor xavier_uniform_(Tensor tensor, double gain) {
   NoGradGuard guard;
   Fan fan(tensor);
   const auto std = gain * std::sqrt(2.0 / (fan.in + fan.out));
   // Calculate uniform bounds from standard deviation with
   const auto a = std::sqrt(3.0) * std;
   return tensor.uniform_(-a, a);
 }

 Tensor zeros_(Tensor tensor) {
   NoGradGuard guard;
   return tensor.zero_();
 }

 } // namespace init
 } // namespace nn
 } // namespace torch
std
Definition: interned_strings.h:312

Tensor
Definition: ios_caffe_predictor.h:9

torch
Definition: jit_type.h:17