doxygen-c/html/dnnlowp_8h_source.html

 #pragma once

 #include <algorithm>
 #include <cassert>
 #include <cmath>
 #include <cstdint>
 #include <limits>

 #include <x86intrin.h>

 #include <fbgemm/QuantUtils.h>

 #include "caffe2/quantization/server/dynamic_histogram.h"
 #include "caffe2/utils/cpuid.h"

 namespace dnnlowp {

 using fbgemm::RequantizationParams;
 using fbgemm::TensorQuantizationParams;

 // Represents a quantization scheme that provides quantization parameter based
 // on distribution of data to be quantized.
 class QuantizationFactory {
  public:
   enum QuantizationKind {
     // A simple quantization scheme that determines quantization parameter by
     // just looking at min/max.
     MIN_MAX_QUANTIZATION,
     // Minimizes L2 norm of quantization error
     L2_MIN_QUANTIZATION,
     // fast search to remove histogram outliers and approximate L2 min
     L2_MIN_QUANTIZATION_APPROX,
     // Minimizes Kullback-Leibler divergence
     KL_MIN_QUANTIZATION,
     // Take 99 percentail (only works with sparsity preserving quantization)
     P99_QUANTIZATION,
     L1_MIN_QUANTIZATION,
   };

   static QuantizationFactory* GetDefaultInstance();

   TensorQuantizationParams ChooseQuantizationParams(
       float min,
       float max,
       int precision,
       bool preserve_sparsity,
       bool is_signed = false) const {
     TensorQuantizationParams qparams = fbgemm::ChooseQuantizationParams(
         min,
         max,
         is_signed ? -(1 << (precision - 1)) : 0,
         is_signed ? ((1 << (precision - 1)) - 1) : (1 << precision) - 1,
         preserve_sparsity,
         force_scale_power_of_two_);
     qparams.precision = precision;
     return qparams;
   }

   TensorQuantizationParams
   ChooseQuantizationParams(float min, float max, bool is_weight = false) const {
     return ChooseQuantizationParams(
         min,
         max,
         is_weight ? GetWeightPrecision() : GetActivationPrecision(),
         is_weight ? GetPreserveWeightSparsity()
                   : GetPreserveActivationSparsity());
   }

   TensorQuantizationParams ChooseQuantizationParams(
       const float* values,
       int len,
       QuantizationKind kind,
       int precision,
       bool preserve_sparsity) const;

   TensorQuantizationParams ChooseQuantizationParams(
       const float* values,
       int len,
       bool is_weight = false) const;

   TensorQuantizationParams ChooseQuantizationParams(
       const Histogram& hist,
       QuantizationKind kind,
       int precision,
       bool preserve_sparsity) const;

   TensorQuantizationParams ChooseQuantizationParams(
       const Histogram& hist,
       bool is_weight = false) const;

   // Given a real_multiplier, produces a pair (quantized_multiplier,
   // right_shift) where quantized_multiplier is an int32 representing a
   // fixed-point value (in practice we only produce positive values) and
   // right_shift is an amount to shift right by, so that the floating-point
   // multiplication of some int32 input value by real_multiplier,
   //
   //   return static_cast<int32>(int32_value * real_multiplier);
   //
   // is best approximated by the integer-arithmetic-only code
   //
   //   return RoundingRightShift(
   //       Multiplication(int32_value, quantized_multiplier),
   //       right_shift);
   //
   // Note: all this code only needs to run offline to generate the quantized
   // neural network workload, not at runtime on the device on which quantized
   // neural networks need to run. So it's not performance-critical at all.
   RequantizationParams ChooseRequantizationMultiplier(
       float real_multiplier,
       TensorQuantizationParams target_qparams) const;

   int GetActivationPrecision() const {
     return activation_precision_;
   }

   int GetWeightPrecision() const {
     return weight_precision_;
   }

   int GetEltwiseQuantizePrecision() const {
     return eltwise_quantize_precision_;
   }

   bool GetPreserveActivationSparsity() const {
     return preserve_activation_sparsity_;
   }

   bool GetPreserveWeightSparsity() const {
     return preserve_weight_sparsity_;
   }

   QuantizationKind GetActivationKind() const {
     return activation_kind_;
   }
   QuantizationKind GetWeightKind() const {
     return weight_kind_;
   }

   explicit QuantizationFactory(
       int activation_precision = 8,
       // precision used for activations in main operations like matmul
       int weight_precision = 8, // precision used for weights
       int requantization_multiplier_precision = 32,
       // precision used for the requantization multiplier
       int eltwise_quantize_precision = 16,
       // precision used for element-wise addition
       bool preserve_activation_sparsity = false,
       // preserve zeros in quantization
       bool preserve_weight_sparsity = false,
       // preserve zeros in quantization
       bool force_scale_power_of_two = false,
       // restrict scaling to a power of two
       QuantizationKind activation_kind = MIN_MAX_QUANTIZATION,
       QuantizationKind weight_kind = MIN_MAX_QUANTIZATION);

  private:
   int activation_precision_;
   int weight_precision_;
   int requantization_multiplier_precision_;
   int eltwise_quantize_precision_;
   bool preserve_activation_sparsity_;
   bool preserve_weight_sparsity_;
   bool force_scale_power_of_two_;
   QuantizationKind activation_kind_, weight_kind_;
 }; // class QuantizationFactory

 QuantizationFactory::QuantizationKind StringToKind(const std::string& s);

 } // namespace dnnlowp
dnnlowp
Definition: caffe2_dnnlowp_utils.cc:21

dnnlowp::QuantizationFactory::ChooseQuantizationParams
TensorQuantizationParams ChooseQuantizationParams(float min, float max, int precision, bool preserve_sparsity, bool is_signed=false) const
Choose quantization scale and zero_point that maps floating-point range [min, max] to the integer ran...
Definition: dnnlowp.h:46

dnnlowp::QuantizationFactory::ChooseQuantizationParams
TensorQuantizationParams ChooseQuantizationParams(float min, float max, bool is_weight=false) const
Choose quantization scale and zero_point that maps floating-point range [min, max] to the default int...
Definition: dnnlowp.h:67

dnnlowp::QuantizationFactory::GetDefaultInstance
static QuantizationFactory * GetDefaultInstance()
Get the default factory whose policy is determined by gflags.
Definition: dnnlowp.cc:100

dnnlowp::QuantizationFactory
Definition: dnnlowp.h:23

dnnlowp::Histogram
bin_width = (max - min)/nbins ith bin (zero-based indexing) contains [i*bin_width, (i+1)*bin_width) with an exception that (nbins - 1)th bin contains [(nbins-1)*bin_width, nbins*bin_width]
Definition: dynamic_histogram.h:17