projecto-final-turinmachin/html/optimizer_8h_source.html

#ifndef PROG3_NN_FINAL_PROJECT_V2025_01_OPTIMIZER_H

#define PROG3_NN_FINAL_PROJECT_V2025_01_OPTIMIZER_H


#include <cmath>

#include "interfaces.h"


namespace utec::neural_network {

    template <typename T>


    class SGD final : public IOptimizer<T> {

        T learning_rate;


    public:


        explicit SGD(T learning_rate = 0.01)

            : learning_rate(learning_rate) {}


        void update(algebra::Tensor<T, 2>& params, const algebra::Tensor<T, 2>& grads) override {

            params = params - grads * learning_rate;

        }


    };


    template <typename T>


    class Adam final : public IOptimizer<T> {

        T learning_rate;


        T beta1;


        T beta2;


        T epsilon;


        algebra::Tensor<T, 2> m;


        algebra::Tensor<T, 2> v;


        std::size_t t = 0;


    public:


        explicit Adam(T learning_rate = 0.001, T beta1 = 0.9, T beta2 = 0.999, T epsilon = 1e-8)

            : learning_rate(learning_rate),

              beta1(beta1),

              beta2(beta2),

              epsilon(epsilon) {}


        void update(algebra::Tensor<T, 2>& params, const algebra::Tensor<T, 2>& grads) override {

            if (m.shape() != grads.shape()) {

                m.reshape(grads.shape());

                v.reshape(grads.shape());

            }


            step();

            m = beta1 * m + (T{1} - beta1) * grads;

            v = beta2 * v + (T{1} - beta2) * grads * grads;


            const algebra::Tensor<T, 2> m_hat = m / (T{1} - std::pow(beta1, t));

            const algebra::Tensor<T, 2> v_hat = v / (T{1} - std::pow(beta2, t));


            params -= m_hat * learning_rate /

                      (v_hat.apply([](const T x) { return std::sqrt(x); }) + epsilon);

        }


        void step() override {

            t += 1;

        }


    };


}  // namespace utec::neural_network


#endif

x
return p * x
Definition catch_amalgamated.cpp:321

utec::algebra::Tensor
Representa un tensor de tipo T y rango Rank.
Definition tensor.h:63

utec::algebra::Tensor::shape
auto shape() const noexcept -> const std::array< size_t, Rank > &
Definition tensor.h:179

utec::algebra::Tensor::apply
constexpr auto apply(auto fn) const -> Tensor< T, Rank >
Aplica una funcion a todos los elementos del tensor.
Definition tensor.h:548

utec::neural_network::Adam::step
void step() override
Incrementa el contador de pasos. Es importante para las correcciones de sesgo de Adam....
Definition optimizer.h:111

utec::neural_network::Adam::Adam
Adam(T learning_rate=0.001, T beta1=0.9, T beta2=0.999, T epsilon=1e-8)
Constructor de Adam con parámetros configurables.
Definition optimizer.h:75

utec::neural_network::Adam::update
void update(algebra::Tensor< T, 2 > &params, const algebra::Tensor< T, 2 > &grads) override
Actualiza los parámetros del modelo usando el algoritmo de Adam.
Definition optimizer.h:89

utec::neural_network::SGD::update
void update(algebra::Tensor< T, 2 > &params, const algebra::Tensor< T, 2 > &grads) override
Actualiza los parámetros en función del gradiente.
Definition optimizer.h:33

utec::neural_network::SGD::SGD
SGD(T learning_rate=0.01)
Constructor del optimizador.
Definition optimizer.h:24

utec::neural_network
Capa de activación de Rectified Linear Unit (ReLU). Los valores negativos del input se convierten en ...
Definition activation.h:14

utec::neural_network::IOptimizer
Interfaz para definir un optimizador (ej. SGD, Adam, ...). Un optimizador se encarga de actualizar lo...
Definition interfaces.h:26

interfaces.h