projecto-final-turinmachin/html/loss_8h_source.html

#ifndef PROG3_NN_FINAL_PROJECT_V2025_01_LOSS_H

#define PROG3_NN_FINAL_PROJECT_V2025_01_LOSS_H


#include <cmath>


#include "interfaces.h"


namespace utec::neural_network {


    template <typename T>


    class MSELoss final : public ILoss<T, 2> {

        algebra::Tensor<T, 2> y_prediction;


        algebra::Tensor<T, 2> y_true;


    public:

        template <typename Prediction, typename Expected>


        MSELoss(Prediction&& y_prediction, Expected&& y_true)

            : y_prediction(std::forward<Prediction>(y_prediction)),

              y_true(std::forward<Expected>(y_true)) {

            if (y_prediction.shape() != y_true.shape()) {

                throw std::invalid_argument("algebra::Tensors have incompatible shapes");

            }

        }


        auto loss() const -> T override {

            T sum = 0;

            const size_t num_elements = y_true.size();

            for (size_t i = 0; i < num_elements; ++i) {

                T difference = y_prediction[i] - y_true[i];

                sum += difference * difference;

            }

            return sum / static_cast<T>(num_elements);

        }


        auto loss_gradient() const -> algebra::Tensor<T, 2> override {

            return T(2) / y_true.size() * (y_prediction - y_true);

        }


    };


    template <typename T>


    class BCELoss final : public ILoss<T, 2> {

        algebra::Tensor<T, 2> y_prediction;

        algebra::Tensor<T, 2> y_true;


    public:

        template <typename Prediction, typename Expected>


        BCELoss(Prediction&& y_prediction, Expected&& y_true)

            : y_prediction(std::forward<Prediction>(y_prediction)),

              y_true(std::forward<Expected>(y_true)) {

            if (y_prediction.shape() != y_true.shape()) {

                throw std::invalid_argument("algebra::Tensors have incompatible shapes");

            }

        }


        auto loss() const -> T override {

            T sum = 0;

            const size_t num_elements = y_true.size();

            for (size_t i = 0; i < num_elements; ++i) {

                sum += y_true[i] * std::log(y_prediction[i]) +

                       (1 - y_true[i]) * std::log(1 - y_prediction[i]);

            }

            return -sum / static_cast<T>(num_elements);

        }


        auto loss_gradient() const -> algebra::Tensor<T, 2> override {

            return -((y_true / y_prediction) -

                     ((static_cast<T>(1) - y_true) / (static_cast<T>(1) - y_prediction))) /

                   y_true.size();

        }


    };


    template <typename T>


    class CrossEntropyLoss final : public ILoss<T, 2> {

        algebra::Tensor<T, 2> y_prediction;

        algebra::Tensor<T, 2> y_true;

        T epsilon;


    public:

        template <typename Prediction, typename Expected>


        CrossEntropyLoss(Prediction&& y_prediction, Expected&& y_true, const T epsilon = 1e-7)

            : y_prediction(std::forward<Prediction>(y_prediction)),

              y_true(std::forward<Expected>(y_true)),

              epsilon(epsilon) {

            if (y_prediction.shape() != y_true.shape()) {

                throw std::invalid_argument("algebra::Tensors have incompatible shapes");

            }

        }


        auto loss() const -> T override {

            T sum = 0;

            const std::size_t num_samples = y_true.shape()[0];

            const std::size_t num_classes = y_true.shape()[1];


            for (std::size_t i = 0; i < num_samples; ++i) {

                for (std::size_t j = 0; j < num_classes; ++j) {

                    const T pred = std::clamp(y_prediction(i, j), epsilon, 1 - epsilon);

                    sum += y_true(i, j) * std::log(pred);

                }

            }


            return -sum / num_samples;

        }


        auto loss_gradient() const -> algebra::Tensor<T, 2> override {

            const std::size_t num_samples = y_true.shape()[0];

            algebra::Tensor<T, 2> grad = y_prediction - y_true;

            return grad / num_samples;

        }


    };


}  // namespace utec::neural_network


#endif

Tensor
Representa un tensor de tipo T y rango Rank.
Definition tensor.h:63

Tensor::size
auto size() const -> size_t
Definition tensor.h:175

Tensor::shape
auto shape() const noexcept -> const std::array< size_t, Rank > &
Definition tensor.h:179

utec::algebra::Tensor
Representa un tensor de tipo T y rango Rank.
Definition tensor.h:63

utec::neural_network::BCELoss::loss_gradient
auto loss_gradient() const -> algebra::Tensor< T, 2 > override
Gradiente de la pérdida BCE con respecto a las predicciones.
Definition loss.h:114

utec::neural_network::BCELoss::loss
auto loss() const -> T override
Devuelve el valor de la pérdida BCE.
Definition loss.h:99

utec::neural_network::BCELoss::BCELoss
BCELoss(Prediction &&y_prediction, Expected &&y_true)
Constructor con predicciones y etiquetas verdaderas.
Definition loss.h:86

utec::neural_network::CrossEntropyLoss::CrossEntropyLoss
CrossEntropyLoss(Prediction &&y_prediction, Expected &&y_true, const T epsilon=1e-7)
Constructor que recibe tensores de predicciones y etiquetas reales.
Definition loss.h:141

utec::neural_network::CrossEntropyLoss::loss
auto loss() const -> T override
Valor de la pérdida Cross Entropy. Aplica logaritmo y protección contra valores extremos.
Definition loss.h:156

utec::neural_network::CrossEntropyLoss::loss_gradient
auto loss_gradient() const -> algebra::Tensor< T, 2 > override
Gradiente de la pérdida Cross Entropy. Simplemente calcula la diferencia entre predicción y etiqueta.
Definition loss.h:177

utec::neural_network::MSELoss::loss
auto loss() const -> T override
Devuelve el valor de la pérdida MSE.
Definition loss.h:47

utec::neural_network::MSELoss::MSELoss
MSELoss(Prediction &&y_prediction, Expected &&y_true)
Constructor que recibe predicciones y valores reales.
Definition loss.h:34

utec::neural_network::MSELoss::loss_gradient
auto loss_gradient() const -> algebra::Tensor< T, 2 > override
Gradiente de la pérdida con respecto a las predicciones.
Definition loss.h:62

utec::algebra
Definition tensor.h:49

utec::neural_network
Capa de activación de Rectified Linear Unit (ReLU). Los valores negativos del input se convierten en ...
Definition activation.h:14

utec::neural_network::ILoss
Interfaz para una función de pérdida (loss). Se encarga de calcular qué tan mal lo hizo la red con re...
Definition interfaces.h:102

interfaces.h