projecto-final-turinmachin/html/kan_8h_source.html

#ifndef PROG3_NN_FINAL_PROJECT_V2025_01_KAN_H

#define PROG3_NN_FINAL_PROJECT_V2025_01_KAN_H


#include <cassert>

#include <cstdint>

#include <iostream>

#include <vector>

#include "interfaces.h"

#include "utec/algebra/tensor.h"

#include "utec/utils/serialization.h"


namespace utec::neural_network {

    template <typename T>


    struct BSpline {

        size_t knots;


        T x_min;

        T x_max;


        T step;

        T inv_step;


        BSpline(size_t knots, T a, T b)

            : knots(knots),

              x_min(a),

              x_max(b),

              step((b - a) / (knots - 1)),

              inv_step(T{1} / step) {}


        auto eval(T x) const -> std::vector<T> {

            std::vector<T> B(knots, T{0});


            if (x <= x_min) {

                B[0] = T{1};

                return B;

            }

            if (x >= x_max) {

                B[knots - 1] = T{1};

                return B;

            }


            const T pos = (x - x_min) * inv_step;

            const auto i = static_cast<size_t>(pos);

            const T t = pos - i;


            B[i] = T{1} - t;

            B[i + 1] = t;

            return B;

        }


    };


    template <typename T>


    class Kan final : public ILayer<T> {

        size_t in_f;

        size_t out_f;

        size_t width;

        size_t knots;


        T x_min;

        T x_max;


        algebra::Tensor<T, 3> psi_weights;

        algebra::Tensor<T, 2> phi_weights;

        algebra::Tensor<T, 2> phi_biases;


        algebra::Tensor<T, 3> gradient_psi_weights;

        algebra::Tensor<T, 2> gradient_phi_weights;

        algebra::Tensor<T, 2> gradient_phi_biases;


        algebra::Tensor<T, 2> input;

        algebra::Tensor<T, 3> psi_output;

        algebra::Tensor<T, 2> psi_sum;


        BSpline<T> basis;


    public:


        Kan(const size_t in_f,

            const size_t out_f,

            const size_t knots,

            const T x_min = -1,

            const T x_max = +1)

            : in_f(in_f),

              out_f(out_f),

              width((2 * in_f) + 1),

              knots(knots),

              x_min(x_min),

              x_max(x_max),

              psi_weights(width, in_f, knots),

              phi_weights(out_f, width),

              phi_biases(1, out_f),

              gradient_psi_weights(width, in_f, knots),

              gradient_phi_weights(out_f, width),

              gradient_phi_biases(1, out_f),

              input(0, 0),

              psi_output(0, 0, 0),

              psi_sum(0, 0),

              basis(knots, x_min, x_max) {}


        Kan(const size_t in_f,

            const size_t out_f,

            const size_t knots,

            auto init_psi_w_fun,

            auto init_phi_w_fun,

            auto init_phi_b_fun)

            : Kan(in_f, out_f, knots) {

            init_psi_w_fun(psi_weights);

            init_phi_w_fun(phi_weights);

            init_phi_b_fun(phi_biases);

        }


        auto forward(const algebra::Tensor<T, 2>& x) -> algebra::Tensor<T, 2> override {

            input = x;

            const size_t B = x.shape()[0];


            psi_output.reshape(B, width, in_f);

            psi_sum.reshape(B, width);


            for (size_t b = 0; b < B; ++b) {

                for (size_t q = 0; q < width; ++q) {

                    T sum_q = 0;

                    for (size_t p = 0; p < in_f; ++p) {

                        auto&& Bk = basis.eval(x(b, p));

                        T acc = 0;

                        for (size_t k = 0; k < knots; ++k) {

                            acc += psi_weights(q, p, k) * Bk[k];

                        }

                        psi_output(b, q, p) = acc;

                        sum_q += acc;

                    }

                    psi_sum(b, q) = sum_q;

                }

            }


            auto phi_w_T = phi_weights.transpose_2d();

            auto out = algebra::matrix_product(psi_sum, phi_w_T);


            for (size_t b = 0; b < B; ++b) {

                for (size_t j = 0; j < out_f; ++j) {

                    out(b, j) += phi_biases(0, j);

                }

            }


            return out;

        }


        auto backward(const algebra::Tensor<T, 2>& dZ) -> algebra::Tensor<T, 2> override {

            const size_t B = input.shape()[0];


            gradient_phi_weights = algebra::matrix_product(dZ.transpose_2d(), psi_sum);

            // gradient_phi_weights = algebra::transpose_2d(gradient_phi_weights);


            gradient_phi_biases.fill(0);

            for (size_t j = 0; j < out_f; ++j) {

                for (size_t b = 0; b < B; ++b) {

                    gradient_phi_biases(0, j) += dZ(b, j);

                }

            }


            auto DPsiSum = algebra::matrix_product(dZ, phi_weights);


            gradient_psi_weights.fill(0);

            algebra::Tensor<T, 2> dInput(B, in_f);

            dInput.fill(0);


            for (size_t b = 0; b < B; ++b) {

                for (size_t q = 0; q < width; ++q) {

                    const T dPs = DPsiSum(b, q);

                    for (size_t p = 0; p < in_f; ++p) {

                        auto&& Bk = basis.eval(input(b, p));

                        T weighted_sum = 0;

                        for (size_t k = 0; k < knots; ++k) {

                            const T B_val = Bk[k];

                            gradient_psi_weights(q, p, k) += dPs * B_val;

                            weighted_sum += psi_weights(q, p, k) * B_val;

                        }

                        dInput(b, p) += dPs * weighted_sum;

                    }

                }

            }


            return dInput;

        }


        void update_params(IOptimizer<T>& optimizer) override {

            for (size_t q = 0; q < width; ++q) {

                auto psi_slice = psi_weights.slice(q);

                auto grad_slice = gradient_psi_weights.slice(q);

                optimizer.update(psi_slice, grad_slice);

                psi_weights.set_slice(q, psi_slice);

            }

            optimizer.update(phi_weights, gradient_phi_weights);

            optimizer.update(phi_biases, gradient_phi_biases);

        }


        [[nodiscard]] auto id() const -> LayerId override {

            return LayerId::Kan;

        }


        void save(std::ostream& out) const override {

            serialization::write_numeric<std::uint64_t>(out, in_f);

            serialization::write_numeric<std::uint64_t>(out, out_f);

            serialization::write_numeric<std::uint64_t>(out, knots);

            serialization::write_numeric<double>(out, x_min);

            serialization::write_numeric<double>(out, x_max);


            for (const auto& x : psi_weights) {

                serialization::write_numeric<T>(out, x);

            }


            for (const auto& x : phi_weights) {

                serialization::write_numeric<T>(out, x);

            }


            for (const auto& x : phi_biases) {

                serialization::write_numeric<T>(out, x);

            }

        }


        static auto load(std::istream& in) -> Kan<T> {

            auto in_feat = serialization::read_numeric<uint64_t>(in);

            auto out_feat = serialization::read_numeric<uint64_t>(in);

            auto knots = serialization::read_numeric<uint64_t>(in);

            T a = serialization::read_numeric<T>(in);

            T b = serialization::read_numeric<T>(in);


            Kan<T> layer(in_feat, out_feat, knots, a, b);

            for (auto& x : layer.psi_weights) {

                x = serialization::read_numeric<T>(in);

            }


            for (auto& x : layer.phi_weights) {

                x = serialization::read_numeric<T>(in);

            }


            for (auto& x : layer.phi_biases) {

                x = serialization::read_numeric<T>(in);

            }

            return layer;

        }


    };


}  // namespace utec::neural_network


#endif

x
return p * x
Definition catch_amalgamated.cpp:321

p
double p
Definition catch_amalgamated.cpp:251

Kan::Kan
Kan(const size_t in_f, const size_t out_f, const size_t knots, const T x_min=-1, const T x_max=+1)
Definition kan.h:77

utec::algebra::Tensor
Representa un tensor de tipo T y rango Rank.
Definition tensor.h:63

utec::algebra::Tensor::fill
void fill(const T &value) noexcept
Llena la data de un tesor con un valor.
Definition tensor.h:213

utec::neural_network::Kan::update_params
void update_params(IOptimizer< T > &optimizer) override
Actualiza los parámetros internos de la capa (si tiene).
Definition kan.h:184

utec::neural_network::Kan::Kan
Kan(const size_t in_f, const size_t out_f, const size_t knots, auto init_psi_w_fun, auto init_phi_w_fun, auto init_phi_b_fun)
Definition kan.h:99

utec::neural_network::Kan::Kan
Kan(const size_t in_f, const size_t out_f, const size_t knots, const T x_min=-1, const T x_max=+1)
Definition kan.h:77

utec::neural_network::Kan::load
static auto load(std::istream &in) -> Kan< T >
Definition kan.h:219

utec::neural_network::Kan::save
void save(std::ostream &out) const override
Guarda los parámetros internos de la capa en un flujo binario.
Definition kan.h:199

utec::neural_network::Kan::backward
auto backward(const algebra::Tensor< T, 2 > &dZ) -> algebra::Tensor< T, 2 > override
Propagación hacia atrás de la capa.
Definition kan.h:146

utec::neural_network::Kan::id
auto id() const -> LayerId override
Devuelve el tipo de la capa. Sirve para serialización o reconstrucción de la red.
Definition kan.h:195

utec::neural_network::Kan::forward
auto forward(const algebra::Tensor< T, 2 > &x) -> algebra::Tensor< T, 2 > override
Propagación hacia adelante de la capa.
Definition kan.h:111

serialization::read_numeric
auto read_numeric(std::istream &in) -> T
Definition serialization.h:17

serialization::write_numeric
void write_numeric(std::ostream &out, const T n)
Definition serialization.h:9

utec::algebra::matrix_product
constexpr auto matrix_product(const Tensor< T, 2 > &lhs, const Tensor< T, 2 > &rhs) -> Tensor< T, 2 >
Realiza producto matricial entre 2 tensores de dimension 2.
Definition tensor.h:563

utec::neural_network
Capa de activación de Rectified Linear Unit (ReLU). Los valores negativos del input se convierten en ...
Definition activation.h:14

utec::neural_network::LayerId
LayerId
Identificador para los diferentes tipos de capas en la red neuronal. Se emplea uint8_t (unsigned 8-bi...
Definition interfaces.h:11

utec::neural_network::LayerId::Kan
@ Kan
Definition interfaces.h:16

serialization.h

utec::neural_network::BSpline::inv_step
T inv_step
Definition kan.h:21

utec::neural_network::BSpline::step
T step
Definition kan.h:20

utec::neural_network::BSpline::eval
auto eval(T x) const -> std::vector< T >
Definition kan.h:30

utec::neural_network::BSpline::x_max
T x_max
Definition kan.h:18

utec::neural_network::BSpline::x_min
T x_min
Definition kan.h:17

utec::neural_network::BSpline::knots
size_t knots
Definition kan.h:15

utec::neural_network::BSpline::BSpline
BSpline(size_t knots, T a, T b)
Definition kan.h:23

utec::neural_network::IOptimizer
Interfaz para definir un optimizador (ej. SGD, Adam, ...). Un optimizador se encarga de actualizar lo...
Definition interfaces.h:26

utec::neural_network::IOptimizer::update
virtual void update(algebra::Tensor< T, 2 > &params, const algebra::Tensor< T, 2 > &gradients)=0
Actualiza los parámetros del modelo usando los gradientes.

tensor.h

interfaces.h