cMHN/documentation_v1.0/nontt_2learn__theta_8hpp_source.html

// SPDX-License-Identifier: BSD-2-Clause


#ifndef cMHN_NONTT_LEARN_THETA_H

#define cMHN_NONTT_LEARN_THETA_H


#include <iostream>

#include <map>

#include <string>

#include <tuple>


#include <cmhn/common/calculate_pTheta.hpp>

#include <cmhn/nontt/mhn_operator.hpp>

#include <cmhn/utility/read_data.hpp>

#include <cmhn/utility/read_header.hpp>

#include <cmhn/utility/write_theta.hpp>


#include <prc.hpp>


namespace cMHN::nonTT

{

    template<class T, pRC::Size D, class S>

    std::tuple<pRC::Tensor<T, D, D>,

        std::map<std::string, std::string>,

        std::map<std::string, double>>

    learnTheta(pRC::Tensor<T, D, D> const &theta,

        std::string const &header, std::string const &output,

        std::map<S, T> const &pD, cMHN::Score<T> const &Score,

        cMHN::Regulator<T, D> const &Regulator, T const &toleranceOptimizer,

        T const &toleranceSolverP, T const &toleranceSolverQ)

    {

        auto tempTheta = theta;


        auto score = pRC::zero<T>();


        pRC::Index at_iter = 0;


        pRC::Float<64> startTime = pRC::getTimeInSeconds();


        std::map<std::string, double> logInfoNumbers{{"Score", score()},

            {"Iterations", at_iter},

            {"Time", pRC::getTimeInSeconds()() - startTime()},

            {"Lambda", Regulator.lambda()()}};


        std::map<std::string, std::string> logInfoNames{

            {"Score Name", Score.name()}, {"Regulator Name", Regulator.name()}};


        writeTheta(output, header, tempTheta, logInfoNames, logInfoNumbers);


        std::cout << "cMHN learning started (nonTT):" << std::endl;

        std::cout << "\tScore Name:\t" << logInfoNames["Score Name"]

                  << std::endl;

        std::cout << "\tRegulator Name:\t" << logInfoNames["Regulator Name"]

                  << std::endl

                  << std::endl;


        // use a random initial pInit

        pRC::SeedSequence seq(8, 16);

        pRC::RandomEngine rng(seq);

        pRC::GaussianDistribution<pRC::Float<>> dist;

        auto pInit = eval(expand(pRC::makeConstantSequence<pRC::Size, D, 2>(),

            [&](auto const... Ns)

            {

                return pRC::random<pRC::Tensor<T, Ns...>>(rng, dist);

            }));

        pInit = pInit / norm(pInit);


        tempTheta = pRC::optimize<pRC::Optimizer::BFGS<>>(

            tempTheta,

            [&output, &at_iter, &score, &pD, &Score, &Regulator, &pInit,

                &toleranceOptimizer, &toleranceSolverP,

                &toleranceSolverQ](auto const &tempTheta, auto &g)

            {

                MHNOperator<T, D> op(tempTheta);


                auto const pTheta =

                    ::cMHN::calculatePTheta(op, pInit, toleranceSolverP);


                // use last pTheta as next pInit

                pInit = pTheta;


                g = pRC::zero();

                score = pRC::zero();

                for(auto const &[k, v] : pD)

                {

                    score += Score.pointwiseScore(v, pTheta(k));

                }


                // calculate g = dS/dtheta

                auto rhs =

                    eval(expand(pRC::makeConstantSequence<pRC::Size, D, 2>(),

                        [](auto const... Ns)

                        {

                            return pRC::zero<pRC::Tensor<T, Ns...>>();

                        }));


                for(auto const &[k, v] : pD)

                {

                    rhs(k) = Score.pointwiseDSDP(v, pTheta(k));

                }


                auto q = pRC::solve<pRC::Solver::GMRES<>,

                    pRC::Operator::Transform::Transpose>(op, rhs,

                    pRC::zero<decltype(rhs)>(), toleranceSolverQ);


                // this follows appendix C of Rudi's Thesis

                for(pRC::Index i = 0; i < D; ++i)

                {

                    auto r = hadamardProduct(q,

                        cMHN::nonTT::applyDerivative(op, pTheta, i));


                    pRC::range<pRC::Context::CompileTime, D>(

                        [&](auto const j)

                        {

                            if(i == j)

                            {

                                g(i, j) = pRC::reduce<pRC::Add>(r)();

                            }

                            else

                            {

                                g(i, j) =

                                    pRC::reduce<pRC::Add>(pRC::chip<j>(r, 1))();

                            }

                        });

                }


                // add regularization

                // signs b/c pRC::Optimmizer::BFGS minimizes the score function

                g = Regulator.grad(tempTheta) - g;

                return Regulator.score(tempTheta) - score;

            },

            [&output, &header, &score, &at_iter, &startTime, &logInfoNames,

                &logInfoNumbers](auto const &tempTheta)

            {

                logInfoNumbers["Iterations"] = at_iter;

                logInfoNumbers["Score"] = score();

                logInfoNumbers["Time"] =

                    pRC::getTimeInSeconds()() - startTime();


                std::cout << "cMHN learning in progress (nonTT):" << std::endl;

                std::cout << std::defaultfloat;

                std::cout << "\tIteration:\t" << logInfoNumbers["Iterations"]

                          << std::endl;

                std::cout << std::scientific;

                std::cout << "\tLambda:\t\t" << logInfoNumbers["Lambda"]

                          << std::endl;

                std::cout << "\tScore:\t\t" << logInfoNumbers["Score"]

                          << std::endl;

                std::cout << "\tTime:\t\t" << logInfoNumbers["Time"]

                          << std::endl;

                std::cout << std::defaultfloat;


                writeTheta(output, header, tempTheta, logInfoNames,

                    logInfoNumbers);

                at_iter++;

            },

            toleranceOptimizer);


        return std::make_tuple(tempTheta, logInfoNames, logInfoNumbers);

    }

}


#endif // cMHN_NONTT_LEARN_THETA_H

D
pRC::Size const D
Definition: CalculatePThetaTests.cpp:9

calculate_pTheta.hpp

cMHN::Regulator
Class storing all relevant information for a regulator.
Definition: regulator.hpp:30

cMHN::Regulator::lambda
auto & lambda()
Definition: regulator.hpp:58

cMHN::Regulator::grad
auto grad(pRC::Tensor< T, D, D > const &theta) const
Definition: regulator.hpp:53

cMHN::Regulator::name
auto name() const
Definition: regulator.hpp:68

cMHN::Regulator::score
auto score(pRC::Tensor< T, D, D > const &theta) const
Definition: regulator.hpp:48

cMHN::Score
Class storing all relevant information for a score.
Definition: score.hpp:27

cMHN::Score::pointwiseScore
auto pointwiseScore(T const &pDE, T const &pThetaE) const
Definition: score.hpp:44

cMHN::Score::name
auto name() const
Definition: score.hpp:54

cMHN::Score::pointwiseDSDP
auto pointwiseDSDP(T const &pDE, T const &pThetaE) const
Definition: score.hpp:49

cMHN::nonTT::MHNOperator
Class storing an MHN operator represented by a theta matrix (for non TT calculations)
Definition: mhn_operator.hpp:23

T
pRC::Float<> T
Definition: externs_nonTT.hpp:1

cMHN::nonTT
Definition: learn_theta.hpp:20

cMHN::nonTT::applyDerivative
static constexpr auto applyDerivative(MHNOperator< T1, D > const &op, pRC::Tensor< T2, Ns... > const &x, pRC::Index const &i)
apply the derivative of an MHN Q wrt to theta_ii to a vector x
Definition: mhn_operator.hpp:71

cMHN::nonTT::learnTheta
std::tuple< pRC::Tensor< T, D, D >, std::map< std::string, std::string >, std::map< std::string, double > > learnTheta(pRC::Tensor< T, D, D > const &theta, std::string const &header, std::string const &output, std::map< S, T > const &pD, cMHN::Score< T > const &Score, cMHN::Regulator< T, D > const &Regulator, T const &toleranceOptimizer, T const &toleranceSolverP, T const &toleranceSolverQ)
Optimizes an MHN represented by a theta matrix to best describe a given data distribution.
Definition: learn_theta.hpp:55

cMHN::calculatePTheta
X calculatePTheta(nonTT::MHNOperator< T, D > const &op, X const &pInit, T const &toleranceSolver)
Calculates the vector pTheta given a nonTT MHN Operator and a tolerance.
Definition: calculate_pTheta.hpp:33

cMHN::writeTheta
static auto writeTheta(std::string const &filename, std::string const &header, pRC::Tensor< T, D, D > const &theta, std::map< std::string, std::string > const &logInfoNames={}, std::map< std::string, double > const &logInfoNumbers={})
Writes a theta matrix to file, including additional logging information at the bottom.
Definition: write_theta.hpp:29

mhn_operator.hpp

read_data.hpp

read_header.hpp

write_theta.hpp