cMHN/documentation_v1.0/calculate__score__and__gradient_8hpp_source.html

// SPDX-License-Identifier: BSD-2-Clause


#ifndef cMHN_COMMON_CALCULATE_SCORE_AND_GRADIENT_H

#define cMHN_COMMON_CALCULATE_SCORE_AND_GRADIENT_H


#include <map>

#include <tuple>


#include <cmhn/common/calculate_pTheta.hpp>

#include <cmhn/common/regulator.hpp>

#include <cmhn/common/score.hpp>

#include <cmhn/nontt/mhn_operator.hpp>

#include <cmhn/tt/mhn_operator.hpp>


#include <prc.hpp>


namespace cMHN

{

    template<class T, pRC::Size D, class S>

    std::tuple<T, pRC::Tensor<T, D, D>>

    calculateScoreAndGradient(nonTT::MHNOperator<T, D> const &op,

        std::map<S, T> const &pD, cMHN::Score<T> const &Score,

        cMHN::Regulator<T, D> const &Regulator, T const &toleranceSolverP = 1e-4,

        T const &toleranceSolverQ = 1e-4)

    {

        T score = pRC::zero();

        pRC::Tensor<T, D, D> g = pRC::zero();


        // use a random pInit

        pRC::SeedSequence seq(8, 16);

        pRC::RandomEngine rng(seq);

        pRC::GaussianDistribution<pRC::Float<>> dist;

        auto pInit = eval(expand(pRC::makeConstantSequence<pRC::Size, D, 2>(),

            [&](auto const... Ns)

            {

                return pRC::random<pRC::Tensor<T, Ns...>>(rng, dist);

            }));

        pInit = pInit / norm(pInit);


        auto const pTheta = calculatePTheta(op, pInit, toleranceSolverP);


        for(auto const &[k, v] : pD)

        {

            score += Score.pointwiseScore(v, pTheta(k));

        }


        // calculate g = dS/dtheta

        auto rhs =

            eval(expand(pRC::makeConstantSequence<pRC::Size, D, 2>(),

                [](auto const... Ns)

                {

                    return pRC::zero<pRC::Tensor<T, Ns...>>();

                }));


        for(auto const &[k, v] : pD)

        {

            rhs(k) = Score.pointwiseDSDP(v, pTheta(k));

        }


        auto const q = pRC::solve<pRC::Solver::GMRES<>,

            pRC::Operator::Transform::Transpose>(op, rhs,

            pRC::zero<decltype(rhs)>(), toleranceSolverQ);


        // this follows appendix C of Rudi's Thesis

        for(pRC::Index i = 0; i < D; ++i)

        {

            auto r = hadamardProduct(q,

                nonTT::applyDerivative(op, pTheta, i));


            pRC::range<pRC::Context::CompileTime, D>(

                [&](auto const j)

                {

                    if(i == j)

                    {

                        g(i, j) = pRC::reduce<pRC::Add>(r)();

                    }

                    else

                    {

                        g(i, j) = pRC::reduce<pRC::Add>(pRC::chip<j>(r, 1))();

                    }

                });

        }


        score -= Regulator.score(log(op.theta()));

        g -= Regulator.grad(log(op.theta()));


        return std::make_tuple(score, g);

    }


    template<pRC::Size RP, pRC::Size RQ, class T, pRC::Size D, class S>

    std::tuple<T, pRC::Tensor<T, D, D>>

    calculateScoreAndGradient(TT::MHNOperator<T, D> const &op,

        std::map<S, T> const &pD, cMHN::Score<T> const &Score,

        cMHN::Regulator<T, D> const &Regulator, T const &toleranceSolverP = 1e-4,

        T const &toleranceSolverQ = 1e-4)

    {

        using ModeSizes = decltype(TT::getModeSizes<D>());

        using Ranks = decltype(TT::getRanks<D, RP>());


        T score = pRC::zero();

        pRC::Tensor<T, D, D> g = pRC::zero();


        // use a random pInit

        pRC::SeedSequence seq(8, 16);

        pRC::RandomEngine rng(seq);

        pRC::GaussianDistribution<pRC::Float<>> dist;

        auto pInit = round<Ranks>(

            pRC::random<pRC::TensorTrain::Tensor<T, ModeSizes, Ranks>>

            (rng, dist));

        pInit /= scalarProduct(pInit,

            pRC::unit<pRC::TensorTrain::Tensor<T, ModeSizes>>())();


        auto const pTheta =

            calculatePTheta<RP>(op, pInit, toleranceSolverP);


        T scoreT = pRC::zero();

        pRC::Tensor<T, D, D> gT = pRC::zero();

#if defined(_OPENMP)

    #pragma omp declare reduction(+: T, pRC::Tensor<T, D, D>: omp_out = omp_in + omp_out) \

        initializer (omp_priv(pRC::Zero()))

    #pragma omp parallel for schedule(dynamic, 10) reduction(+ : scoreT, gT)

#endif

        for(pRC::Index s = 0; s < pD.size(); ++s)

        {

            auto it = pD.cbegin();

            std::advance(it, s);

            auto const [k, v] = *it;

            auto const pThetaE = pTheta(k);


            scoreT += Score.pointwiseScore(v, pThetaE);


            auto const rhs =

                pRC::TensorTrain::Tensor<T, ModeSizes>::Single(

                    pRC::identity<T>(), k);


            // solve (1-Q)T * q = rhs

            auto const q = TT::ALS<RQ, pRC::Operator::Transform::Transpose>(

                op, rhs, toleranceSolverQ);


            pRC::Tensor<T, D, D> tmp = pRC::zero();

            for(pRC::Index i = 0; i < D; ++i)

            {

                for(pRC::Index j = 0; j < D; ++j)

                {

                    gT(i, j) = -Score.pointwiseDSDP(v, pThetaE) *

                        scalarProduct(q, op.derivative(i, j) * pTheta)();

                }

            }

        }


        score += scoreT - Regulator.score(log(op.theta()));

        g += gT - Regulator.grad(log(op.theta()));


        return std::make_tuple(score, g);

    }

}


#endif

D
pRC::Size const D
Definition: CalculatePThetaTests.cpp:9

calculate_pTheta.hpp

cMHN::Regulator
Class storing all relevant information for a regulator.
Definition: regulator.hpp:30

cMHN::Regulator::grad
auto grad(pRC::Tensor< T, D, D > const &theta) const
Definition: regulator.hpp:53

cMHN::Regulator::score
auto score(pRC::Tensor< T, D, D > const &theta) const
Definition: regulator.hpp:48

cMHN::Score
Class storing all relevant information for a score.
Definition: score.hpp:27

cMHN::Score::pointwiseScore
auto pointwiseScore(T const &pDE, T const &pThetaE) const
Definition: score.hpp:44

cMHN::Score::pointwiseDSDP
auto pointwiseDSDP(T const &pDE, T const &pThetaE) const
Definition: score.hpp:49

cMHN::TT::MHNOperator
Class storing an MHN operator represented by a theta matrix (for TT calculations)
Definition: mhn_operator.hpp:23

cMHN::TT::MHNOperator::theta
constexpr auto & theta(pRC::Index const i, pRC::Index const j) const
Definition: mhn_operator.hpp:33

cMHN::TT::MHNOperator::derivative
constexpr auto derivative(pRC::Index const i, pRC::Index const j) const
Definition: mhn_operator.hpp:76

cMHN::nonTT::MHNOperator
Class storing an MHN operator represented by a theta matrix (for non TT calculations)
Definition: mhn_operator.hpp:23

cMHN::nonTT::MHNOperator::theta
constexpr auto & theta(pRC::Index const i, pRC::Index const j) const
Definition: mhn_operator.hpp:33

T
pRC::Float<> T
Definition: externs_nonTT.hpp:1

cMHN::nonTT::applyDerivative
static constexpr auto applyDerivative(MHNOperator< T1, D > const &op, pRC::Tensor< T2, Ns... > const &x, pRC::Index const &i)
apply the derivative of an MHN Q wrt to theta_ii to a vector x
Definition: mhn_operator.hpp:71

cMHN
Definition: calculate_pTheta.hpp:15

cMHN::calculateScoreAndGradient
std::tuple< T, pRC::Tensor< T, D, D > > calculateScoreAndGradient(nonTT::MHNOperator< T, D > const &op, std::map< S, T > const &pD, cMHN::Score< T > const &Score, cMHN::Regulator< T, D > const &Regulator, T const &toleranceSolverP=1e-4, T const &toleranceSolverQ=1e-4)
Calculate score and gradient of a theta matrix given some data distribution pD.
Definition: calculate_score_and_gradient.hpp:35

cMHN::calculatePTheta
X calculatePTheta(nonTT::MHNOperator< T, D > const &op, X const &pInit, T const &toleranceSolver)
Calculates the vector pTheta given a nonTT MHN Operator and a tolerance.
Definition: calculate_pTheta.hpp:33

mhn_operator.hpp

regulator.hpp

score.hpp

mhn_operator.hpp