Merge pull request SmirkCao#7 from SmirkCao/hmm

HMM 书中正文部分, 后续单独补充习题部分.
GUANFULUO · Sep 20, 2018 · a60f8ff · a60f8ff
2 parents 43918b8 + c05db22
commit a60f8ff
Show file tree

Hide file tree

Showing 2 changed files with 339 additions and 5 deletions.
diff --git a/CH10/hmm.py b/CH10/hmm.py
@@ -0,0 +1,220 @@
+#! /usr/bin/env python
+#! -*- coding=utf-8 -*-
+# Project:  Lihang
+# Filename: hmm
+# Date: 9/17/18
+# Author: 😏 <smirk dot cao at gmail dot com>
+import numpy as np
+import argparse
+import logging
+import warnings
+
+
+class HMM(object):
+
+    def __init__(self, n_component=0,
+                 Q=None,
+                 V=None,
+                 n_iters=5):
+        self.A = None
+        self.B = None
+        self.p = None
+        self.M = 0
+        self.N = n_component
+        self.T = 0
+        self.Q = Q
+        self.V = V
+        self.n_iters = n_iters
+        self.alpha = None
+        self.beta = None
+        self.gamma = None
+        self.xi = None
+        self.Ei = None
+        self.Ei_ = None
+        self.Ei_j = None
+
+    def init_param(self, X):
+        # 最简单的初始化应该是均匀分布
+        # 另外的方法是Dirichlet Distribution
+        # todo: update Dirchlet Distribution
+        if self.V is not None:
+            self.M = len(self.V)
+        else:
+            warnings.warn("M warning")
+        self.A = np.ones((self.N, self.N))/self.N
+        self.B = np.ones((self.N, self.M))/self.M
+        self.p = np.ones(self.N)/self.N
+        self.T = len(X)
+        return self
+
+    def _do_forward(self, X):
+        # todo: logsumexp trick
+        alpha = np.zeros((self.N, self.T))
+        # A: NxM
+        # B: NxM
+        # alpha: NxT
+        t = 0
+        o = X[t]
+        alpha[:, t] = self.p * self.B[:, o]
+        t_rest = np.arange(1, self.T)
+        for t in t_rest:
+            o = X[t]
+            alpha[:, t] = np.sum(alpha[:, t-1]*self.A.T, axis=1)*self.B[:, o]
+
+        prob = np.sum(alpha[:, -1])
+        return prob, alpha
+
+    def _do_backward(self, X):
+        beta = np.ones((self.N, self.T))
+
+        t = -1
+        beta[:, t] = 1
+        # print(self.A, self.B, self.p, X)
+
+        t_rest = np.arange(self.T-1)[::-1]
+        for t in t_rest:
+            o = X[t+1]
+            beta[:, t] = np.sum(self.A*self.B[:, o]*beta[:, t+1], axis=1)
+
+        prob = np.sum(self.p*self.B[:, X[0]]*beta[:, 0])
+        # print(beta, prob, prob, "new")
+        return prob, beta
+
+    # 后面这两个主要是为了验证前向后向的结果
+    def forward(self, obs_seq):
+        """前向算法"""
+        # 来源: https://applenob.github.io/hmm.html
+        # F保存前向概率矩阵
+        F = np.zeros((self.N, self.T))
+        F[:, 0] = self.p * self.B[:, obs_seq[0]]
+
+        for t in range(1, self.T):
+            for n in range(self.N):
+                F[n, t] = np.dot(F[:, t - 1], (self.A[:, n])) * self.B[n, obs_seq[t]]
+
+        return F
+
+    def backward(self, obs_seq):
+        """后向算法"""
+        # X保存后向概率矩阵
+        # 来源: https://applenob.github.io/hmm.html
+        X = np.zeros((self.N, self.T))
+        X[:, -1:] = 1
+
+        for t in reversed(range(self.T - 1)):
+            X[:, t] = np.sum(self.A * self.B[:, obs_seq[t + 1]]*X[:, t + 1], axis=1)
+        prob = np.sum(self.p * self.B[:, 0] * X[:, 0])
+        # print(prob)
+        return X
+
+    def _do_estep(self, X):
+        # 在hmmlearn里面是会没有专门的estep的
+        _, self.alpha = self._do_forward(X)
+        _, self.beta = self._do_backward(X)
+        post_prior = self.alpha*self.beta
+        # Eq. 10.24
+        self.gamma = post_prior/np.sum(post_prior)
+        # Eq. 10.26
+        left_a = self.alpha
+        right_a = np.dot(self.B, np.eye(len(X))[X, :len(set(X))].T)*self.beta
+        trans_post_prior = np.array([x*self.A*y for x, y in zip(left_a[:, :-1].T, right_a[:, 1:].T)])
+        self.xi = trans_post_prior/np.sum(trans_post_prior)
+        # Eq. 10.27
+        self.Ei = np.sum(self.gamma, axis=1)
+        # Eq. 10.28
+        self.Ei_ = np.sum(self.gamma[:, :-1], axis=1)
+        # Eq. 10.29
+        self.Ei_j = np.sum(self.xi[:, :, :-1], axis=2)
+        return self
+
+    def _do_mstep(self, X):
+        # Eq. 10.39
+        self.A = self.Ei_j/self.Ei
+
+        # Eq. 10.40
+        gamma_o = np.array([np.outer(x, y) for x, y in zip(self.gamma.T, np.eye(len(X))[X, :len(set(X))].T)])
+        self.B = np.sum(gamma_o, axis=2).T/self.Ei.reshape(-1, 1)
+
+        # Eq. 10.41
+        self.p = self.gamma[:, 0]
+        return self
+
+    def fit(self, X):
+        # 估计模型参数
+        self.init_param(X)
+        for n_iter in range(self.n_iters):
+            self._do_estep(X)
+            self._do_mstep(X)
+            # convergence check
+            if False:
+                return rst
+        return self
+
+    def decode(self, X):
+        """
+        Find most likely state sequence corresponding to ``X``.
+        """
+        if self.T == 0:
+            warnings.warn("T warning")
+        if self.N == 0:
+            warnings.warn("N warning")
+
+        hidden_states = np.zeros(self.T)
+        delta = np.ones((self.N, self.T))
+        psi = np.zeros((self.N, self.T))
+
+        t = 0
+        o = X[t]
+        delta[:, t] = self.p*self.B[:, o]
+        psi[:, t] = 0
+        t_rest = np.arange(1, self.T)
+        for t in t_rest:
+            o = X[t]
+            delta[:, t] = np.max(delta[:, t-1]*self.A.T, axis=1)*self.B[:, o]
+            psi[:, t] = np.argmax(delta[:, t-1]*self.A.T, axis=1)
+
+        # print("参考答案")
+        # print(np.array([[0.1,     0.028,   0.00756],
+        #                 [0.016,   0.0504,  0.01008],
+        #                 [0.28,    0.042,   0.0147]]))
+        # print("程序结果")
+        # print(delta)
+
+        prob = np.max(delta[:, -1])
+        hidden_states[-1] = np.argmax(delta[:, -1])
+        # T in 1,...,T-1
+        t_rest = np.arange(self.T)[self.T - 1:0:-1]
+        for t in t_rest:
+            hidden_states[t-1] = np.argmax(delta[:, t]*self.A[:, int(hidden_states[t])], axis=0)
+
+        return prob, hidden_states
+
+    def predict(self, X):
+        """
+        Find most likely state sequence corresponding to ``X``.
+        """
+        rst = self.decode(X)
+        return rst
+
+    def predict_proba(self):
+        post_prior = 0
+
+        return post_prior
+
+    def sample(self):
+        rst = None
+        return rst
+
+    def score(self):
+        rst = None
+        return rst
+
+
+if __name__ == '__main__':
+    logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(name)s - %(levelname)s - %(message)s')
+    logger = logging.getLogger(__name__)
+
+    ap = argparse.ArgumentParser()
+    ap.add_argument("-p", "--path", required=False, help="path to input data file")
+    args = vars(ap.parse_args())
+
diff --git a/CH10/unit_test.py b/CH10/unit_test.py
@@ -8,11 +8,11 @@
 import numpy as np
 import pandas as pd
 import logging
-import warnings
 import unittest
 
 
-class TestMEMethods(unittest.TestCase):
+class TestHHMMethods(unittest.TestCase):
+    # @unittest.skip("EM only")
     def test_e101(self):
         logger.info("Exercise 10.1")
         raw_data = pd.read_csv("./Input/data_10-1.txt", header=0, index_col=0)
@@ -28,13 +28,14 @@ def test_e101(self):
         A = raw_data[raw_data.columns[-1-len(raw_data):-1]].values
         B = raw_data[raw_data.columns[:-1 - len(raw_data)]].values
         B = B / np.sum(B, axis=1).reshape((-1, 1))
-        B
+
         if raw_data[["pi"]].apply(np.isnan).values.flatten().sum() > 1:
             pi = [1/raw_data[["pi"]].apply(np.isnan).values.flatten().sum()]*N
         logger.info("\nT\n%s\nA\n%s\nB\n%s\npi\n%s\nM\n%s\nN\n%s\nO\n%s\nQ\n%s\nV\n%s"
                     % (T, A, B, pi, M, N, O, Q, V))
         pass
 
+    # @unittest.skip("EM only")
     def test_e102(self):
         logger.info("Exercise 10.2")
         raw_data = pd.read_csv("./Input/data_10-2.txt", header=0, index_col=0, na_values="None")
@@ -48,7 +49,7 @@ def test_e102(self):
         A = raw_data[raw_data.columns[-1-len(raw_data):-1]].values
         B = raw_data[raw_data.columns[:-1 - len(raw_data)]].values
         B = B / np.sum(B, axis=1).reshape((-1, 1))
-        B
+
         if raw_data[["pi"]].apply(np.isnan).values.flatten().sum() > 1:
             pi = [raw_data[["pi"]].apply(np.isnan).values.flatten().sum()]*N
         else:
@@ -60,9 +61,122 @@ def test_e102(self):
         logger.info(np.dot(pi*B[..., O[0]], A)*B[..., O[1]])
         logger.info(np.dot(np.dot(pi*B[..., O[0]], A)*B[..., O[1]], A)*B[..., O[2]])
         logger.info(np.sum(np.dot(np.dot(pi*B[..., O[0]], A)*B[..., O[1]], A)*B[..., O[2]]))
+        # backward
+        logger.info(np.dot(A, B[..., O[2]]))
 
+    # @unittest.skip("EM only")
     def test_e103(self):
-        pass
+        logger.info("Exercise 10.3")
+        raw_data = pd.read_csv("./Input/data_10-2.txt", header=0, index_col=0, na_values="None")
+        O = [0, 1, 0]
+        # 以上为已知
+        T= len(O)
+        Q = set(raw_data.columns[-1-len(raw_data):-1])
+        N = len(Q)
+        V = set(raw_data.columns[:-1-len(raw_data)])
+        M = len(V)
+        A = raw_data[raw_data.columns[-1-len(raw_data):-1]].values
+        B = raw_data[raw_data.columns[:-1 - len(raw_data)]].values
+        B = B / np.sum(B, axis=1).reshape((-1, 1))
+
+        if raw_data[["pi"]].apply(np.isnan).values.flatten().sum() > 1:
+            pi = [raw_data[["pi"]].apply(np.isnan).values.flatten().sum()]*N
+        else:
+            pi = raw_data[["pi"]].values.flatten()
+        logger.info("\nT\n%s\nA\n%s\nB\n%s\npi\n%s\nM\n%s\nN\n%s\nO\n%s\nQ\n%s\nV\n%s"
+                    % (T, A, B, pi, M, N, O, Q, V))
+        hmm_e103 = HMM(n_component=3)
+        hmm_e103.A = A
+        hmm_e103.B = B
+        hmm_e103.p = pi
+        hmm_e103.N = N
+        hmm_e103.T = T
+        hmm_e103.M = M
+
+        prob, states = hmm_e103.decode(O)
+        # p_star
+        self.assertAlmostEqual(0.0147, prob, places=5)
+        self.assertSequenceEqual([2, 2, 2], states.tolist())
+        logger.info("P star is %s, I star is %s" % (prob, states))
+
+    def test_forward(self):
+        # 10.2 数据
+        Q = {0: 1, 1: 2, 2: 3}
+        V = {0: "red", 1: "white"}
+        hmm_forward = HMM(n_component=3)
+        hmm_forward.A = np.array([[0.5, 0.2, 0.3],
+                                  [0.3, 0.5, 0.2],
+                                  [0.2, 0.3, 0.5]])
+        hmm_forward.B = np.array([[0.5, 0.5],
+                                  [0.4, 0.6],
+                                  [0.7, 0.3]])
+        hmm_forward.p = np.array([0.2, 0.4, 0.4])
+        X = np.array([0, 1, 0])
+        hmm_forward.T = len(X)
+
+        prob, alpha = hmm_forward._do_forward(X)
+        alpha_true = np.array([[0.10, 0.077, 0.04187],
+                               [0.16, 0.1104, 0.03551],
+                               [0.28, 0.0606, 0.05284]])
+        self.assertAlmostEqual(prob, 0.13022, places=5)
+        for x, y in zip(alpha_true.flatten().tolist(), alpha.flatten().tolist()):
+            self.assertAlmostEqual(x, y, places=5)
+
+    # @unittest.skip("EM only")
+    def test_backward(self):
+        # 10.2 数据
+        Q = {0: 1, 1: 2, 2: 3}
+        V = {0: "red", 1: "white"}
+        hmm_backward = HMM(n_component=3)
+        hmm_backward.A = np.array([[0.5, 0.2, 0.3],
+                                  [0.3, 0.5, 0.2],
+                                  [0.2, 0.3, 0.5]])
+        hmm_backward.B = np.array([[0.5, 0.5],
+                                  [0.4, 0.6],
+                                  [0.7, 0.3]])
+        hmm_backward.p = np.array([0.2, 0.4, 0.4])
+        X = np.array([0, 1, 0])
+        hmm_backward.T = len(X)
+
+        prob, alpha = hmm_backward._do_backward(X)
+        alpha_true = np.array([[0.10, 0.077, 0.04187],
+                               [0.16, 0.1104, 0.03551],
+                               [0.28, 0.0606, 0.05284]])
+        self.assertAlmostEqual(prob, 0.13022, places=5)
+
+    # @unittest.skip("EM only")
+    def test_bkw_frw(self):
+        # 并没有实际的测试内容
+        Q = {0: 1, 1: 2, 2: 3}
+        V = {0: "red", 1: "white"}
+        hmm_forward = HMM(n_component=3)
+        hmm_forward.A = np.array([[0.5, 0.2, 0.3],
+                                  [0.3, 0.5, 0.2],
+                                  [0.2, 0.3, 0.5]])
+        hmm_forward.B = np.array([[0.5, 0.5],
+                                  [0.4, 0.6],
+                                  [0.7, 0.3]])
+        hmm_forward.p = np.array([0.2, 0.4, 0.4])
+        X = np.array([0, 1, 0])
+        hmm_forward.T = len(X)
+
+        beta = hmm_forward.backward(X)
+        alpha = hmm_forward.forward(X)
+        logger.info("%s \n %s" % (alpha, beta))
+
+    # @unittest.skip("")
+    def test_EM(self):
+        logger.info("test EM")
+        V = {0: "red", 1: "white"}
+        hmm_fit = HMM(n_component=3, V=V)
+        X = np.array([0, 1, 0, 0])
+        hmm_fit.fit(X)
+        # prob, states = hmm_fit.decode([0, 1, 0, 0])
+        logger.info(hmm_fit.A)
+        logger.info(hmm_fit.B)
+        logger.info(hmm_fit.p)
+        # logger.info("prob %s " % prob)
+        # logger.info("states %s" % states)
 
 
 if __name__ == '__main__':