多元高斯及其极大似然估计
参考:https://blog.csdn.net/Joyliness/article/details/80097491
1. 独立多元高斯的概率密度函数
n个独立的随机变量(x1,x2,…xn)的联合密度函数为
fμ,Σ(xx)=1√(2π)ndetΣe−12(xx−μμ)TΣ−1(xx−μμ)就是多元高斯分布(Multivariate Normal Distribution,MVN)。其中,μμ是各个随机变量的期望值所组成的向量,Σ是随机变量间的协方差矩阵,是n×n的正定矩阵。
2. 多元高斯的极大似然估计
对于N个满足多元高斯分布的独立样本集:{xx1,xx2,..,xxN},xx∈Rn,似然函数为:
N∏i=1fμ,Σ(xxi)=(2π)−Nn2|Σ|−N2e−12∑Ni=1(xxi−μμ)TΣ−1(xxi−μμ)取对数:
lnL(μμ,Σ)=lnN∏i=1fμ,Σ(xxi)=−Nn2ln2π−N2ln|Σ|−N∑i=1(xxi−μμ)TΣ−1(xxi−μμ)=C−N2ln|Σ|−12N∑i=1(xxi−μμ)TΣ−1(xxi−μμ)其中C=−Nn2ln2π是一个与参数μμ,Σ 无关的常数,因此:
argmaxμμ,ΣlnN∏i=1fμ,Σ(xxi)- lnL(μμ,Σ)对μμ求偏导(标量对向量求偏导)
先将∑Ni=1(xxi−μμ)TΣ−1(xxi−μμ)展开,得到:
N∑i=1xxTiΣ−1xxi−2N∑i=1xxTΣ−1μμ+NμμTΣ−1μμ后两项对μμ求偏导得到:
−2N∑i=1Σ−1xxi+2NΣ−1μμ因此:
∂lnL(μμ,Σ)∂μμ=2N∑i=1Σ−1xxi−2NΣ−1μμ=0求得:
¯μμ=1NN∑i=1xxi- lnL(μμ,Σ)对Σ求偏导(标量对矩阵求偏导)
tips:∂det(X)∂X=det(X)tr(X−1)
∂−N2lndet(Σ)∂Σ=−N2tr(X−1)∂lnL(μμ,Σ)∂Σ=0解得:
ˉΣ=1NN∑i=1(xxi−¯μμ)(xxi−¯μμ)T