貝葉斯決策

時間：2023-05-01 00:57:10 資料我要投稿

相關推薦

貝葉斯決策

模式識別

第2章貝葉斯決策理論與統計判別方法

武漢大學電子信息學院

貝葉斯決策理論

模式識別

學習指南

主要內容是說明分類識別中為什么會有錯分類, 在何種情況下會出現錯分類?錯分類的可能性會有多大?在理論上指明了怎樣才能使錯分類最少? 不同的錯分類造成的危害是不同的,有的錯分類種類造成的危害更大,因此控制這種錯分類則是更重要的.為此引入了一種"風險"與"損失" 概念,希望做到使風險最小.要著重理解"風險" 與"損失"的概念,以及在引入"風險"概念后的處理方法.

武漢大學電子信息學院

貝葉斯決策理論

模式識別

理解這一章的關鍵是要正確理解先驗概率, 類概率密度函數,后驗概率這三種概率, 對這三種概率的定義,相互關系要搞得清清楚楚.Bayes公式正是體現這三者關系的式子,要透徹掌握.

武漢大學電子信息學院

貝葉斯決策理論

模式識別

2.1 引言

模式識別是一種分類(classify)問題,即根據識別對象所呈現的觀察值,將其分到某個類別中去.統計決策理論是處理模式分類問題的基本理論之一,對模式分析和分類器(classifier)的設計起指導作用.貝葉斯決策理論是統計模式識別中的一個基本方法, 我們先討論這一決策理論,然后討論涉及統計判別方法的一些基本問題.

武漢大學電子信息學院

貝葉斯決策理論

模式識別

特征向量與特征空間

例:蘋果的直徑尺寸限定在7厘米到15厘米之間,它們的重量在3兩到8兩之間變化. 如果直徑長度x用厘米為單位,重量y以兩為單位.那么,由x值從7到15,y值從3到8 包圍的二維空間就是對蘋果進行度量的特征空間.

總體概率分布已知要決策分類的類別數一定

武漢大學電子信息學院

貝葉斯決策理論

模式識別

貝葉斯決策理論所要討論的問題

各類別ωi=1,2,…,c的先驗概率P(ωi)及類條件概率密度函數p(x|ωi)已知的條件下,如何對某一樣本按其特征向量分類的問題. 幾種常用的決策規則正態分布時統計決策的問題以及錯誤概率等問題

武漢大學電子信息學院

貝葉斯決策理論

模式識別

2.2 幾種常用的決策規則

不同的決策規則反映了分類器設計者的不同考慮,對決策結果有不同的影響.其中最有代表性的是: 基于最小錯誤率的貝葉斯決策基于最小風險的貝葉斯決策

武漢大學電子信息學院

貝葉斯決策理論

模式識別

2.2.1 基于最小錯誤率的貝葉斯決策

分類識別中為什么會有錯分類,在何種情況下會出現錯分類?錯分類的可能性會有多大? 當某一特征向量值X只為某一類物體所特有,即

對其作出決策是容易的,也不會出什么差錯.問題在于出現模棱兩可的情況.此時,任何決策都存在

判錯的可能性. 條件概率 :P(*|#)是條件概率的通用符號,P(ωK|X) 是表示在X出現條件下,樣本為ωK類的概率.

武漢大學電子信息學院

貝葉斯決策理論

模式識別

先驗概率,后驗概率,概率密度函數

先驗概率 P(ω1) 及P(ω2)

由先驗知識在識別前就得到的概率

后驗概率 P(ω1|X) 概率密度函數 P(X|ω1) 及P(X|ω2) 聯合概率 P(X, ωi)

武漢大學電子信息學院

貝葉斯決策理論

模式識別

先驗概率,后驗概率,概率密度函數

Bayes(貝葉斯)公式是根據聯合概率這一概念推出的 P(x,ωi)=P(x|ωi)P(ωi)=P(ωi|x)P(x)

貝葉斯公式實質上是通過觀察x,把狀態的先驗概率P(i)轉化為后驗概率P(i|x)

武漢大學電子信息學院

貝葉斯決策理論

模式識別

圖2.1

武漢大學電子信息學院

貝葉斯決策理論

模式識別

圖2.2

武漢大學電子信息學院

貝葉斯決策理論

模式識別

基于最小錯誤率的貝葉斯決策

基于最小錯誤概率的貝葉斯決策理論就是按后驗概率的大小作判決的 (1)后驗概率: 如果則

武漢大學電子信息學院

貝葉斯決策理論

模式識別

(2)如果則 (3)似然比: 如果則

否則

武漢大學電子信息學院

貝葉斯決策理論

模式識別

(4)似然比寫成相應的負對數形式: 如果

則否則

武漢大學電子信息學院

貝葉斯決策理論

模式識別

例2.1

假設在某地區切片細胞中正常(ω1)和異常 (ω2)兩類的先驗概率分別為P(ω1)=0.9, P(ω2)=0.1.現有一待識別細胞呈現出狀態 x,由其類條件概率密度分布曲線查得 p(x|ω1)=0.2,p( x|ω2)=0.4,試對細胞x 進行分類. 解:利用貝葉斯公式,分別計算出狀態為x 時ω1與ω2的后驗概率

武漢大學電子信息學院

貝葉斯決策理論

模式識別

P(ω1|x)=0.818>P(ω2|x)=0.0182 因此判定該細胞為正常細胞比較合理.

武漢大學電子信息學院

貝葉斯決策理論

模式識別

基于最小錯誤率的貝葉斯決策的證明

平均錯誤率 :在觀測值可能取值的整個范圍內錯識率的均值

武漢大學電子信息學院

貝葉斯決策理論

模式識別

兩類別情況:

當P(w2|x)>p(w1|x)時決策為w2,對觀測值x有P(w1|x)概率的錯誤率

R1:作出w1決策的所有觀測值區域,條件錯誤概率為p(w2|x) R2: 條件錯誤概率為p(w1|x).因此平均錯誤率P(e)可表示成

武漢大學電子信息學院

貝葉斯決策理論

模式識別

在R1區內任一個x值都有P(w2|x)

(2-9)

武漢大學電子信息學院

模式識別

錯誤率為圖中兩個劃線部分之和, 對應的錯誤率區域面積為最小.

武漢大學

電子信息學院

貝葉斯決策理論

模式識別

C類別情況 :

最小錯誤率貝葉斯決策規則: 如果則 X∈ω i (2-10) 用先驗概率與類條件概率密度相聯系的形式,得 : 如果

武漢大學電子信息學院

(2-11)

貝葉斯決策理論

模式識別

計算平均正確分類概率P(c)即

(2-12)

平均錯誤率 :P(e)=1-P(c)

武漢大學電子信息學院

貝葉斯決策理論

模式識別

例: 應用貝葉斯決策的膚色提取

武漢大學電子信息學院

貝葉斯決策理論

模式識別

利用貝葉斯原理,可以建立簡單的膚色模型,并用來從圖像中提取手部,臉部膚色,進而得到人的身體姿勢. 1.先在一副訓練圖象中手工描繪出膚色區域, 2.然后統計每種顏色點在膚色區域中出現的次數和在區域外出現的次數的比值,作為這種顏色是膚色的概率

武漢大學電子信息學院

貝葉斯決策理論

模式識別

3.這樣就得到了一張查找表,表中的每個元素是這個點是膚色的概率.我們就得到了一個點是不是膚色的概率分布.以上的"顏色訓練結果窗口"就是這樣一張表的直觀顯示.實際表格是三維的(HSI顏色空間,32×32×8)把這個條形區域分成八塊以后,每一塊是個32×32 的正方形,表示HS空間下的概率分布,顏色越亮,說明這種顏色是膚色的概率越大. 4.再加上域值限制之后,認為只有概率大于一定域值的才是膚色.

武漢大學電子信息學院

貝葉斯決策理論

模式識別

2.2.2基于最小風險的貝葉斯決策

使錯誤率最小并不一定是一個普遍適用的最佳選擇. 一個與損失有關聯的,更為廣泛的概念——風險

(2-13) 觀測樣本X實屬類別j,而被判為狀態i時所造成的損失, Ri則表示了觀測值X被判為i類時損失的均值分類則依據Ri,(i=1,…,c)中的最小值,即最小風險來定.

武漢大學電子信息學院

貝葉斯決策理論

模式識別

例 :病理切片

ω1表示病理切片正常 ω2表示病理切片異常 P(ω1|X)與P(ω2|X)分別表示了兩種可能性的大小 : X確實是癌細胞(ω2),但被判作正常(ω1) 損失 : X確實是正常(ω1),卻被判定為異常(ω2) 損失

武漢大學電子信息學院

貝葉斯決策理論

模式識別

定義:

自然狀態 :指待識別對象的類別 A={ α1,α2,……αn} 狀態空間:由所有自然狀態所組成的空間 , Ω={ω1,ω2,…,ωc} 決策 :不僅包括根據觀測值將樣本劃歸哪一類別(狀態),還可包括其它決策,如"拒絕"等決策空間 :由所有決策組成的空間

武漢大學電子信息學院

貝葉斯決策理論

模式識別

損失函數λ(αi|ωj)(或寫成λ(αi,ωj) ) 觀測值X條件下的期望損失R(αi|X), i=1,2,…,a (2-14) Ri: 條件風險

武漢大學電子信息學院

貝葉斯決策理論

模式識別

最小風險貝

葉斯決策規則

如果期望風險R 則α=αk

(2-15)

(2-16)

它表示對所有X取值所作的決策α(X)所帶來的平均風險

武漢大學電子信息學院

貝葉斯決策理論

模式識別

最小風險貝葉斯決策步驟

根據貝葉斯公式計算出后驗概率 : j=1,…,x 利用計算出的后驗概率及決策表,計算出采取αi,i=1,…,a的條件風險

j=1,…,x

找出使條件風險最小的決策αk,即

武漢大學電子信息學院

貝葉斯決策理論

模式識別

例2.2

P(ω1)=0.9, P(ω2)=0.1 p(X|ω1)=0.2, p(X|ω2)=0.4 λ11=0, λ12=6, λ21=1, λ22=0 后驗概率 P(ω1|X)=0.818, P(ω2|X)=0.182

武漢大學電子信息學院

貝葉斯決策理論

條件風險

模式識別

由于R(α1|X)>R(α2|X) 判待識別的細胞X為ω2類——異常細胞比較例2.1 P(ω1|X)=0.818, P(ω2|X)=0.182 ,正常細胞

武漢大學電子信息學院

貝葉斯決策理論

模式識別

兩種決策方法之間的關系

基于最小錯誤率的決策是基于最小風險決策的一個特例設損失函數為

式中假定對C類只有C個決策,即不考慮 "拒絕"等其它情況,(2-17)表明,當作出正確決策(即i=j)時沒有損失,而對于任何錯誤決策,其損失均為1.這樣定義的損失函數稱為0—1損失函數.

武漢大學電子信息學院

貝葉斯決策理論

模式識別

兩種決策方法之間的關系

根據(2-14)式條件風險為

最小錯誤率貝葉斯決策就是在0—1損失函數條件下的最小風險貝葉斯決策

武漢大學電子信息學院

貝葉斯決策理論

模式識別

圖2.4

武漢大學電子信息學院

貝葉斯決策理論

模式識別

圖2.3 與圖2.4

武漢大學電子信息學院

貝葉斯決策理論

模式識別

2.2.4判別函數,決策面與分類器設計

決策域 :待識別的特征向量落在哪個決策域,該樣本就被判為哪一類. 決策面 :決策域的邊界面判別函數 :用于表達決策規則的某些函數

武漢大學電子信息學院

貝葉斯決策理論

模式識別

例 :兩類別問題按最小錯誤率作決策

相應的判別函數: gi(X)=P(ωi|X), i=1,2 決策面方程 : g1(X)=g2(X) 決策規則如果gi(X)>gj(X) i,j=1,2 且 i≠j 則X∈ωi

武漢大學電子信息學院

貝葉斯決策理論

模式識別

多類別情況決策規則:

如果則將X歸于ωi類決策面 : 當ωi的決策域與ωj的決策域相鄰時,以下關系決定了相應的決策面 gi(X)=gj(X)

武漢大學電子信息學院

貝葉斯決策理論

模式識別

圖2.5(a)表示了一個三類別問題用一維特征空間時的所有決策邊界,而圖2.5(b)則表示了相應的二維特征空間中的決策邊界

武漢大學電子信息學院

貝葉斯決策理論

模式識別

兩類別問題分類器的框圖:

武漢大學電子信息學院

貝葉斯決策理論

模式識別

多類別分類器的結構框圖:

武漢大學電子信息學院

貝葉斯決策理論

模式識別

§2.3 正態分布時的統計決策

具體的決策域劃分與樣本的概率分布有關. 下面結合正態分布概率密度函數進行討論, 在討論結束時我們會發現從中可以得到不少啟示.

武漢大學電子信息學院

貝葉斯決策理論

模式識別

2.3.1正態分布概率密度函數的定義與性質

單變量正態分布

正態分布是指一個隨機實數度量值在整個實數域上的分布規律,屬于概率密度函數類

武漢大學電子信息學院

貝葉斯決策理論

模式識別

多元正態分布

多元正態分布的概率密度函數:

μ是X的均值向量,d維 μ=E{X}=[μ1,μ2,…,μd]T ∑是d×d維協方差矩陣,而∑-1是∑的逆矩陣,|∑|是∑的行列式 ∑=E{(X-μ)(X-μ)T}

武漢大學電子信息學院

貝葉斯決策理論

模式識別

多元正態分布的重要的特性

多元正態分布的概率密度函數中的元就是我們前面說得特征向量的分量數,也就是維數 . 多維向量:每一個分量都是隨機變量,服從正態分布.http://http://www.solarmaxlimited.com/news/5587D97E021E5268.html但是一個二維隨機向量不僅要求考慮每個分量單獨的分布,還要考慮兩個隨機變量之間的關系 ——相關性

武漢大學電子信息學院

貝葉斯決策理論

模式識別

例:兩個二元正態分布

武漢大學電子信息學院

貝葉斯決策理論

模式識別

協方差矩陣:

用 E[x1-μ1)(x2-μ2)]來衡量這種相關性,稱為協方差矩陣非對角元素正表示了兩個分量之間的相關性主對角元素則是各分量本身的方差協方差矩陣的重要屬性:正定的對稱矩陣

武漢大學電子信息學院

貝葉斯決策理論

模式識別

多元正態分布的性質

參數μ與∑對分布具有決定性,記作p(X)～ N(μ,∑). 等密度點分布在超橢球面上. 等密度點對應: (x-μ)T∑-1(x-μ)=常數

武漢大學電子信息學院

貝葉斯決策理論

模式識別

向量X到向量μ的Mahalanobis距離的平方 r2=(x-μ)T∑-1(x-μ) 多元正態分布的離散程度由參數|∑|1/2決定, 這與單變量時由標準差σ決定是對應一致的. 不相關性等價于獨立性. —不相關 :E[xixj]=E[xi]〃E[xj] —相關 :(xi,xj)=p(xi)p(xj),

武漢大學電子信息學院

貝葉斯決策理論

模式識別

邊緣分布和條件分布的正態性多元正態分布的邊緣分布和條件分布仍然是正態分布. 線性變換的正態性 Y=αTx,則Y的分布仍然是正態的.

武漢大學電子信息學院

模式識別貝葉斯決策理論 2.3.2正態分布概率模型下的最小錯誤率貝葉斯決策

如果則X∈ωi 判別函數為 p(x| ωi) p(ωi) ,采用對數形式

武漢大學電子信息學院

貝葉斯決策理論

模式識別

決策規則:

相應的決策面方程為

武漢大學電子信息學院

貝葉斯決策理論

模式識別

最小

距離分類器情況

定義:每個樣本以它到每類樣本均值的歐氏距離的最小值確定其分類 . 如果則 X∈ωi 樣本分布滿足以下正態分布條件時,最小錯誤分類器與(2-39)表示的決策規則相當:

武漢大學電子信息學院

貝葉斯決策理論

模式識別

在這種條件下,由于|∑|=σ2d及 ∑i-1=σ2I ,代入(2-37)得

武漢大學電子信息學院

貝葉斯決策理論

模式識別

由于決策是根據各判別函數之間的大小,因而在 (2-48)中一些與類別無關的項可以忽略,再加上先驗概率相等這個條件,判別函數可簡化成

最小距離分類器就可看作模板匹配.每個類有一個典型樣本(即均值向量),稱為模板,而待分類樣本X只要按歐氏距離計算與哪個模板最相似(歐氏距離最短)即可作決定.

武漢大學電子信息學院

貝葉斯決策理論

模式識別

線性分類器

∑i=σ2I i=1,…,c

其中

武漢大學電子信息學院

貝葉斯決策理論

模式識別

決策面方程

利用以及代入(2-46)并整理,可得 WT(X-X0)=0 (2-47) W=μi-μj

武漢大學電子信息學院

貝葉斯決策理論

模式識別

另一種簡單情況

∑i=∑

表示在二維特征空間的情況

武漢大學電子信息學院

貝葉斯決策理論

模式識別

判別函數

如果c類先驗概率都相等,

其中

武漢大學電子信息學院

貝葉斯決策理論

模式識別

決策面方程

gi(X)-gj(X)=0 即其中

武漢大學電子信息學院

貝葉斯決策理論

模式識別

線性分類器總結

在正態分布條件下,基于最小錯誤率貝葉斯決策只要能做到兩類協方差矩陣是一樣的,那么無論先驗概率相等不相等,都可以用線性分界面實現. 小歐氏距離分類器則要求正態分布協方差矩陣為單位陣,先驗概率相等.

武漢大學電子信息學院

貝葉斯決策理論

模式識別

各類協方差矩陣不相等的情況

∑i≠∑j i,j=1,2,…,c

(d×d矩陣) (d維列向量)

武漢大學電子信息學院

貝葉斯決策理論

模式識別

決策面方程(當兩個決策域毗鄰)

根據gi(X)-gj(X)=0有

武漢大學電子信息學院

貝葉斯決策理論

模式識別

圖2.10

武漢大學電子信息學院

貝葉斯決策理論

模式識別

討論與分析

分析了在何種正態分布條件下,最小錯誤率貝葉斯決策具有線性決策面. 最小距離分類器與統計上最小錯誤率決策上一致的條件.

武漢大學電子信息學院

貝葉斯決策理論

模式識別

本章小結

主要的知識: 使用什么樣的決策原則我們可以做到錯誤率最小Bayes決策錯分類最小并不一定是一個識別系統最重要的指標風險,損失學習獲得對樣本概率分布的估計

武漢大學電子信息學院

貝葉斯決策理論

模式識別

貝葉斯決策理論是統計模式識別

的重要理論基礎理論上講,貝葉斯決策方法是最優的(在最小錯誤率或最小風險意義上) 應用中:需要首先得到先驗概率和類條件概率密度方法一: 先估計概率密度,后求解決策規則方法二: 若已知或可假設概率密度為某種形式(比如正態分布),可先求出判決函數形式,再從樣本估計其中的參數. 方法三: 直接選擇或假設某種判決函數形式,用樣本確定其參數.

武漢大學電子信息學院

貝葉斯決策理論

模式識別

習題

1. 試簡述先驗概率,類條件概率密度函數和后驗概率等概念間的關系: 2. 試寫出利用先驗概率和分布密度函數計算后驗概率的公式 3. EX2.5 4. EX2.15 5. 寫出最小錯誤率和最小風險決策規則相應的判別函數(兩類問題). 6. 用Matlab計算兩類識別問題:根據血液中白細胞的濃度來判斷病人是否患血液病.

武漢大學電子信息學院

【貝葉斯決策】相關文章：

基于貝葉斯理論的指揮引導決策研究05-02

基于前景理論與貝葉斯決策模型的彩民動機研究04-30

基于參數的貝葉斯先驗選擇方法04-27

ARFIMA模型參數貝葉斯估計的漸近性質04-27

機匣包容性的貝葉斯評價方法04-27

基于貝葉斯動態模型的某器件性能預測05-01

基于貝葉斯網絡的飛機易損性評估方法04-27

基于貝葉斯粗糙集模型的屬性約簡算法04-29

Behrens-Fisher問題的信賴與貝葉斯精確區間估計04-29

基于貝葉斯網絡的人因可靠性評價04-26