當(dāng)前位置: 首頁 » 食品專題 » 生物名詞庫 » 生物數(shù)學(xué) » 正文

聚類分析

發(fā)布日期：2006-09-19

聚類通過把目標(biāo)數(shù)據(jù)放入少數(shù)相對同源的組或“類”（cluster）里。分析表達(dá)數(shù)據(jù)，（1）通過一系列的檢測將待測的一組基因的變異標(biāo)準(zhǔn)化，然后成對比較線性協(xié)方差。（2）通過把用最緊密關(guān)聯(lián)的譜來放基因進(jìn)行樣本聚類，例如用簡單的層級聚類（hierarchical clustering）方法。這種聚類亦可擴(kuò)展到每個實驗樣本，利用一組基因總的線性相關(guān)進(jìn)行聚類。（3）多維等級分析（multidimensional scaling analysis,MDS）是一種在二維Euclidean “距離”中顯示實驗樣本相關(guān)的大約程度。（4）K-means方法聚類，通過重復(fù)再分配類成員來使“類”內(nèi)分散度最小化的方法。

聚類方法有兩個顯著的局限：首先，要聚類結(jié)果要明確就需分離度很好（well-separated）的數(shù)據(jù)。幾乎所有現(xiàn)存的算法都是從互相區(qū)別的不重疊的類數(shù)據(jù)中產(chǎn)生同樣的聚類。但是，如果類是擴(kuò)散且互相滲透，那么每種算法的的結(jié)果將有點不同。結(jié)果，每種算法界定的邊界不清，每種聚類算法得到各自的最適結(jié)果，每個數(shù)據(jù)部分將產(chǎn)生單一的信息。為解釋因不同算法使同樣數(shù)據(jù)產(chǎn)生不同結(jié)果，必須注意判斷不同的方式。對遺傳學(xué)家來說，正確解釋來自任一算法的聚類內(nèi)容的實際結(jié)果是困難的（特別是邊界）。最終，將需要經(jīng)驗可信度通過序列比較來指導(dǎo)聚類解釋。

第二個局限由線性相關(guān)產(chǎn)生。上述的所有聚類方法分析的僅是簡單的一對一的關(guān)系。因為只是成對的線性比較，大大減少發(fā)現(xiàn)表達(dá)類型關(guān)系的計算量，但忽視了生物系統(tǒng)多因素和非線性的特點。

下一篇：卡方測驗（x2test，chi-squared test）
上一篇：概率

[ 網(wǎng)刊訂閱 ] [ 食品專題搜索 ] [ ] [ 告訴好友 ] [ 打印本文 ] [ 關(guān)閉窗口 ] [ 返回頂部 ]

同類食品專題

推薦圖文

推薦食品專題

Processed in 0.253 second(s), 564 queries, Memory 2.01 M

• 卡方測驗（x2test，chi-squared test）	• 概率
• 有效數(shù)字	• 頻率
• 生物數(shù)學(xué)	• 元胞自動機(jī)的分類