基本信息
- 項目名稱:
- 聯(lián)合編碼的免疫克隆選擇無監(jiān)督聚類算法
- 小類:
- 信息技術(shù)
- 簡介:
- 由于聚類分析在識別數(shù)據(jù)內(nèi)在結(jié)構(gòu)方面所具有的重要作用,已在數(shù)據(jù)挖掘、模式識別、信息檢索等領(lǐng)域得到了廣泛應(yīng)用。一直是國內(nèi)外相關(guān)領(lǐng)域研究的熱點問題。本作品針對目前一些聚類算法存在依賴領(lǐng)域知識、效率不高、無法有效處理高維數(shù)據(jù)集等不足之處,提出了一種新的聚類算法,在一定程度上解決了以上問題。
- 詳細(xì)介紹:
- 針對聚類數(shù)未知的問題,鑒于免疫克隆選擇算法的快速收斂性與強大的優(yōu)化能力,本文將其引入無監(jiān)督聚類問題中,提出了一種聯(lián)合編碼的免疫克隆選擇無監(jiān)督聚類算法。該算法在引入免疫克隆選擇算法思想的基礎(chǔ)上,分別設(shè)計了一種新的聯(lián)合編碼方案、基于單點變異的免疫基因操作、吞并算子以及基于人工免疫進化網(wǎng)絡(luò)原理的聚類結(jié)果優(yōu)化方案。通過算法迭代尋優(yōu)以及根據(jù)需求對最優(yōu)聚類結(jié)果的二次優(yōu)化,最終得到令人滿意的聚類結(jié)果。
作品專業(yè)信息
撰寫目的和基本思路
- 目的:希望設(shè)計一種不但能夠自動確定聚類類別數(shù),可推廣到高維數(shù)據(jù)聚類問題,而且能夠根據(jù)需要對一次聚類結(jié)果進行二次優(yōu)化的高效的聚類算法。 基本思路:鑒于免疫克隆選擇算法所具有的快速收斂性和強大的優(yōu)化能力,本文將其引入無監(jiān)督聚類問題中,并通過設(shè)計新的聯(lián)合編碼方案,基于單點變異策略的免疫基因操作,吞并算子以及基于人工免疫網(wǎng)絡(luò)原理的聚類結(jié)果優(yōu)化方案使得算法能夠達(dá)到預(yù)期目的。
科學(xué)性、先進性及獨特之處
- 1、算法設(shè)計了一種新的綜合聚類類別數(shù)與聚類中心的聯(lián)合編碼方案,有效克服了對領(lǐng)域知識的依賴。 2、提出了一種新的基于單點變異策略的更適合于聚類問題的克隆選擇算子,使得算法效率大大提高。 3、借鑒Darwin進化論優(yōu)勝劣汰思想提出了新的算子--吞并算子,加快了算法的收斂速度。 4、基于人工免疫網(wǎng)絡(luò)思想,提出利用最小生成樹剪枝操作進行聚類結(jié)果二次優(yōu)化過程,已得到最優(yōu)聚類結(jié)果。
應(yīng)用價值和現(xiàn)實意義
- 本文算法較好地彌補了現(xiàn)有大多數(shù)聚類算法應(yīng)用于實際問題時所暴露出的不足。仿真實驗表明,本算法可以很好地處理對人工數(shù)據(jù)集和遙感圖像的聚類分析問題。此外,本算法還可應(yīng)用于信息檢索、數(shù)據(jù)分析等領(lǐng)域,具有較高的實際應(yīng)用價值和現(xiàn)實意義。
學(xué)術(shù)論文摘要
- 摘要 采用一種新的聯(lián)合編碼方式,并引入了免疫克隆選擇機制以及人工免疫進化網(wǎng)絡(luò)的思想,提出了一種聯(lián)合編碼的免疫克隆選擇無監(jiān)督聚類算法。該算法設(shè)計了一種綜合聚類類別數(shù)及聚類中心的編碼方式,無需事先指定聚類類別數(shù),有效地克服了對領(lǐng)域知識的依賴。同時,通過免疫克隆算子算法實現(xiàn)聚類結(jié)果,并采用最小生成樹的方式完成有效地聚類。實驗結(jié)果表明,該方法能對不同類型的數(shù)據(jù)集進行正確聚類,并能確定合適的聚類類別。 關(guān)鍵詞 聯(lián)合編碼 免疫 克隆選擇 無監(jiān)督聚類 最小生成樹
獲獎情況
- 論文錄用情況: 《Union Coding based Immune Clone Selection Unsupervised Clustering Algorithm》 --2011 International Conference on Computer Application and System Modeling
鑒定結(jié)果
- 無
參考文獻
- References [1] SUN Ji-Gui , LIU Jie , ZHAO Lian-Yu . New Progress in Clustering Algorithms Research , Journal of Software , Vol.19 , No.1 , January 2008 , pp.48-61. [2] Castro L. N. D , Zuben F. J. V . An Evolutionary Network for Data Clustering Proceedings , Sixth Brazilian Symposium on Neural Networks , 2000 Page(s):84-89. [3] Kim J. , Bentley P. J . Towards an artificial immune system for network intrusion detection : an investigation of clonal selection with a negative selection operator . Proceedings of the 2001 Congress on Evolutionary Computation , 2001 , 2:1244-1252. [4] DU Hai-Feng , JIAO Li-Cheng , WANG S . Clonal Operator and Antibody Clone Algorithms . Proceedings of the First International Conference on Machine Learning and Cybernetics , Beijing , 4-5 November 2002:506-510. [5] Maulik U, Bandyopadhyay S. Genetic algorithm-based clustering technique . Pattern Recognition , 2000 , 33(9):1455-1465.
同類課題研究水平概述
- 現(xiàn)有的聚類算法大致可劃分為層次化聚類算法、劃分式聚類算法、基于密度和網(wǎng)格的聚類算法以及其他聚類算法。層次化聚類算法使用數(shù)據(jù)的聯(lián)接規(guī)則,透過一種層次架構(gòu)方式,反復(fù)將數(shù)據(jù)進行分裂或聚合,以形成一個層次序列的聚類問題解。層次化聚類算法一般以固定數(shù)目的點來表示一個聚類,提高了算法挖掘任意形狀聚類的能力。劃分式聚類算法通過反復(fù)迭代降低目標(biāo)函數(shù)的誤差值,當(dāng)目標(biāo)函數(shù)值收斂時,得到最終聚類結(jié)果?;诿芏鹊木垲愃惴ㄍㄟ^數(shù)據(jù)密度來發(fā)現(xiàn)任意形狀的類簇,而基于網(wǎng)格的聚類算法使用一個網(wǎng)格結(jié)構(gòu),圍繞模式組織由矩陣塊劃分的值空間,基于塊的分布信息實現(xiàn)模式聚類?;诰W(wǎng)格的聚類算法常常與其他聚類算法相結(jié)合,特別是與基于密度的聚類算法相結(jié)合?;诿芏群途W(wǎng)格的聚類算法的主要優(yōu)點是能夠發(fā)現(xiàn)任意形狀的聚類以及對數(shù)據(jù)不敏感。 在傳統(tǒng)的聚類方法中,基于目標(biāo)函數(shù)的聚類算法把聚類問題歸結(jié)為一個優(yōu)化問題,具有深厚的泛函基礎(chǔ),從而成為聚類算法的主流。K-means聚類算法就是其中最具代表性的一種。該算法效率比較高,但由于聚類目標(biāo)函數(shù)是高度非線性和多峰的函數(shù),因此標(biāo)準(zhǔn)的K-means聚類算法在使用其hill-climbing方式優(yōu)化目標(biāo)函數(shù)時,搜索方向總是沿著單一方向進行,算法易陷入局部最優(yōu)點。這種基于目標(biāo)函數(shù)的聚類算法存在的主要問題就是對聚類領(lǐng)域知識要求的增加。在聚類分析之前必須給定聚類類別數(shù),否則將會對算法產(chǎn)生誤導(dǎo),從而得到一個錯誤的劃分。但是,在實際應(yīng)用中,尤其是當(dāng)數(shù)據(jù)樣本點處于高維空間時,很難獲得聚類類別數(shù)。另一方面,為了克服一些算法(如K-means聚類算法)易陷入局部最優(yōu)點的問題,Maulik提出了遺傳聚類算法(GAC),通過進化的思想不斷優(yōu)化聚類中心,能夠較好克服算法陷入局部最優(yōu)點的問題。但是,Maulik的遺傳聚類算法直接將聚類中心編碼為個體,這樣的編碼方式與維數(shù)相關(guān),很難直接推廣到高維數(shù)據(jù)聚類問題?,F(xiàn)有大多數(shù)聚類算法對數(shù)據(jù)集進行聚類分析時產(chǎn)生一次聚類結(jié)果,無法根據(jù)需求對一次聚類結(jié)果進行修改,如要對一次聚類結(jié)果進行修改,只能通過改變聚類類別數(shù)等參數(shù)重新進行聚類。而在實際應(yīng)用中,我們通常希望可以根據(jù)一次聚類分析后得到的聚類結(jié)果并結(jié)合實際需求對一次聚類結(jié)果進行簡單修改后便可得到我們期望的最終聚類結(jié)果,而不是修改參數(shù)重新進行一次聚類分析。