基本信息
- 項目名稱:
- 一種基于謂詞邏輯的分類規(guī)則處理方法
- 小類:
- 信息技術
- 大類:
- 自然科學類學術論文
- 簡介:
- 分類是數(shù)據(jù)挖掘和機器學習領域中的重要研究內容之一,用來抽取能夠描述重要數(shù)據(jù)集合的模型,用于預測未知數(shù)據(jù)對象的離散類別,已廣泛應用在市場營銷、金融投資、天文、地理的數(shù)據(jù)分析與決策等領域。
- 詳細介紹:
- 近年來,如何獲取正確、簡潔、規(guī)范以及高質量的分類規(guī)則是一項重要的研究內容,主要集中在以下幾個方面:1)獲取分類規(guī)則方法。決策樹分類方法, 其基本思想是貪心算法,它是自頂向下遞歸的方式造決策樹,起源于概念學習系統(tǒng),具有高效、可理解性強的特征;貝葉斯分類法是一種統(tǒng)計學分類方法,用于大型數(shù)據(jù)庫中也具有較高分類質量(正確率);概念格分類法,通過格結點間的關系獲取的分類規(guī)則,具有精確性、分類質量高的特點,但是知識集容量較大;此外,還有模糊集、粗糙集理論、蟻群算法等,各俱優(yōu)劣,各種方法間相結合,取長補短,也是獲取分類規(guī)則的一種有效途徑(例如:模糊決策樹)。2)在已獲取的分類規(guī)則集中經常存在前件完全不同且規(guī)則后件相同、規(guī)則前件交集非空且后件相同等冗余和沖突現(xiàn)象,導致在分類和預測過程中出現(xiàn)錯誤判斷、效率低下等問題。因此,如何有效地避免、減少這類問題也是當前的重點研究內容之一。目前,大多數(shù)方法主要分為兩大類:直接處理和非直接處理。直接處理指的是在分類規(guī)則生成的過程中進行剪枝操作,即規(guī)則提取和規(guī)則剪枝同時進行,也即對原提取方法的改進,例如:Quinlan 的C4.5算法即是在生成規(guī)則的過程中,通過對規(guī)則的剪枝來消除冗余,并且Liu B等在構造CBA分類器的過程中就采用了這種技術來消除冗余;在一些關聯(lián)規(guī)則的剪枝中也采用了這種方法,例如Calders等,在生成頻繁項目集的過程中進行了剪枝操作。直接處理可以在過程中充分考慮原數(shù)據(jù)集的特征,處理后效果良好,但是處理效率比較低,并且處理過程中,不能對已知規(guī)則及將要獲取的規(guī)則間關系進行全局考慮,不當?shù)募糁σ自斐蓛r值信息的丟失,相反則起不到改進的效果,更有可能出現(xiàn)其他冗余。非直接處理指的是后處理,即在已經生成的規(guī)則集的基礎上進行后續(xù)處理,消除冗余,例如Bruha,F(xiàn)amili提出的規(guī)則過濾方法,就是一種典型的規(guī)則后處理;Huawen Liu等采用閉集的方法對關聯(lián)、分類規(guī)則進行后處理,并構造了相應的分類器等。然而,后處理過程完全脫離原始數(shù)據(jù)集,在得到較好的處理效率的同時,也極易使有價值信息流失,有可能影響分類的質量。 謂詞是描述個體詞的屬性、個體詞間關系的一種數(shù)學符號,謂詞公式的等價轉換則可以將公式化繁為簡,具有嚴謹、精確、易理解等特點。本文,提出了一種基于謂詞邏輯的分類規(guī)則處理算法(ACRP),該方法采用謂詞來描述分類規(guī)則前件與后件的蘊涵(因果)關系,利用謂詞公式的邏輯轉換來消除規(guī)則間及規(guī)則內的冗余和沖突現(xiàn)象,有效地提高了分類的質量和效率。最后,采用恒星光譜數(shù)據(jù),實驗驗證該算法的正確性和可行性。
作品專業(yè)信息
撰寫目的和基本思路
- 利用謂詞描述分類規(guī)則,并通過邏輯演算對分類規(guī)則集進行等價轉換,從而消除冗余規(guī)則,提高了分類的效果和質量。
科學性、先進性及獨特之處
- 謂詞公式的等價轉換則可以將公式化繁為簡,具有嚴謹、精確、易理解等特點。
應用價值和現(xiàn)實意義
- 為提高分類質量及效率提供了一條有效途徑。
學術論文摘要
- 分類是數(shù)據(jù)挖掘領域中的主要研究內容之一,在獲取的分類規(guī)則集中,往往存在大量冗余規(guī)則,影響了分類效率和質量。本文采用謂詞邏輯,提出了一種分類規(guī)則處理方法。該方法利用謂詞描述分類規(guī)則,并通過邏輯演算對分類規(guī)則集進行等價轉換,從而消除冗余規(guī)則,提高了分類的效果和質量。最后,采用恒星光譜數(shù)據(jù),實驗驗證該方法正確可行,從而為提高分類質量及效率提供了一條有效途徑。
獲獎情況
- 已投稿
鑒定結果
- 無
參考文獻
- 檢索關鍵字:數(shù)據(jù)挖掘;分類規(guī)則;謂詞邏輯;后處理;恒星光譜數(shù)據(jù)
同類課題研究水平概述
- 謂詞是描述個體詞的屬性、個體詞間關系的一種數(shù)學符號,謂詞公式的等價轉換則可以將公式化繁為簡,具有嚴謹、精確、易理解等特點。本文,提出了一種基于謂詞邏輯的分類規(guī)則處理算法(ACRP),該方法采用謂詞來描述分類規(guī)則前件與后件的蘊涵(因果)關系,利用謂詞公式的邏輯轉換來消除規(guī)則間及規(guī)則內的冗余和沖突現(xiàn)象,有效地提高了分類的質量和效率。最后,采用恒星光譜數(shù)據(jù),實驗驗證該算法的正確性和可行性。