基本信息
- 項(xiàng)目名稱:
- 互聯(lián)網(wǎng)論壇用戶識(shí)別的建模與數(shù)學(xué)實(shí)驗(yàn)
- 小類:
- 數(shù)理
- 簡(jiǎn)介:
- 本文針對(duì)互聯(lián)網(wǎng)論壇用戶識(shí)別問題,根據(jù)網(wǎng)上數(shù)據(jù)內(nèi)容,進(jìn)行合理化的簡(jiǎn)化假設(shè),運(yùn)用數(shù)據(jù)挖掘技術(shù), 針對(duì)話題用戶、活躍用戶、言論領(lǐng)袖的不同特點(diǎn),分別建立相應(yīng)的模型,運(yùn)用多種算法。其中最核心的是數(shù)據(jù)挖掘和處理算法。本文所提出的數(shù)據(jù)挖掘處理的方法和思想也適用于解決其他類似問題,如應(yīng)用在搜索引擎中的信息檢索、電子商務(wù)中的獲取潛在客戶信息、網(wǎng)站設(shè)計(jì)中優(yōu)化管理等方面。
- 詳細(xì)介紹:
- 本文針對(duì)互聯(lián)網(wǎng)論壇用戶識(shí)別問題,根據(jù)網(wǎng)上數(shù)據(jù)內(nèi)容,進(jìn)行合理化的簡(jiǎn)化假設(shè),運(yùn)用數(shù)據(jù)挖掘技術(shù),分別建立相應(yīng)的模型。 首先,對(duì)言論領(lǐng)袖識(shí)別問題,我們以論壇的頁(yè)面訪問量、會(huì)員積分、會(huì)員威望、精華數(shù)四個(gè)因子進(jìn)行兩兩比較,運(yùn)用層次分析法建立成對(duì)比較矩陣,利用MATLAB軟件解出結(jié)果。 其次,在話題用戶識(shí)別問題上,我們采用基于聚類的話題識(shí)別算法, 基于平均值的K-Means算法, 基于相似度矩陣的K-Medoids算法等。 然后,對(duì)于活躍用戶識(shí)別,經(jīng)過活躍函數(shù)的分析,結(jié)果并采用BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了評(píng)判和改進(jìn)。 最后,對(duì)于關(guān)系圈識(shí)別,我們建立共點(diǎn)圓系模型,將用戶關(guān)聯(lián)關(guān)系描述出來。另外還針對(duì)要求提出實(shí)例說明和說明數(shù)據(jù)獲取途
作品專業(yè)信息
撰寫目的和基本思路
- 目的:成功實(shí)現(xiàn)企業(yè)對(duì)論壇內(nèi)的用戶進(jìn)行有效識(shí)別。進(jìn)而有效解決在互聯(lián)網(wǎng)互動(dòng)氛圍中衍生的很多商業(yè)機(jī)會(huì)和運(yùn)營(yíng)難題。 基本思路:首先,對(duì)言論領(lǐng)袖識(shí)別問題,建立層次分析模型。 其次,我們采用基于聚類的話題識(shí)別算法進(jìn)行話題用戶識(shí)別。并對(duì)識(shí)別結(jié)果采用BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了評(píng)判和改進(jìn)。 最后,對(duì)于關(guān)系圈識(shí)別,我們建立共點(diǎn)圓系模型,將用戶關(guān)聯(lián)關(guān)系描述出來。
科學(xué)性、先進(jìn)性及獨(dú)特之處
- 本文研究基于數(shù)據(jù)挖掘技術(shù),充分利用互聯(lián)網(wǎng)數(shù)據(jù),對(duì)發(fā)帖行為進(jìn)行研究,進(jìn)行合理的簡(jiǎn)化假設(shè),從而從實(shí)驗(yàn)角度對(duì)網(wǎng)絡(luò)論壇中部分網(wǎng)絡(luò)論壇形成現(xiàn)象進(jìn)行剖析,分別建立相應(yīng)的數(shù)學(xué)模型。能夠很好的解決互聯(lián)網(wǎng)在運(yùn)營(yíng)過程中出現(xiàn)的難題,成功實(shí)現(xiàn)企業(yè)對(duì)論壇內(nèi)的用戶進(jìn)行有效識(shí)別。并據(jù)此提出一種定量評(píng)價(jià)網(wǎng)絡(luò)論壇用戶識(shí)別的新指標(biāo) .實(shí)驗(yàn)表明,該指標(biāo)可有效用于網(wǎng)絡(luò)論壇用戶的識(shí)別,該方法新穎,獨(dú)特,研究前景廣闊。
應(yīng)用價(jià)值和現(xiàn)實(shí)意義
- 實(shí)用價(jià)值:本文在針對(duì)話題用戶、活躍用戶、言論領(lǐng)袖的不同特點(diǎn),分別建立相應(yīng)的模型,運(yùn)用多種算法。同時(shí)本文提出的數(shù)據(jù)挖掘處理方法和思想也適用于解決其他類似問題,如應(yīng)用在搜索引擎中的信息檢索、電子商務(wù)中的獲取潛在客戶信息等方面。 現(xiàn)實(shí)意義:本文研究還只是在該領(lǐng)域應(yīng)用的初步嘗試,更本質(zhì)研究可能還需要引入新的系統(tǒng)科學(xué)理論或工具,并需要對(duì)大量網(wǎng)絡(luò)論壇形式與現(xiàn)象進(jìn)行深入分析,深入研究取得的成果將非常誘人。
學(xué)術(shù)論文摘要
- 現(xiàn)在的互聯(lián)網(wǎng)正從信息單向推送模式向互動(dòng)模式轉(zhuǎn)型,互聯(lián)網(wǎng)論壇已經(jīng)成為互聯(lián)網(wǎng)企業(yè)與用戶、用戶與用戶之間重要的互動(dòng)平臺(tái)。在這樣的互動(dòng)氛圍中衍生出了很多商業(yè)機(jī)會(huì)和運(yùn)營(yíng)難題,那么企業(yè)怎樣才能夠?qū)φ搲瘍?nèi)的用戶進(jìn)行有效識(shí)別。 本文針對(duì)互聯(lián)網(wǎng)論壇用戶識(shí)別問題,根據(jù)網(wǎng)上數(shù)據(jù)內(nèi)容,進(jìn)行合理化的簡(jiǎn)化假設(shè),運(yùn)用數(shù)據(jù)挖掘技術(shù),分別建立相應(yīng)的模型。 首先,對(duì)言論領(lǐng)袖識(shí)別問題,我們以論壇的頁(yè)面訪問量、會(huì)員積分、會(huì)員威望、精華數(shù)四個(gè)因子進(jìn)行兩兩比較,運(yùn)用層次分析法建立成對(duì)比較矩陣,利用MATLAB軟件解出結(jié)果。 其次,在話題用戶識(shí)別問題上,我們采用基于聚類的話題識(shí)別算法, 基于平均值的K-Means算法, 基于相似度矩陣的K-Medoids算法等。 然后,對(duì)于活躍用戶識(shí)別,經(jīng)過活躍函數(shù)的分析,結(jié)果并采用BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了評(píng)判和改進(jìn)。 最后,對(duì)于關(guān)系圈識(shí)別,我們建立共點(diǎn)圓系模型,將用戶關(guān)聯(lián)關(guān)系描述出來。另外還針對(duì)要求提出實(shí)例說明和說明數(shù)據(jù)獲取途徑。
獲獎(jiǎng)情況
- 榮獲第三屆BiZ-WiZ杯華中地區(qū)大學(xué)生數(shù)學(xué)建模邀請(qǐng)賽二等獎(jiǎng)。 韶關(guān)學(xué)院第九屆大學(xué)生課外學(xué)術(shù)科技作品競(jìng)賽三等獎(jiǎng)。 第十一屆“挑戰(zhàn)杯”廣東大學(xué)生課外學(xué)術(shù)科技作品競(jìng)賽三等獎(jiǎng)
鑒定結(jié)果
- 此作品是由申報(bào)者完成,所填內(nèi)容真實(shí)可靠。 本文基于數(shù)據(jù)挖掘技術(shù),利用互聯(lián)網(wǎng)數(shù)據(jù),進(jìn)行合理的假設(shè),從實(shí)驗(yàn)角度對(duì)發(fā)帖行為等網(wǎng)絡(luò)論壇現(xiàn)象進(jìn)行研究。實(shí)驗(yàn)表明,該方法新穎,獨(dú)特,研究前景廣闊。
參考文獻(xiàn)
- 參考文獻(xiàn) [1]薛冰冰,普杰信,王峰.數(shù)據(jù)挖掘技術(shù)及其在BBS管理中的應(yīng)用,現(xiàn)代電子技術(shù),2004,(2):55-57 [2]李保利,愈士汶.話題識(shí)別與跟蹤研究.計(jì)算機(jī)工程與應(yīng)用,2003,(17) [3]丁偉莉,趙華,鄭德權(quán)等.中文Blog熱門話題檢測(cè)與排序技術(shù)研究.中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議,北京,2006:282-289 [4]姚曉娜.BBS熱點(diǎn)話題挖掘與觀點(diǎn)分析:(工學(xué)碩士學(xué)位論文).大連海事大學(xué),2008.6 [5]王堯基,人際關(guān)系“圈”的“圓系模型”與關(guān)系網(wǎng)-讀《特權(quán)與優(yōu)惠的經(jīng)濟(jì)學(xué)分析》有感,世界經(jīng)濟(jì)文匯,1998年第六期 [6]余紅,《網(wǎng)絡(luò)時(shí)政論壇輿論領(lǐng)袖研究——以強(qiáng)國(guó)社區(qū)中日論壇為例》博士學(xué)位論文,2007年10月 [7]高功敬,《BBS虛擬社區(qū)的人際互動(dòng)---對(duì)“泡網(wǎng)俱樂部江湖論劍”虛擬社區(qū)的個(gè)案研究》碩士學(xué)位論文
同類課題研究水平概述
- 國(guó)內(nèi)同類課題研究水平概述: 國(guó)內(nèi)第一個(gè)網(wǎng)絡(luò)論壇出現(xiàn)于1991年。到1995年,隨著計(jì)算機(jī)及其外設(shè)大幅降價(jià),網(wǎng)絡(luò)論壇逐漸被人們所認(rèn)識(shí)。1997年還處于聊天室的時(shí)代,大部分利用網(wǎng)絡(luò)交流信息的網(wǎng)民流連于各大網(wǎng)站的聊天室中,網(wǎng)絡(luò)論壇尚未成氣候。網(wǎng)絡(luò)論壇的興起始1997年的十強(qiáng)賽,當(dāng)時(shí)的四通利方體育沙龍聚集了一批體育迷,暢談對(duì)足球和體的看法。體育沙龍?zhí)幱诙κr(shí)期時(shí),全國(guó)各地的體育記者編輯都在這尋找第一手信息。隨著網(wǎng)絡(luò)迅猛發(fā)展,網(wǎng)民逐漸分化,網(wǎng)絡(luò)論壇分類細(xì)化。目前網(wǎng)絡(luò)論壇主要分為以下幾類:綜合性網(wǎng)絡(luò)論壇、特色網(wǎng)絡(luò)論壇、專業(yè)類網(wǎng)絡(luò)論壇、商業(yè)類網(wǎng)絡(luò)論壇。綜合性網(wǎng)絡(luò)論壇往往劃出了不同的版塊與主題,包括情感、旅游、體育、文學(xué)、購(gòu)物等,涵蓋生活的方面面,網(wǎng)民可以在不同的版塊就自己感興趣的問題進(jìn)行交流。目前此類論壇中最關(guān)注的有“強(qiáng)國(guó)論壇”、“天涯社區(qū)”、“西祠胡同”、“貓撲”。 國(guó)外同類課題研究水平概述: 國(guó)外網(wǎng)絡(luò)論壇研究綜述檢索到的43篇國(guó)外網(wǎng)絡(luò)論壇研究文獻(xiàn)主要從以下幾個(gè)方面展開:(1)網(wǎng)絡(luò)論壇的擴(kuò)散,包括網(wǎng)絡(luò)論壇在不同領(lǐng)域和在不同人群的擴(kuò)散;(2)網(wǎng)絡(luò)論壇的使用,包括網(wǎng)絡(luò)論壇采納動(dòng)機(jī)、使用和滿足;(3)網(wǎng)絡(luò)論壇的規(guī)范和管理;(4)網(wǎng)絡(luò)論壇的議程、議題建構(gòu);(5)網(wǎng)絡(luò)論壇語(yǔ)體特點(diǎn);(6)網(wǎng)絡(luò)論壇的社會(huì)效果。不同時(shí)期研究側(cè)重點(diǎn)不同。從1990年代中后期以來,網(wǎng)絡(luò)論壇擴(kuò)散研究、網(wǎng)絡(luò)論壇使用研究和效果研究一直保持穩(wěn)定,是研究熱點(diǎn)。43篇論文中,擴(kuò)散研究有11篇,其中8篇為網(wǎng)絡(luò)論壇在不同領(lǐng)域的擴(kuò)散,3篇關(guān)于網(wǎng)絡(luò)論壇在不同人群的擴(kuò)散;網(wǎng)絡(luò)論壇的社會(huì)效果有13篇,使用研究有4篇;網(wǎng)絡(luò)論壇的規(guī)范和管理、網(wǎng)絡(luò)論壇的議程、議題建構(gòu)在1990年代曾經(jīng)是討論熱點(diǎn),2000年以后研究熱度顯著下降。2000年以后幾乎沒有研究單獨(dú)探討網(wǎng)絡(luò)論壇的議程、議題建構(gòu)。