基本信息
- 項(xiàng)目名稱(chēng):
- 文獻(xiàn)檢索與管理系統(tǒng)bibEOS
- 來(lái)源:
- 第十一屆“挑戰(zhàn)杯”國(guó)賽作品
- 小類(lèi):
- 信息技術(shù)
- 大類(lèi):
- 科技發(fā)明制作B類(lèi)
- 簡(jiǎn)介:
- bibEOS(bibliography Explore, Organize and Share)系統(tǒng)是一個(gè)Web 2.0式的論文檢索與管理系統(tǒng)。本系統(tǒng)提供的論文檢索與管理機(jī)制能夠使用戶(hù)通過(guò)友好的用戶(hù)界面高效地獲得有質(zhì)量保證的論文檢索結(jié)果,并且能夠?qū)z索的論文加以有效地管理,同時(shí)可以和同行交流論文閱讀的心得。 bibEOS系統(tǒng)一方面建立支持多種靈活查詢(xún)方式的論文搜索引擎,在論文搜索引擎上幫助研究者獲取隱藏在數(shù)據(jù)中的有用的知識(shí),即論文檢索功能;另一方面,幫助研究者管理和分享已獲得的知識(shí),為研究者提供一個(gè)交流與共享知識(shí)的平臺(tái),即論文管理功能。 bibEOS系統(tǒng)的目標(biāo)是為研究者提供一個(gè)Explore, Organize and Share 知識(shí)的系統(tǒng)。
- 詳細(xì)介紹:
- 研究者在進(jìn)行研究工作時(shí)需要經(jīng)常需要完成下面的工作:在現(xiàn)有的論文搜索引擎上幫助研究者發(fā)現(xiàn)隱藏在數(shù)據(jù)中的有用的知識(shí),組織已獲得的知識(shí),分享交流已獲得的知識(shí)。 基于以上分析,bibEOS(bibliography Explore, Organize and Share)系統(tǒng)一方面建立支持多種靈活查詢(xún)方式的論文搜索引擎,在論文搜索引擎上幫助研究者獲取隱藏在數(shù)據(jù)中的有用的知識(shí),即論文檢索功能;另一方面,幫助研究者管理和分享已獲得的知識(shí),為研究者提供一個(gè)交流與共享知識(shí)的平臺(tái),即論文管理功能。這對(duì)幫助研究者提高研究工作效率有著重要的意義。 為了讓研究者從查詢(xún)中獲得更多的有價(jià)值的信息,論文檢索不僅支持基于屬性關(guān)鍵字的傳統(tǒng)檢索方式,還支持查詢(xún)隱藏在數(shù)據(jù)中的有用的知識(shí),例如作者之間的合作關(guān)系和論文之間的引用關(guān)系等,這些知識(shí)能夠從一定程度上反映出論文的背景信息和論文的重要程度。論文管理幫助研究者對(duì)從論文檢索中獲得的知識(shí)進(jìn)行有效地管理,如收藏信息,并對(duì)該信息進(jìn)行自由地分類(lèi)和評(píng)論;同時(shí)也幫助研究興趣相同的研究者之間共享信息。 為了有效地實(shí)現(xiàn)論文管理,本系統(tǒng)選用XML作為論文管理的數(shù)據(jù)形式,利用了XML的半結(jié)構(gòu)化、易理解性和可擴(kuò)展性,將用戶(hù)對(duì)所收藏的信息進(jìn)行的添加、修改、刪除操作轉(zhuǎn)化為對(duì)XML標(biāo)簽和數(shù)據(jù)的操作,極大地方便用戶(hù)管理數(shù)據(jù)。 在論文信息管理中,我們采用了實(shí)體識(shí)別、社團(tuán)發(fā)現(xiàn)、數(shù)據(jù)清洗等技術(shù),提高了系統(tǒng)中數(shù)據(jù)的質(zhì)量,為用戶(hù)提供高質(zhì)量的檢索結(jié)果。 bibEOS系統(tǒng)是一個(gè)基于B/S結(jié)構(gòu)的論文檢索與管理系統(tǒng)。本系統(tǒng)提供的論文檢索與管理機(jī)制能夠使用戶(hù)通過(guò)友好的用戶(hù)界面高效地獲得有質(zhì)量保證的論文檢索結(jié)果,并且能夠?qū)z索的論文加以有效地管理,同時(shí)可以和同行交流論文閱讀的心得。因而,該系統(tǒng)可以大大提高科研工作者工作效率、加強(qiáng)科研工作者交流,對(duì)推動(dòng)科學(xué)研究的發(fā)展有著重要的意義。
作品專(zhuān)業(yè)信息
設(shè)計(jì)、發(fā)明的目的和基本思路、創(chuàng)新點(diǎn)、技術(shù)關(guān)鍵和主要技術(shù)指標(biāo)
- 設(shè)計(jì)該作品是為了通過(guò)對(duì)論文信息的查詢(xún)、管理和共享來(lái)幫助研究者進(jìn)行研究工作?;舅枷胧抢脭?shù)據(jù)清洗、實(shí)體識(shí)別和數(shù)據(jù)挖掘的先進(jìn)技術(shù)來(lái)提高數(shù)據(jù)的質(zhì)量、過(guò)濾掉對(duì)研究者沒(méi)有意義的數(shù)據(jù)以及幫助研究者發(fā)現(xiàn)隱藏在大量論文中的有用的統(tǒng)計(jì)信息,提高查詢(xún)的功能。除此以外,該作品有機(jī)結(jié)合了論文檢索、論文管理以及信息共享等功能,方便用戶(hù)在查詢(xún)到信息以后方便及時(shí)地對(duì)信息進(jìn)行管理和共享。
科學(xué)性、先進(jìn)性
- 1. 本系統(tǒng)不僅提供了通常搜索引擎基于關(guān)鍵字合作者檢索論文的功能,還提供了基于領(lǐng)域檢索論文的功能 2. 本系統(tǒng)對(duì)重名作者進(jìn)行了識(shí)別,提高了檢索結(jié)果的質(zhì)量 3. 本系統(tǒng)提供了論文管理的功能,方便用戶(hù)將論文檢索的結(jié)果添加標(biāo)簽并加以存儲(chǔ) 4. 本系統(tǒng)在論文管理中提供了標(biāo)簽機(jī)制,利用Web2.0的思想使得檢索結(jié)果和用戶(hù)之間得以交互 5. 本系統(tǒng)地提供了組功能,使具有相同興趣的用戶(hù)可以進(jìn)行溝通 6. 本系統(tǒng)設(shè)計(jì)了數(shù)據(jù)清洗機(jī)制對(duì)從數(shù)據(jù)源提取的信息加以清洗,提高了數(shù)據(jù)質(zhì)量 7. 為了有效地實(shí)現(xiàn)論文管理,本系統(tǒng)選用XML作為論文管理的數(shù)據(jù)形式,利用了XML的半結(jié)構(gòu)化、易理解性和可擴(kuò)展性,將用戶(hù)對(duì)所收藏的信息進(jìn)行的添加、修改、刪除操作轉(zhuǎn)化為對(duì)XML標(biāo)簽和數(shù)據(jù)的操作,極大地方便用戶(hù)管理數(shù)據(jù)。
獲獎(jiǎng)情況及鑒定結(jié)果
- 無(wú)
作品所處階段
- 實(shí)驗(yàn)室階段
技術(shù)轉(zhuǎn)讓方式
- 以網(wǎng)站的形式發(fā)布
作品可展示的形式
- 現(xiàn)場(chǎng)演示、錄像
使用說(shuō)明,技術(shù)特點(diǎn)和優(yōu)勢(shì),適應(yīng)范圍,推廣前景的技術(shù)性說(shuō)明,市場(chǎng)分析,經(jīng)濟(jì)效益預(yù)測(cè)
- 1. 本系統(tǒng)將論文檢索與論文管理相結(jié)合,不僅能夠幫助科研人員高效地獲得有質(zhì)量保證的論文檢索結(jié)果,還能夠?qū)z索的論文加以有效地管理,同時(shí)可以和同行交流論文閱讀的心得。因而,該系統(tǒng)可以大大提高科研工作者工作效率、加強(qiáng)科研工作者交流,對(duì)推動(dòng)科學(xué)研究的發(fā)展有著重要的意義 2. 本系統(tǒng)以XML的形式存儲(chǔ)大量的論文信息,利用XML的靈活性和可擴(kuò)展性,極大地簡(jiǎn)化了數(shù)據(jù)管理的復(fù)雜性,提高了論文檢索和管理的效率 3. 在論文信息管理中,本系統(tǒng)采用了實(shí)體識(shí)別、社團(tuán)發(fā)現(xiàn)、數(shù)據(jù)清洗等技術(shù),提高了系統(tǒng)中數(shù)據(jù)的質(zhì)量,為用戶(hù)提供高質(zhì)量的檢索結(jié)果
同類(lèi)課題研究水平概述
- 在文獻(xiàn)檢索時(shí),存在作者重名的問(wèn)題,因此需要對(duì)作者實(shí)體進(jìn)行識(shí)別。而實(shí)體識(shí)別技術(shù)在六十年代已經(jīng)開(kāi)始研究,[1]是對(duì)實(shí)體識(shí)別技術(shù)的綜述。實(shí)體識(shí)別問(wèn)題在過(guò)去被稱(chēng)為記錄鏈接或記錄匹配問(wèn)題。記錄匹配的目標(biāo)是識(shí)別在相同或不同的數(shù)據(jù)庫(kù)里對(duì)應(yīng)現(xiàn)實(shí)世界中相同的實(shí)體。這個(gè)問(wèn)題還被不同的研究領(lǐng)域命為許多其他的名字。在數(shù)據(jù)庫(kù)領(lǐng)域,這個(gè)問(wèn)題被稱(chēng)作合并清除[2],數(shù)據(jù)去重[3],和實(shí)例識(shí)別[4]。而在我們的系統(tǒng)里不是對(duì)數(shù)據(jù)庫(kù)里的元組進(jìn)行實(shí)體識(shí)別,而是對(duì)XML文檔里的作者進(jìn)行實(shí)體識(shí)別。 當(dāng)前的文獻(xiàn)檢索系統(tǒng)都是基于文件系統(tǒng)進(jìn)行關(guān)鍵字檢索的,在我們的系統(tǒng)里首次采用了xml數(shù)據(jù)與關(guān)系數(shù)據(jù)類(lèi)型混合的數(shù)據(jù)庫(kù)來(lái)存儲(chǔ)數(shù)據(jù)。 References [1] Ahmed K. Elmagarmid, Panagiotis G. Ipeirotis, Vassilios S. Verykios, "Duplicate Record Detection: A Survey," IEEE TKDE, vol. 19, no. 1, Jan. 2007. [2] M.A. Herna′ndez and S.J. Stolfo, "Real-World Data Is Dirty: Data Cleansing and the Merge/Purge Problem," Data Mining and Knowledge Discovery, vol. 2, no. 1, pp. 9-37, Jan. 1998. [3] S. Sarawagi and A. Bhamidipaty, "Interactive Deduplication Using Active Learning," KDD 2002, pp. 269-278. [4] Y.R. Wang and S.E. Madnick, "The Inter-Database Instance Identification Problem in Integrating Autonomous Systems," Proc. Fifth IEEE Int’l Conf. Data Eng. (ICDE ’89), pp. 46-55, 1989.