国产性70yerg老太,狠狠的日,欧美人与动牲交a免费,中文字幕成人网站

基本信息

項目名稱:
面向房地產(chǎn)行業(yè)的熱點新聞主題播報自動生成系統(tǒng)
小類:
信息技術(shù)
簡介:
本系統(tǒng)結(jié)合主題檢測與多文檔自動摘要這兩種先進的自然語言處理技術(shù),針對互聯(lián)網(wǎng)上新聞網(wǎng)站發(fā)布的房地產(chǎn)行業(yè)的報道,對海量數(shù)據(jù)進行分析和組織,以播報的形式發(fā)布最新熱點關(guān)注資訊,為房地產(chǎn)業(yè)內(nèi)人士、關(guān)注房地產(chǎn)行業(yè)動態(tài)的廣大網(wǎng)民以及地方政府組織提供信息服務(wù),不僅讓人們能在最短的時間內(nèi)獲取最感興趣的信息,還可以用來監(jiān)控到事情發(fā)展最新動態(tài),提升政府機構(gòu)以及企業(yè)的輿情掌握與危機公關(guān)能力。
詳細介紹:
本系統(tǒng)結(jié)合主題檢測與多文檔自動摘要這兩種先進的自然語言處理技術(shù),針對互聯(lián)網(wǎng)上新聞網(wǎng)站發(fā)布的房地產(chǎn)行業(yè)的報道,對海量數(shù)據(jù)進行分析和組織,以播報的形式發(fā)布最新熱點關(guān)注資訊,為房地產(chǎn)業(yè)內(nèi)人士、關(guān)注房地產(chǎn)行業(yè)動態(tài)的廣大網(wǎng)民以及地方政府組織提供信息服務(wù),不僅讓人們能在最短的時間內(nèi)獲取最感興趣的信息,還可以用來監(jiān)控到事情發(fā)展最新動態(tài),提升政府機構(gòu)以及企業(yè)的輿情掌握與危機公關(guān)能力。

作品專業(yè)信息

設(shè)計、發(fā)明的目的和基本思路、創(chuàng)新點、技術(shù)關(guān)鍵和主要技術(shù)指標

意義與目的: 近年來房地產(chǎn)行業(yè)價格波動倍受矚目,與之相關(guān)的政策、土地、市場、業(yè)內(nèi)熱點都受很大關(guān)注,每天產(chǎn)生的業(yè)界新聞數(shù)以百千計,人工手動整理和瀏覽會浪費很多時間與精力。本系統(tǒng)通過綜合運用主題檢測與多文檔自動摘要技術(shù)對房地產(chǎn)新聞輿情進行監(jiān)測和分析,從錯綜復雜的房地產(chǎn)新聞報道分析中自動生成播報信息,可以讓用戶快速了解業(yè)界形勢走向,為有關(guān)中央和地方政府部門提供決策信息來源和輿論監(jiān)控導向。 二、基本思路: 針對互聯(lián)網(wǎng)上新聞網(wǎng)站發(fā)布的房地產(chǎn)行業(yè)的報道,設(shè)計一個主題識別與自動文摘相結(jié)合的熱點新聞主題播報系統(tǒng),分別將當天、三天以內(nèi)、一周以內(nèi)的報道整理并聚合形成各個主題,并對每個主題生成多文檔自動文摘播報,最后以網(wǎng)頁的形式發(fā)布。 三、創(chuàng)新點: 1、本系統(tǒng)內(nèi)容面向房地產(chǎn)行業(yè),有較強的針對性。 2、提出了一種主題識別的方法。利用主題檢測技術(shù),可以自動從海量新聞信息中識別出熱點主題,并按照主題進行歸類和組織,節(jié)約人工閱讀整理的消耗,方便用戶的瀏覽和選擇使用。 3、提出了一種輿情播報自動生成的方法。每個主題都涵蓋了詳細的敘述和分析,為了使用戶能快速、準確、全面接收主題的中心意思,本系統(tǒng)提出了一種多文檔自動摘要的方法,從有關(guān)某個主題的所有報道中,通過算法提取出簡明扼要的特征并整合生成一篇概括性短文。 四、技術(shù)關(guān)鍵: 1、新聞獲取技術(shù) 2、主題識別技術(shù) 3、多文檔自動摘要技術(shù)

科學性、先進性

1、實用性:滿足輿情播報的核心功能和重要功能,功能簡潔清晰; 2、技術(shù)先進:融合了數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)庫技術(shù)、計算語言技術(shù)以及多項自然語言智能處理等技術(shù)。 本系統(tǒng)采用的主題檢測和自動文摘中的聚類方法均采用的一趟聚類算法,經(jīng)過在路透社的新聞?wù)Z料中進行測試,下表是對7個最頻繁出現(xiàn)的類聚類結(jié)果,分別有得到的簇的個數(shù)和聚類準確度,其中可以說明在那么多個簇里面有部分是只有幾個文檔,而我們是關(guān)注在大簇上,所以這對熱門主題檢測很有意義。 3、專業(yè)性:現(xiàn)在國內(nèi)比較有名的輿情系統(tǒng)有中科點擊、天璣金融輿情播報等。但與熱門主題相關(guān)報道來源眾多,且新聞報道角度和立場的不同。本系統(tǒng)將主題識別與多文檔摘要技術(shù)結(jié)合起來,通過檢測出房產(chǎn)領(lǐng)域中的熱門主題,再綜合利用一趟聚類算法與最大邊緣相關(guān)句子抽取的方法對熱門主題中的多篇新聞文檔生成摘要,在保持新聞?wù)暮啙嵭缘幕A(chǔ)上,同時確保了新聞來源的全面性、可信度。

獲獎情況及鑒定結(jié)果

參加2011“挑戰(zhàn)杯”決賽比賽以及校內(nèi)技術(shù)沙龍展示。

作品所處階段

實驗階段

技術(shù)轉(zhuǎn)讓方式

暫無

作品可展示的形式

互聯(lián)網(wǎng)訪問

使用說明,技術(shù)特點和優(yōu)勢,適應(yīng)范圍,推廣前景的技術(shù)性說明,市場分析,經(jīng)濟效益預測

以自然語言處理技術(shù)、數(shù)據(jù)挖掘技術(shù)和互聯(lián)網(wǎng)信息獲取技術(shù)為基礎(chǔ),研究并解決了互聯(lián)網(wǎng)輿情信息的采集、整理和分析等關(guān)鍵技術(shù)問題。設(shè)計一個較為完整的面向房地產(chǎn)行業(yè)的熱點新聞主題播報自動生成解決方案和系統(tǒng)。 適用范圍:主要使用對象為房地產(chǎn)業(yè)內(nèi)人士、關(guān)注房地產(chǎn)行業(yè)動態(tài)的廣大網(wǎng)民以及地方政府組織。 推廣市場及經(jīng)濟效益分析:網(wǎng)絡(luò)的發(fā)展加速了資訊的流通,縮短了資訊形成知識所需要的時間,網(wǎng)絡(luò)膨脹得過于快速,資訊累積太快造成雜訊過多,卻又干擾了知識的形成,增值型服務(wù)業(yè)者為處于世界末的人們提供引擎、主題指引以及其他特殊服務(wù),目前網(wǎng)絡(luò)服務(wù)無法提供啟發(fā)性的資訊,而主題檢測和自動摘要是新資訊時代摘要的啟發(fā)性資訊服務(wù),通過主題檢測可判別資訊中流行的熱點資訊,并且透過自動摘要可快速的判讀資訊的相關(guān)性,不必取得完整資訊后才發(fā)現(xiàn)資訊不符合需求,自動摘要的服務(wù)能夠有效降低網(wǎng)絡(luò)流量,對于資訊的使用者與整體網(wǎng)絡(luò)環(huán)境,主題識別和自動摘要技術(shù)都具有很好的發(fā)展前景。

同類課題研究水平概述

主題檢測與跟蹤研究現(xiàn)狀: 主題檢測與跟蹤(TDT) 的概念最早產(chǎn)生于1996年。當時美國國防高級研究計劃署(DARPA)根據(jù)自己的需求,提出要開發(fā)一種新技術(shù),能在沒有人工干預的情況下自動判斷新聞數(shù)據(jù)流中的主題。1997年,一些研究者開始對這項技術(shù)進行了初步研究,并做了一些基礎(chǔ)工作(包括定義了主題檢測與跟蹤研究的內(nèi)容,建立了一個針對TDT研究的預研語料庫)。 TDT作為輿情分析的重要技術(shù)手段[2],是近十年自然語言處理和信息檢索領(lǐng)域的熱點研究課題。目前,主題檢測與跟蹤技術(shù)已經(jīng)步入實用階段,美國的Candor公司、IBM等公司在自己的產(chǎn)品中加入部分的主題檢測和追蹤功能。如SPSS公司的趨勢分析工具可用于輿情信息的趨勢分析,Autonomy公司的文本挖掘工具可用于熱門主題的發(fā)現(xiàn)等等。 二、 文檔自動摘要研究現(xiàn)狀: 迄今為止的自動文摘系統(tǒng)主要經(jīng)歷了以下兩個階段:基于統(tǒng)計的機械文摘和基于意義的理解文摘。 基于理解的文摘方法是以人工智能,特別是自然語言理解技術(shù)為基礎(chǔ)而發(fā)展起來的文摘方法。該方法與機械文摘的明顯區(qū)別在于對知識的利用,它不僅利用語言學知識獲取語言結(jié)構(gòu),更重要的是利用領(lǐng)域知識進行判斷、推理,得到文摘的意義表示,最后從意義表示中生成摘要。利用語言學手段將文章中代表這些信息焦點的文字識別出來,用話語加以組織即可形成一篇連貫的高質(zhì)量的文摘。 理解文摘系統(tǒng)的相關(guān)研究的主要成果有:70年代末80年代初,美國耶魯大學的Schank[5]在腳本分析見到的文獻,并在此基礎(chǔ)上總結(jié)出摘要。美國耶魯大學的DeJong[6]于1979年研制的著名的FRUMP系統(tǒng),該系統(tǒng)用于快速閱覽英文新聞資料,是理解文摘系統(tǒng)的樣板,F(xiàn)RUMP由預言和驗證器組成,預言器利用預先設(shè)置好的梗概劇本預測文獻中可能出現(xiàn)的事件,驗證則取證實這些被預測的事件,并給出實際信息。FRUMP系統(tǒng)創(chuàng)造了理解文摘的典范,但由于內(nèi)部存儲的劇本限制,如果文章中沒有該系統(tǒng)所期望的內(nèi)容則會被誤導,從而出現(xiàn)歧義。 我國大約從1985年開始介紹國外自動文摘方面的研究情況,從80年代末開始研究自動文摘實驗系統(tǒng),至今也有20余年的歷史了。但目前的技術(shù)水平尚不成熟,問題主要是在中文本身的語言特點以及自然理解方面的困難。
建議反饋 返回頂部