国产性70yerg老太,狠狠的日,欧美人与动牲交a免费,中文字幕成人网站

基本信息

項(xiàng)目名稱:
面向房地產(chǎn)行業(yè)的熱點(diǎn)新聞主題播報(bào)自動生成系統(tǒng)
小類:
信息技術(shù)
簡介:
本系統(tǒng)結(jié)合主題檢測與多文檔自動摘要這兩種先進(jìn)的自然語言處理技術(shù),針對互聯(lián)網(wǎng)上新聞網(wǎng)站發(fā)布的房地產(chǎn)行業(yè)的報(bào)道,對海量數(shù)據(jù)進(jìn)行分析和組織,以播報(bào)的形式發(fā)布最新熱點(diǎn)關(guān)注資訊,為房地產(chǎn)業(yè)內(nèi)人士、關(guān)注房地產(chǎn)行業(yè)動態(tài)的廣大網(wǎng)民以及地方政府組織提供信息服務(wù),不僅讓人們能在最短的時(shí)間內(nèi)獲取最感興趣的信息,還可以用來監(jiān)控到事情發(fā)展最新動態(tài),提升政府機(jī)構(gòu)以及企業(yè)的輿情掌握與危機(jī)公關(guān)能力。
詳細(xì)介紹:
本系統(tǒng)結(jié)合主題檢測與多文檔自動摘要這兩種先進(jìn)的自然語言處理技術(shù),針對互聯(lián)網(wǎng)上新聞網(wǎng)站發(fā)布的房地產(chǎn)行業(yè)的報(bào)道,對海量數(shù)據(jù)進(jìn)行分析和組織,以播報(bào)的形式發(fā)布最新熱點(diǎn)關(guān)注資訊,為房地產(chǎn)業(yè)內(nèi)人士、關(guān)注房地產(chǎn)行業(yè)動態(tài)的廣大網(wǎng)民以及地方政府組織提供信息服務(wù),不僅讓人們能在最短的時(shí)間內(nèi)獲取最感興趣的信息,還可以用來監(jiān)控到事情發(fā)展最新動態(tài),提升政府機(jī)構(gòu)以及企業(yè)的輿情掌握與危機(jī)公關(guān)能力。

作品專業(yè)信息

設(shè)計(jì)、發(fā)明的目的和基本思路、創(chuàng)新點(diǎn)、技術(shù)關(guān)鍵和主要技術(shù)指標(biāo)

意義與目的: 近年來房地產(chǎn)行業(yè)價(jià)格波動倍受矚目,與之相關(guān)的政策、土地、市場、業(yè)內(nèi)熱點(diǎn)都受很大關(guān)注,每天產(chǎn)生的業(yè)界新聞數(shù)以百千計(jì),人工手動整理和瀏覽會浪費(fèi)很多時(shí)間與精力。本系統(tǒng)通過綜合運(yùn)用主題檢測與多文檔自動摘要技術(shù)對房地產(chǎn)新聞輿情進(jìn)行監(jiān)測和分析,從錯(cuò)綜復(fù)雜的房地產(chǎn)新聞報(bào)道分析中自動生成播報(bào)信息,可以讓用戶快速了解業(yè)界形勢走向,為有關(guān)中央和地方政府部門提供決策信息來源和輿論監(jiān)控導(dǎo)向。 二、基本思路: 針對互聯(lián)網(wǎng)上新聞網(wǎng)站發(fā)布的房地產(chǎn)行業(yè)的報(bào)道,設(shè)計(jì)一個(gè)主題識別與自動文摘相結(jié)合的熱點(diǎn)新聞主題播報(bào)系統(tǒng),分別將當(dāng)天、三天以內(nèi)、一周以內(nèi)的報(bào)道整理并聚合形成各個(gè)主題,并對每個(gè)主題生成多文檔自動文摘播報(bào),最后以網(wǎng)頁的形式發(fā)布。 三、創(chuàng)新點(diǎn): 1、本系統(tǒng)內(nèi)容面向房地產(chǎn)行業(yè),有較強(qiáng)的針對性。 2、提出了一種主題識別的方法。利用主題檢測技術(shù),可以自動從海量新聞信息中識別出熱點(diǎn)主題,并按照主題進(jìn)行歸類和組織,節(jié)約人工閱讀整理的消耗,方便用戶的瀏覽和選擇使用。 3、提出了一種輿情播報(bào)自動生成的方法。每個(gè)主題都涵蓋了詳細(xì)的敘述和分析,為了使用戶能快速、準(zhǔn)確、全面接收主題的中心意思,本系統(tǒng)提出了一種多文檔自動摘要的方法,從有關(guān)某個(gè)主題的所有報(bào)道中,通過算法提取出簡明扼要的特征并整合生成一篇概括性短文。 四、技術(shù)關(guān)鍵: 1、新聞獲取技術(shù) 2、主題識別技術(shù) 3、多文檔自動摘要技術(shù)

科學(xué)性、先進(jìn)性

1、實(shí)用性:滿足輿情播報(bào)的核心功能和重要功能,功能簡潔清晰; 2、技術(shù)先進(jìn):融合了數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)庫技術(shù)、計(jì)算語言技術(shù)以及多項(xiàng)自然語言智能處理等技術(shù)。 本系統(tǒng)采用的主題檢測和自動文摘中的聚類方法均采用的一趟聚類算法,經(jīng)過在路透社的新聞?wù)Z料中進(jìn)行測試,下表是對7個(gè)最頻繁出現(xiàn)的類聚類結(jié)果,分別有得到的簇的個(gè)數(shù)和聚類準(zhǔn)確度,其中可以說明在那么多個(gè)簇里面有部分是只有幾個(gè)文檔,而我們是關(guān)注在大簇上,所以這對熱門主題檢測很有意義。 3、專業(yè)性:現(xiàn)在國內(nèi)比較有名的輿情系統(tǒng)有中科點(diǎn)擊、天璣金融輿情播報(bào)等。但與熱門主題相關(guān)報(bào)道來源眾多,且新聞報(bào)道角度和立場的不同。本系統(tǒng)將主題識別與多文檔摘要技術(shù)結(jié)合起來,通過檢測出房產(chǎn)領(lǐng)域中的熱門主題,再綜合利用一趟聚類算法與最大邊緣相關(guān)句子抽取的方法對熱門主題中的多篇新聞文檔生成摘要,在保持新聞?wù)暮啙嵭缘幕A(chǔ)上,同時(shí)確保了新聞來源的全面性、可信度。

獲獎(jiǎng)情況及鑒定結(jié)果

參加2011“挑戰(zhàn)杯”決賽比賽以及校內(nèi)技術(shù)沙龍展示。

作品所處階段

實(shí)驗(yàn)階段

技術(shù)轉(zhuǎn)讓方式

暫無

作品可展示的形式

互聯(lián)網(wǎng)訪問

使用說明,技術(shù)特點(diǎn)和優(yōu)勢,適應(yīng)范圍,推廣前景的技術(shù)性說明,市場分析,經(jīng)濟(jì)效益預(yù)測

以自然語言處理技術(shù)、數(shù)據(jù)挖掘技術(shù)和互聯(lián)網(wǎng)信息獲取技術(shù)為基礎(chǔ),研究并解決了互聯(lián)網(wǎng)輿情信息的采集、整理和分析等關(guān)鍵技術(shù)問題。設(shè)計(jì)一個(gè)較為完整的面向房地產(chǎn)行業(yè)的熱點(diǎn)新聞主題播報(bào)自動生成解決方案和系統(tǒng)。 適用范圍:主要使用對象為房地產(chǎn)業(yè)內(nèi)人士、關(guān)注房地產(chǎn)行業(yè)動態(tài)的廣大網(wǎng)民以及地方政府組織。 推廣市場及經(jīng)濟(jì)效益分析:網(wǎng)絡(luò)的發(fā)展加速了資訊的流通,縮短了資訊形成知識所需要的時(shí)間,網(wǎng)絡(luò)膨脹得過于快速,資訊累積太快造成雜訊過多,卻又干擾了知識的形成,增值型服務(wù)業(yè)者為處于世界末的人們提供引擎、主題指引以及其他特殊服務(wù),目前網(wǎng)絡(luò)服務(wù)無法提供啟發(fā)性的資訊,而主題檢測和自動摘要是新資訊時(shí)代摘要的啟發(fā)性資訊服務(wù),通過主題檢測可判別資訊中流行的熱點(diǎn)資訊,并且透過自動摘要可快速的判讀資訊的相關(guān)性,不必取得完整資訊后才發(fā)現(xiàn)資訊不符合需求,自動摘要的服務(wù)能夠有效降低網(wǎng)絡(luò)流量,對于資訊的使用者與整體網(wǎng)絡(luò)環(huán)境,主題識別和自動摘要技術(shù)都具有很好的發(fā)展前景。

同類課題研究水平概述

主題檢測與跟蹤研究現(xiàn)狀: 主題檢測與跟蹤(TDT) 的概念最早產(chǎn)生于1996年。當(dāng)時(shí)美國國防高級研究計(jì)劃署(DARPA)根據(jù)自己的需求,提出要開發(fā)一種新技術(shù),能在沒有人工干預(yù)的情況下自動判斷新聞數(shù)據(jù)流中的主題。1997年,一些研究者開始對這項(xiàng)技術(shù)進(jìn)行了初步研究,并做了一些基礎(chǔ)工作(包括定義了主題檢測與跟蹤研究的內(nèi)容,建立了一個(gè)針對TDT研究的預(yù)研語料庫)。 TDT作為輿情分析的重要技術(shù)手段[2],是近十年自然語言處理和信息檢索領(lǐng)域的熱點(diǎn)研究課題。目前,主題檢測與跟蹤技術(shù)已經(jīng)步入實(shí)用階段,美國的Candor公司、IBM等公司在自己的產(chǎn)品中加入部分的主題檢測和追蹤功能。如SPSS公司的趨勢分析工具可用于輿情信息的趨勢分析,Autonomy公司的文本挖掘工具可用于熱門主題的發(fā)現(xiàn)等等。 二、 文檔自動摘要研究現(xiàn)狀: 迄今為止的自動文摘系統(tǒng)主要經(jīng)歷了以下兩個(gè)階段:基于統(tǒng)計(jì)的機(jī)械文摘和基于意義的理解文摘。 基于理解的文摘方法是以人工智能,特別是自然語言理解技術(shù)為基礎(chǔ)而發(fā)展起來的文摘方法。該方法與機(jī)械文摘的明顯區(qū)別在于對知識的利用,它不僅利用語言學(xué)知識獲取語言結(jié)構(gòu),更重要的是利用領(lǐng)域知識進(jìn)行判斷、推理,得到文摘的意義表示,最后從意義表示中生成摘要。利用語言學(xué)手段將文章中代表這些信息焦點(diǎn)的文字識別出來,用話語加以組織即可形成一篇連貫的高質(zhì)量的文摘。 理解文摘系統(tǒng)的相關(guān)研究的主要成果有:70年代末80年代初,美國耶魯大學(xué)的Schank[5]在腳本分析見到的文獻(xiàn),并在此基礎(chǔ)上總結(jié)出摘要。美國耶魯大學(xué)的DeJong[6]于1979年研制的著名的FRUMP系統(tǒng),該系統(tǒng)用于快速閱覽英文新聞資料,是理解文摘系統(tǒng)的樣板,F(xiàn)RUMP由預(yù)言和驗(yàn)證器組成,預(yù)言器利用預(yù)先設(shè)置好的梗概劇本預(yù)測文獻(xiàn)中可能出現(xiàn)的事件,驗(yàn)證則取證實(shí)這些被預(yù)測的事件,并給出實(shí)際信息。FRUMP系統(tǒng)創(chuàng)造了理解文摘的典范,但由于內(nèi)部存儲的劇本限制,如果文章中沒有該系統(tǒng)所期望的內(nèi)容則會被誤導(dǎo),從而出現(xiàn)歧義。 我國大約從1985年開始介紹國外自動文摘方面的研究情況,從80年代末開始研究自動文摘實(shí)驗(yàn)系統(tǒng),至今也有20余年的歷史了。但目前的技術(shù)水平尚不成熟,問題主要是在中文本身的語言特點(diǎn)以及自然理解方面的困難。
建議反饋 返回頂部