国产性70yerg老太,狠狠的日,欧美人与动牲交a免费,中文字幕成人网站

基本信息

項目名稱:
盲人的眼睛--基于windows操作系統(tǒng)的智能閱讀器
小類:
信息技術
簡介:
由于盲人視覺能力的缺失,他們喪失了最直觀的信息獲取方式。本著“給盲人一雙眼睛,給盲人一個未來”的團隊宗旨。我們研制盲人智能閱讀器系統(tǒng)。該系統(tǒng)由圖像采集系,復雜版面識別,圖像拼接,OCR識別和語音生成組成。綜合了模式識別,復雜版面識別理解,圖像拼接,OCR識別,語音識別等前沿技術。該閱讀器操作簡便,漢字識別率高,能夠識別不同新聞塊并區(qū)分,用戶閱讀體驗好。能夠滿足盲人朋友的實際需求。
詳細介紹:
由于盲人視覺能力的缺失,他們喪失了最直觀的信息獲取方式。以至于被邊緣化,無法融入社會這一嚴重后果。本作品本持“給盲人一雙眼睛,給盲人一個未來“的宗旨,為解決盲人不能像正常人一樣閱讀印刷品的問題而設計的具有人文關懷的高科技產品,該作品必將為盲人回歸社會,實現(xiàn)"平等、參與、共享"創(chuàng)造條件! 目前,關于圖像檢測處理的研究很多,印刷體漢字OCR識別和語音合成技術比較成熟,但是關于報紙文刊等排版復雜的特征識別,印刷體漢字圖像拼接處理研究還處于起步階段。市面的盲人閱讀器還不是很多,由于OCR識別對于圖像有較高的要求,已有的產品大部分采用掃描技術采集圖像;與此同時,國內外目前已有的盲人閱讀器還存在造價昂貴、體積大、攜帶困難、操作復雜、識別率低等問題。因此,新型盲人閱讀器及與之適應的新算法的研發(fā)已成為必然。 盲人閱讀器功能的實現(xiàn),對文字識別和語音合成兩項軟件技術有很高的要求。目前主流文字識別系統(tǒng)對于圖片非常敏感,圖像的質量嚴重影響文字識別率,并影響后續(xù)語音輸出的正確性,而語音輸出部分的準確率及自然度等又會直接影響到用戶是否能得到正確的信息。本作品主要由硬件圖像采集系統(tǒng)和軟件識別處理系統(tǒng)組成。系統(tǒng)運行基本過程為:硬件圖像采集系統(tǒng)自動采集報刊等紙質文字圖像,然后傳輸給軟件處理識別系統(tǒng)進行圖像數(shù)據分析處理,檢測報刊邊沿,并同時檢測是否含有標題,綜合返回一個指令,指揮硬件系統(tǒng)下一步操作。尋找到多視場的標題信息之后進行標題的完整圖像拼接,送入OCR識別,語音播報,讓閱讀者選擇是否閱讀該片文章。如果希望閱讀,那么拍攝該篇文章正文,進行完整正文拼接,送入OCR識別,語音播報;否則,則繼續(xù)尋找標題。同時為方便盲人,程序內部設置了語音提示系統(tǒng)。 本作品的創(chuàng)新部分:①圖像采集時采用了網絡攝像頭來采集文字圖像,以達到低成本和作品便攜的目的;②標題正文提取時采用了印刷體漢字標題與正文特征提取的方法,并提出了基于數(shù)學形態(tài)法和邊界動態(tài)跟蹤的印刷體漢字標題與正文提取算法思路并實現(xiàn)該算法;③使用了改進圖像匹配算法后的圖像拼接技術;④使用了OCR印刷體漢字識別方法;⑤TTS技術(語音生成)。 與此同時,該作品還具有眾多后期發(fā)展延伸潛力,如便捷式、閱讀更加復雜排版的紙質媒介印刷體漢字、與互聯(lián)網互聯(lián)、增加盲文輸入、增加存儲功能等,這些都是本作品基于現(xiàn)狀的下一步發(fā)展方向和目標,以更好的服務盲人,服務人民。

作品圖片

  • 盲人的眼睛--基于windows操作系統(tǒng)的智能閱讀器
  • 盲人的眼睛--基于windows操作系統(tǒng)的智能閱讀器
  • 盲人的眼睛--基于windows操作系統(tǒng)的智能閱讀器

作品專業(yè)信息

設計、發(fā)明的目的和基本思路、創(chuàng)新點、技術關鍵和主要技術指標

創(chuàng)新點:1.復雜版面1.具有語音提示操作功能;2.具有拼接功能; 3.可采用網絡攝像頭;4.圖像區(qū)域采集,使采集方便;5.有導軌系統(tǒng);6,位置檢測; 技術關鍵:1.圖像聚焦清晰;2.圖像平整幾乎沒有畸變3.環(huán)境光線近似平行光;4.拼接技術。 攝像頭分別率可低至CIF(320X240);字號可小至5號;識別率(估計)高于99%;軟件運行環(huán)境:windows XP 操作系統(tǒng),裝有Office2003完整版(包含Microsoft Office Document Imaging),Microsoft Speech SDK 5.1;

科學性、先進性

本作品采用了全新的復雜版面識別算法,可以成功的將視場內的標題和正文進行區(qū)別與提取,經過測試,該算法魯棒性好,每張圖的時間代價為0.5秒;本作品的拼接算法,改進了傳統(tǒng)的SIFT算法,讓特征點的匹配更加準確快速,并在圖像融合上采用了新的辦法,讓融合效果更加清晰,分開的文字也能融合成完整的文字。其時間代價僅為1.5秒。

獲獎情況及鑒定結果

作品所處階段

中試階段

技術轉讓方式

獨家許可

作品可展示的形式

實物產品,現(xiàn)場演示,圖片

使用說明,技術特點和優(yōu)勢,適應范圍,推廣前景的技術性說明,市場分析,經濟效益預測

技術特點和優(yōu)勢:1.具有圖像矯正;2.圖像拼接;3.語音提示;4.位置檢測; 適用范圍:該作品適用于廣大的盲人群體,如圖片圖像、廣告、網頁等閱讀,導行,指路,提示語音接近自然語言,盲人教育,盲人寫作等。 應用前景、市場分析和經濟效益預測:本作品不僅能滿足盲人對知識最基本的渴求,也能體現(xiàn)出社會主義大家庭對盲人的人文關懷,符合構建和諧社會的總基調。結合目前宏觀政策、經濟、社會、技術等方面的因素,該作品在國內市場有著較好的前景。 在技術上,漢字識別率、便捷性等方面都領先于國內同類產品,有較強的市場競爭力。與此同時,可以與民政局、殘聯(lián)、基金會等相關政府機構合作,作為公益產品推向盲人大眾。通過前期的社會調研,證明了該發(fā)明的實用性和迫切性,并獲得相關受訪者的高度評價。本發(fā)明可作為一個基本的技術平臺,向深度和廣度延伸,有著廣闊的市場。目前市面上已有的產品價格昂貴,普及率極低,我們的產品以低價格、高質量的優(yōu)越性價比在國內外市場上將具有很強的競爭能力,有望在國內外市場上占有較大的份額。

同類課題研究水平概述

1)、1975年Kurzwil發(fā)明了第一臺KRM(Kurzweil Reading Machine),它可以人聲閱讀任意字體的普通書籍、雜志和其他印刷文件。它的弊端是閱讀器體積大,不方便移動,盲人要使用它就要受到空間的限制。 2)、著名發(fā)明家雷伊?庫爾茲維爾在美國國家盲人協(xié)會的資助下發(fā)明了一種能使盲人閱讀任何文本的裝置,它包括數(shù)碼相機、與相機結合在一起的小型計算機和識別圖像的獨特軟件。閱讀器售價為3500美元。系統(tǒng)售價昂貴,不適用于盲人大眾和市場推廣。 3)、浙江大學億腦制造戴在手指頭上的盲人閱讀器(Touch Reader),集成了光電掃描儀、電子翻譯和盲文生成三大功能,將之套在食指上后,直接用它去“觸摸”書本等文字信息,掃描儀會自動將掠過的文字掃描識別,然后通過一個點陣將這些文字轉換為凸起、凹下的盲文——由于點陣分布在指套的里層,所以手指頭能感應到它的形狀變化,從而讓盲人朋友識別出這些盲文,進而理解其對應文字信息的意思。由于是單個字的識別,識別率比較低,只適用于能閱讀盲文的盲人。 (一)、使用“盲人閱讀器”關鍵詞對CNKI中國知網中國期刊全文數(shù)據庫,萬方數(shù)據數(shù)據庫,維普數(shù)據庫進行搜索,獲得8篇相關文獻資料。通過對這些文獻的閱讀,篩選出1篇具有指導價值和比較研究價值的相關文獻: 1)、 清華大學研制成功“盲人電子閱讀器” 中國科技信息 2003年21期 (二)、使用 "OCR"關鍵詞對CNKI中國知網中國期刊全文數(shù)據庫進行檢索,命中473篇文獻,通過對這些文獻的閱讀,篩選出以下對本文具有指導價值和比較研究價值的相關文獻: (1)、 利用OCR 識別技術實現(xiàn)視頻中文字的提取 陳義,李言俊,孫小煒 計算機工程與應用 2010年10期 2)、文本數(shù)字化圖像OCR識別的準確度測度實驗與提高 臧國全 圖書情報知識 2010年03期 (三)、使用 "OCR"關鍵詞對中文科技期刊全文數(shù)據庫 (VIP--維普)數(shù)據庫進行檢索,命中770篇文獻,,通過仔細閱讀摘要其中以下對本文具有意義: 1)、 舊式文本的OCR二值化和圖像預處理研究Maya R. Gupta Nathaniel P. Jacobson Eric K. Garcia 圖象識別與自動化 2007(1).-14-22
建議反饋 返回頂部