基本信息
- 項(xiàng)目名稱:
- 基于Android平臺的云計算手寫輸入法
- 小類:
- 信息技術(shù)
- 大類:
- 科技發(fā)明制作B類
- 簡介:
- 本作品在Google Android手機(jī)操作系統(tǒng)上開發(fā)了一個手寫輸入法軟件,并借助云計算技術(shù),建立了一個云手寫識別系統(tǒng)服務(wù)器,通過無線網(wǎng)絡(luò)為移動用戶提供高準(zhǔn)確率手寫識別、傾斜書寫識別和用戶自適應(yīng)識別等服務(wù)
- 詳細(xì)介紹:
- 云計算的提出,使得超級計算能力通過互聯(lián)網(wǎng)自由流通成為了可能,并為各種應(yīng)用開創(chuàng)了一種嶄新的應(yīng)用模式,逐漸發(fā)展成為一種網(wǎng)絡(luò)應(yīng)用趨勢。超級計算機(jī)應(yīng)用因需要非常昂貴的硬件投入面臨著極高的推廣門檻,云計算則通過互聯(lián)網(wǎng)將普通的個人計算機(jī)和標(biāo)準(zhǔn)服務(wù)器結(jié)合成計算機(jī)機(jī)群,宣告了低成本提供超級計算服務(wù)的可能。用戶在任何時間、任何地點(diǎn),用任何可以連接至互聯(lián)網(wǎng)的終端設(shè)備訪問“云”即可獲得所需服務(wù)。 與傳統(tǒng)的移動終端手寫識別系統(tǒng)相比,采用云計算的手寫識別技術(shù)有著十分明顯的優(yōu)勢: 1.更高的識別率。傳統(tǒng)的高識別率算法受計算量、存儲量等限制無法被用于移動終端,而采用云計算技術(shù)后,高精度的識別算法可運(yùn)行于云計算服務(wù)器端,移動終端通過與服務(wù)器的數(shù)據(jù)傳遞,可以獲得更準(zhǔn)確的識別率。 2.更精簡的移動終端系統(tǒng)。如上所述,由于主要的識別計算運(yùn)行于云計算服務(wù)器端,移動終端上的識別系統(tǒng)可以犧牲較小的識別性能來換取大幅降低的識別引擎存儲空間。通過基于子空間共享的矢量量化壓縮技術(shù),整體分類器字典的容量從76.4MB降到了2.06MB,大幅壓縮了97.3%,而識別率則僅僅下降0.88%,仍然維持在97%以上的水平。因此可以更廣泛的適用于存儲空間有限的移動終端設(shè)備,且方便用戶下載使用。 3.更快的服務(wù)器響應(yīng)。使用云計算技術(shù)搭建服務(wù)器,通過負(fù)載均衡、請求分配等技術(shù),能夠獲得遠(yuǎn)遠(yuǎn)優(yōu)于普通服務(wù)器的性能。通過測試已得,與普通服務(wù)器相比,云計算服務(wù)器可以在更短的時間內(nèi),處理更多的并發(fā)用戶數(shù)。云服務(wù)器的超級計算能力,為處理大量用戶并發(fā)獲取服務(wù)提供了良好的保障性和穩(wěn)定性,從而大大提高用戶體驗(yàn)性。 正是由于有著這些優(yōu)勢,使得云計算手寫識別技術(shù)成為急待我們?nèi)パ芯拷鉀Q的熱點(diǎn)問題。在移動終端系統(tǒng)的選擇中,我們選擇了Android智能手機(jī)操作系統(tǒng),作為一個極具發(fā)展?jié)摿Φ牟僮飨到y(tǒng),Android系統(tǒng)的全球智能手機(jī)市場占有率從2009年的3.5%增長到2010年的25.5%,并且于2011年2月推出了針對平板電腦的Android 3.0。選擇Android客戶端大大拓寬了本作品的商業(yè)應(yīng)用價值。
作品專業(yè)信息
設(shè)計、發(fā)明的目的和基本思路、創(chuàng)新點(diǎn)、技術(shù)關(guān)鍵和主要技術(shù)指標(biāo)
- 基本思路: 首先由用戶輸入未辨識的字符,識別系統(tǒng)先將采集到的這些信號作預(yù)處理,模式識別系統(tǒng)都有一個訓(xùn)練模塊,用來訓(xùn)練產(chǎn)生用于識別的參考模型或者參考模式。用來訓(xùn)練的數(shù)據(jù)通常都是已標(biāo)記類別的樣本的特征矢量。通過一定的訓(xùn)練算法,將這些樣本的統(tǒng)計特性訓(xùn)練出來,得出相應(yīng)的參考模型或者參考模式。用戶在書寫后,書寫筆跡通過2.5G、3G、WiFi等無線網(wǎng)絡(luò)傳輸?shù)皆朴嬎惴?wù)器端。服務(wù)器端采用Enomaly虛擬云架構(gòu)設(shè)計,用戶借助3G、WiFi等高速無線網(wǎng)絡(luò),移動終端和云服務(wù)器之間數(shù)據(jù)傳輸所需的時間非常小,用戶難以感覺到明顯的延時。同時,我們在云計算服務(wù)器端加入了傾斜書寫識別、書寫者自適應(yīng)技術(shù),為用戶提供更好的用戶體驗(yàn)。 技術(shù)關(guān)鍵: 1. Android智能操作系統(tǒng); 2. 手寫識別技術(shù); 3. 云計算技術(shù); 4. 增量學(xué)習(xí)技術(shù); 5. 傾斜矯正技術(shù); 6. 分類器壓縮技術(shù); 主要技術(shù)指標(biāo): 1)客戶端識別率(平均) >= 97% 2)服務(wù)器端識別率(平均) >= 97.45% 3)工整輸入識別率 >= 99% 4)連筆輸入識別率 >= 96% 5) 旋轉(zhuǎn)輸入識別率 >= 93% 6)與服務(wù)器通信時間 < 16毫秒(300個并發(fā)用戶) 7)存儲空間 < 2MB 8)支持字符集:國標(biāo)一二級字庫6763類漢字,單子識別支持英文大小寫字母,數(shù)字、常見符號等; 9)支持詞典詞匯量:>100,000個中文詞組
科學(xué)性、先進(jìn)性
- 1.云計算識別系統(tǒng) 實(shí)驗(yàn)結(jié)果表明,傳統(tǒng)C/S模式的傳統(tǒng)服務(wù)器在用戶并發(fā)數(shù)為300時處理能力已經(jīng)達(dá)到極限,而采用基于云計算架構(gòu)的手寫識別系統(tǒng)能輕松處理1000個并發(fā)用戶的服務(wù)請求,在處理300個并發(fā)用戶時,接入率為100%,平均識別處理時間僅為16ms,大大低于傳統(tǒng)服務(wù)器模式的接入率(82.7%)和處理時間(340ms)。 2.實(shí)現(xiàn)了書寫方向上的無約束 本作品提出一種中心平衡法,實(shí)現(xiàn)了無論用戶以何種方向角度書寫詞組,識別系統(tǒng)都能將它識別出來。 3.特定用戶自適應(yīng)學(xué)習(xí) 本作品將傳統(tǒng)的書寫者無關(guān)的手寫識別系統(tǒng)轉(zhuǎn)化成為一個書寫者相關(guān)的手寫識別系統(tǒng)。實(shí)驗(yàn)結(jié)果表明,在利用增量學(xué)習(xí)技術(shù)對特定書寫者的風(fēng)格進(jìn)行學(xué)習(xí)后,其平均錯誤率下降的比率超過51%。 4.極小的分類器存儲量 本作品著力解決了高性能分類器MQDF的存儲空間問題。利用子空間分布共享等技術(shù)對MQDF分類器進(jìn)行壓縮,降低其所需的存儲量,使得MQDF分類器在手持設(shè)備上的應(yīng)用成為可能。
獲獎情況及鑒定結(jié)果
- [1].2010年第一屆中國云計算與SaaS學(xué)術(shù)會議 優(yōu)秀論文獎。 [2].2010年中科院自動化所模式識別國家重點(diǎn)實(shí)驗(yàn)室,手寫漢字識別評測聯(lián)機(jī)系統(tǒng)識別率第一,脫機(jī)系統(tǒng)識別率第二。
作品所處階段
- 試用階段
技術(shù)轉(zhuǎn)讓方式
- 無
作品可展示的形式
- 實(shí)物,現(xiàn)場演示,圖片
使用說明,技術(shù)特點(diǎn)和優(yōu)勢,適應(yīng)范圍,推廣前景的技術(shù)性說明,市場分析,經(jīng)濟(jì)效益預(yù)測
- 技術(shù)特點(diǎn)和優(yōu)勢: 1、基于Enomaly虛擬云架構(gòu),將多臺普通個人計算機(jī)和標(biāo)準(zhǔn)服務(wù)器利用網(wǎng)絡(luò)結(jié)合起來組成超級計算機(jī)群,提供強(qiáng)勁的識別處理能力,保證用戶的識別速度。 2、針對手寫漢字的傾斜矯正算法,以實(shí)現(xiàn)旋轉(zhuǎn)方向無關(guān)的手寫識別。 3、在現(xiàn)有的LDA和MQDF算法中加入增量技術(shù),實(shí)現(xiàn)特定用戶自適應(yīng)系統(tǒng),提供更好的用戶體驗(yàn)。 4、獨(dú)創(chuàng)的兩級壓縮技術(shù),將算法所需的巨大存儲量極大程度的壓縮. 適用范圍: 本作品運(yùn)行于Android操作平臺,適用于手機(jī)、PDA、平板電腦等移動電子設(shè)備。 推廣前景: 智能手機(jī)已不斷取代傳統(tǒng)手機(jī)進(jìn)入人們的生活,智能手機(jī)的市場出貨量從2009年的1.77億部提高至2010年的3.02億部,增幅高達(dá)71%。與此同時,作為新一代觸摸屏操作系統(tǒng),Android在2010年更是大放異彩,其智能手機(jī)在全球市場上的占有率從2009年的4%飆升到24%,在中國市場上由2008年的0.3%飆升至14.3%。
同類課題研究水平概述
- 在云計算時代,“云”會替我們做存儲和計算的工作,“云”就是計算機(jī)群,每一個群包含幾十萬臺、甚至上百萬臺計算機(jī),“云”的好處在于其中的硬件、軟件、信息、資料可以隨時更新,保證“云”長生不老。云計算的主要三大形式如下: 1.軟件即服務(wù)(Software-as-a-Service).SaaS是一種軟件布局模型,其應(yīng)用專為網(wǎng)絡(luò)交付而設(shè)計。SaaS提供商為企業(yè)搭建信息化所需要的所有網(wǎng)絡(luò)基礎(chǔ)設(shè)施及軟件、硬件運(yùn)作平臺,并負(fù)責(zé)所有前期的實(shí)施、后期的維護(hù)等一些列服務(wù),省去了用戶在服務(wù)器和軟件授權(quán)上的開支。通過Internet,廠商將應(yīng)用軟件統(tǒng)一部署在自己的服務(wù)器上,用戶根據(jù)自己的需求,通過互聯(lián)網(wǎng)向廠商訂購所需要的服務(wù)。 2.平臺即服務(wù)(Platform-as-a-Service).PaaS提供給用戶的服務(wù)是用戶采用的開發(fā)語言和開發(fā)工具,它能夠提供企業(yè)進(jìn)行定制化研發(fā)的中間件平臺,同時涵蓋數(shù)據(jù)庫和應(yīng)用服務(wù)等,企業(yè)員工共享同一個開發(fā)平臺,提高工作效率。此外,PaaS對于SaaS運(yùn)營商來說,可以幫助他們進(jìn)行產(chǎn)品多元化和產(chǎn)品定制化,用戶可以基于他們的平臺開發(fā)多種SaaS應(yīng)用,使其成為多元化的軟件供應(yīng)商。 3.基礎(chǔ)設(shè)施即服務(wù)(Infrastructure-as-a-Service).IaaS通過Internet為用戶提供完善的計算機(jī)基礎(chǔ)設(shè)施獲得服務(wù),包括處理、存儲、網(wǎng)絡(luò)和其它基本的計算資源,用戶可以部署和運(yùn)行任意軟件,包括操作系統(tǒng)和應(yīng)用程序。即用戶可以在網(wǎng)絡(luò)上獲得一個虛擬的計算機(jī)資源。