基本信息
- 項目名稱:
- “指”標(biāo)
- 小類:
- 信息技術(shù)
- 大類:
- 科技發(fā)明制作B類
- 簡介:
- “指”標(biāo)涉及圖像處理,人機(jī)交互,以及模式識別等熱門領(lǐng)域;通過攝像頭讀入用戶的操作信息,提取圖像信息,將該信息與系統(tǒng)中模式進(jìn)行匹配,識別用戶操作,完成操作。將操作模式由從固定物理外設(shè)獲得改為識別用戶的不同手勢動作,將動作賦予操作命令。需要解決的關(guān)鍵問題有手勢的識別,由環(huán)境帶來的外部光線物體引起的識別誤差,對特定識別對象的跟蹤與定位,與不同手勢對應(yīng)的不同功能的實(shí)現(xiàn),性能上良好的用戶使用體驗。
- 詳細(xì)介紹:
- 隨著人與計算機(jī)的交互方式也在不斷向著人們使用習(xí)慣改變,鼠標(biāo)的使用局限了用戶的操作方式,限制了人機(jī)交互。未來的交互方式將不拘泥于各種硬件,而實(shí)現(xiàn)人與外界的信息交流,將數(shù)字世界帶入人們的生活中。通過“指”標(biāo),用戶可以不借助鼠標(biāo),通過在電腦前作出相應(yīng)的手勢,由攝像頭捕捉、分析并識別,完成手勢定義的操作,實(shí)現(xiàn)控制電腦完成相應(yīng)相應(yīng)動作的操作,如只需動一下手指便可打開軟件,瀏覽網(wǎng)頁圖片,播放PPT等功能。在項目的實(shí)現(xiàn)階段,通過將項目細(xì)分為各個高內(nèi)聚低耦合的子模塊,并行開發(fā)。 通過不同的手勢實(shí)現(xiàn)控制電腦的作用。對運(yùn)行平臺處理能力及攝像頭的硬件要求較低,只需普通上網(wǎng)本及自帶的前置攝像頭配合軟件使用。通過兩次重疊函數(shù)映射實(shí)現(xiàn)鼠標(biāo)位置的重定位,在良好光線下達(dá)到2毫米內(nèi)精度。根據(jù)本項目的特點(diǎn)獨(dú)立設(shè)計跟蹤算法,實(shí)現(xiàn)高效準(zhǔn)確的定位跟蹤。 同時可以應(yīng)用到智能移動平臺如手機(jī)、平板電腦上,拓寬了使用方式,豐富了交互體驗。擺脫諸如鼠標(biāo),鍵盤等外設(shè)在做用戶交互的操作局限、硬件局限、空間局限。該項目已經(jīng)成功移植到Meego系統(tǒng),該系統(tǒng)為智能手機(jī)平板電腦的操作系統(tǒng)。
作品專業(yè)信息
設(shè)計、發(fā)明的目的和基本思路、創(chuàng)新點(diǎn)、技術(shù)關(guān)鍵和主要技術(shù)指標(biāo)
- 隨著人與計算機(jī)的交互方式也在不斷向著人們使用習(xí)慣改變,鼠標(biāo)的使用局限了用戶的操作方式,限制了人機(jī)交互。未來的交互方式將不拘泥于各種硬件,而實(shí)現(xiàn)人與外界的信息交流,將數(shù)字世界帶入人們的生活中。通過“指”標(biāo),用戶可以不借助鼠標(biāo),通過在電腦前作出相應(yīng)的手勢,由攝像頭捕捉、分析并識別,完成手勢定義的操作,實(shí)現(xiàn)控制電腦完成相應(yīng)相應(yīng)動作的操作,如只需動一下手指便可打開軟件,瀏覽網(wǎng)頁圖片,播放PPT等功能。在項目的實(shí)現(xiàn)階段,通過將項目細(xì)分為各個高內(nèi)聚低耦合的子模塊,并行開發(fā)。 創(chuàng)新點(diǎn): 通過不同的手勢實(shí)現(xiàn)控制電腦的作用。對運(yùn)行平臺處理能力及攝像頭的硬件要求較低,只需普通上網(wǎng)本及自帶的前置攝像頭配合軟件使用。通過兩次重疊函數(shù)映射實(shí)現(xiàn)鼠標(biāo)位置的重定位,在良好光線下達(dá)到2毫米內(nèi)精度。根據(jù)本項目的特點(diǎn)獨(dú)立設(shè)計跟蹤算法,實(shí)現(xiàn)高效準(zhǔn)確的定位跟蹤。 同時可以應(yīng)用到智能移動平臺如手機(jī)、平板電腦上,拓寬了使用方式,豐富了交互體驗。擺脫諸如鼠標(biāo),鍵盤等外設(shè)在做用戶交互的操作局限、硬件局限、空間局限。該項目已經(jīng)成功移植到Meego系統(tǒng),該系統(tǒng)為智能手機(jī)平板電腦的操作系統(tǒng)。 技術(shù)關(guān)鍵及指標(biāo): A. 通過設(shè)計針對本項目的跟蹤算法,實(shí)現(xiàn)對目標(biāo)的精確定位。 B. 在鼠標(biāo)映射位置上,采取二次重疊函數(shù)映射,排除動作抖動,并提高了移動定位的精確度,在良好光線條件下達(dá)到2mm以內(nèi)。 C. 通過對函數(shù)圖像上的處理,在一定程度上排除光線影響。 D. 各種手勢的設(shè)計,及相應(yīng)操作的實(shí)現(xiàn)。
科學(xué)性、先進(jìn)性
- 現(xiàn)有基于視覺的虛擬鼠標(biāo)主要分兩大類,一類是激光筆虛擬鼠標(biāo),通過提取光點(diǎn)圖像坐標(biāo)建立與計算機(jī)屏幕坐標(biāo)的對應(yīng),此類虛擬鼠標(biāo)采用了求解二維平面間單應(yīng)性映射矩陣的方法進(jìn)行標(biāo)定。另一類是基于手勢、眼睛視線或人臉特征等身體特征的虛擬鼠標(biāo),D.0.Gorodnichy等研發(fā)的Nouse基于雙目立體視覺技術(shù)和極線幾何關(guān)系,完成鼻尖三維空間定位,實(shí)現(xiàn)對計算機(jī)的簡單控制。該類虛擬鼠標(biāo)系統(tǒng)的成本較高、視場范圍小、標(biāo)定過程復(fù)雜、立體匹配難、計算量大、實(shí)時性較差。2009年,麻省理工學(xué)院(MIT)媒體實(shí)驗室(Media Lab)的博士候選人及研究助理的Pranav Mistry是發(fā)明的“第六感”裝置,引起世界轟動。 在技術(shù)實(shí)現(xiàn)上,根據(jù)使用條件,采用定制開發(fā)的算法,有別于常用的跟蹤算法,將顏色與位置等信息向結(jié)合,加以廣度優(yōu)先及最優(yōu)匹配,并在運(yùn)行時采用機(jī)器學(xué)習(xí)原理,不斷調(diào)整跟蹤特征值,達(dá)到良好的跟蹤效果。同時在函數(shù)設(shè)計上,采用雙層函數(shù)上的匹配擬合,達(dá)到良好的使用體驗。
獲獎情況及鑒定結(jié)果
- 該作品于2010年11月12日,于山東大學(xué),獲得山東大學(xué)軟件學(xué)院“創(chuàng)新杯”一等獎。
作品所處階段
- 中試階段
技術(shù)轉(zhuǎn)讓方式
- 一次性結(jié)算
作品可展示的形式
- 現(xiàn)場演示,圖片,錄像,樣品
使用說明,技術(shù)特點(diǎn)和優(yōu)勢,適應(yīng)范圍,推廣前景的技術(shù)性說明,市場分析,經(jīng)濟(jì)效益預(yù)測
- 技術(shù)特點(diǎn): 高可用性及高移植性。指標(biāo)有別于其他機(jī)器視覺項目、手勢識別項目依賴較高的攝像頭分辨率及較高的CPU運(yùn)算資源的限制,實(shí)現(xiàn)在上網(wǎng)本等較低運(yùn)算能力平臺的應(yīng)用,同時良好的跨平臺性質(zhì)使之能良好的運(yùn)行在MeeGo平臺,即可適用于智能移動平臺上如智能手機(jī)平板電腦上。 推廣前景說明: 虛擬鼠標(biāo)可以使用計算機(jī)和手機(jī)自帶的攝像機(jī)以及攝像功能,使用者可通過計算機(jī)或手機(jī)進(jìn)行單擊、雙擊、右擊、拖拽等鼠標(biāo)操作,讓沉悶單調(diào)的鼠標(biāo)增添不少生動的氣氛,為商業(yè)、游戲、教育和影音娛樂市場提供了活潑互動的選擇。該系統(tǒng)通過增添模塊可以進(jìn)一步實(shí)現(xiàn)手語的學(xué)習(xí)功能,空間繪畫功能以及游戲操控中。 虛擬鼠標(biāo)顯示了技術(shù)的創(chuàng)新,是新概念的人機(jī)交互模式,賦予市場全新的定位,改變了舊有的刻板操作,帶來了科技的創(chuàng)新,創(chuàng)造了雙向互動的新潮流。同時脫離了硬件的設(shè)置,實(shí)現(xiàn)了低碳環(huán)保,避免了細(xì)菌的接觸式傳染。
同類課題研究水平概述
- 現(xiàn)有同類課題主要分兩大類,一類是激光筆虛擬鼠標(biāo),通過提取光點(diǎn)圖像坐標(biāo)建立與計算機(jī)屏幕坐標(biāo)的對應(yīng),此類虛擬鼠標(biāo)采用了求解二維平面間單應(yīng)性映射矩陣的方法進(jìn)行標(biāo)定,在市場上的激光筆虛擬鼠標(biāo)并不具備對鼠標(biāo)位置進(jìn)行光線跟蹤定位的功能,只能實(shí)現(xiàn)類似鼠標(biāo)單擊雙擊,播放PPT時上下頁面的切換等功能,并不能廣泛應(yīng)用到對電腦的操控,不具新穎獨(dú)特的用戶交互體驗,在使用上也受應(yīng)用的局限。另一類是基于手勢、眼睛視線或人臉特征等身體特征的虛擬鼠標(biāo),Nouse基于雙目立體視覺技術(shù)和極線幾何關(guān)系,完成鼻尖三維空間定位,實(shí)現(xiàn)對計算機(jī)的簡單控制。該類虛擬鼠標(biāo)系統(tǒng)的成本較高、視場范圍小、標(biāo)定過程復(fù)雜、立體匹配難、計算量大、實(shí)時性較差對平臺的要求較高也使其不具良好的移植性,同時,在控制時,需要不斷移動頭部,與用戶使用習(xí)慣相差很大很難普及推廣。2009年,麻省理工學(xué)院(MIT)媒體實(shí)驗室(Media Lab)的博士候選人及研究助理的Pranav Mistry是發(fā)明的“第六感”裝置,引起世界轟動。該設(shè)施將攝像頭與投影儀集合,通過攝像頭捕捉操作者的動作,用投影儀進(jìn)行呈現(xiàn)的方式,將數(shù)字世界帶入人們的生活中。 在跟蹤算法上,沒有基于機(jī)器學(xué)習(xí),結(jié)合目標(biāo)特征值及相對位置信息的跟蹤算法,對對象進(jìn)行實(shí)時跟蹤。在跟蹤上,首先是基于已經(jīng)定義的特征值,以及多對象間存在的相對位置信息,確定目標(biāo)值,再分析每次檢測出對象的特征值受環(huán)境光線影響變化,計算受影響系數(shù),將系數(shù)加權(quán)到下次搜索過程中,得到精確度更高的結(jié)果。該跟蹤方法針對本項目在使用過程中的條件設(shè)計實(shí)現(xiàn),能較好的實(shí)現(xiàn)在光線變化情況下的識別,同時在本領(lǐng)域內(nèi)沒有搜索到相關(guān)文獻(xiàn)。具有獨(dú)立的知識產(chǎn)權(quán)。同時,在本項目中采用的二次重疊函數(shù)映射法,也并未在之前論文期刊等中出現(xiàn),采用二次重疊函數(shù)映射法,提高了移動精度。本項目在位置映射時并沒有采用普遍的一次函數(shù)直接映射,而是采用兩次函數(shù)映射實(shí)現(xiàn)鼠標(biāo)位置移動定位。以移動食指完成鼠標(biāo)位置定位為例,在移動較近距離時,用戶往往慢慢移動,而想要實(shí)現(xiàn)跨度較大的移動時,移動速度較快。而用戶覺察到是否定位到指定位置是通過人眼的觀察?;谝陨戏治?,二次重疊函數(shù)映射法得以實(shí)現(xiàn),即在短距離移動時,使用較多的像素點(diǎn)信息,當(dāng)移動距離較大時,使用較少像素點(diǎn),通過一次映射后將調(diào)整后的位置坐標(biāo)映射到屏幕上。該方法在本項目中首次出現(xiàn),沒有文獻(xiàn)記錄。