基本信息
- 項(xiàng)目名稱:
- 視聽覺智能機(jī)器人
- 小類:
- 信息技術(shù)
- 大類:
- 科技發(fā)明制作B類
- 簡介:
- 本作品試圖制具備閱讀能力的人工智能機(jī)器人,使機(jī)器人掌握閱讀能力,讓它們能夠看懂交通標(biāo)志和地名,從而可以自己獨(dú)立駕駛,獨(dú)立“生活”。本機(jī)器人能會話,能閱讀,能唱歌,能聽懂人的意思,是人類的好幫手。
- 詳細(xì)介紹:
- 本作品試圖制具備閱讀能力的人工智能機(jī)器人,使機(jī)器人掌握閱讀能力,讓它們能夠看懂交通標(biāo)志和地名,從而可以自己獨(dú)立駕駛,獨(dú)立“生活”。本機(jī)器人能會話,能閱讀,能唱歌,能聽懂人的意思,是人類的好幫手。
作品專業(yè)信息
設(shè)計(jì)、發(fā)明的目的和基本思路、創(chuàng)新點(diǎn)、技術(shù)關(guān)鍵和主要技術(shù)指標(biāo)
- 作品設(shè)計(jì): 該機(jī)器人可以使用圖像識別、語音識別以及語音功能處理基本的行走任務(wù)。 基于計(jì)算機(jī)視覺和聽覺認(rèn)知計(jì)算,設(shè)計(jì)一款具有通過語音和視覺圖像識別指令兩個渠道來指揮機(jī)器人行為。雖然它的外形像一個簡單的小車,但是它具備機(jī)器人的幾個條件。 在本機(jī)器人系統(tǒng)內(nèi)有一個強(qiáng)大的圖像和語音處理系統(tǒng),可以幫助它分析圖像,分析語音信號,發(fā)出行動指令。比如,用戶發(fā)出語音指令,需要機(jī)器人去掃垃圾,機(jī)器人接到指令后,開始安排路線,機(jī)器人按照路線行動,但是它必須要認(rèn)識路線上的標(biāo)志,知道該在哪里轉(zhuǎn)彎,然后找到用戶需要的品牌。如果它沒有閱讀能力,要完成這些任務(wù)是不可能的。當(dāng)然,機(jī)器人除了需要閱讀能力外,一些基本的戶外活動能力也是必需的,比如它需要知道走人行道,需要識別障礙物,不至于被障礙物絆倒,也不會和其他行人相撞。它還要學(xué)會識別紅綠燈,知道綠燈行、紅燈停。即使在綠燈的時候,它還要學(xué)會避讓快速穿過的警車、救護(hù)車和消防車。 基本思路: 1、利用攝像頭實(shí)時采集的圖像信息,通過圖像處理和模式識別算法,來識別漢字,障礙物,從而指導(dǎo)其前行。 2、通過采集到的語音指令來控制其行動。 3.能夠根據(jù)語音或文字識別,來控制機(jī)器人的行走動作,如前進(jìn)、后退、左轉(zhuǎn)、右轉(zhuǎn),唱歌等。 創(chuàng)新點(diǎn): 設(shè)計(jì)的機(jī)器人可以使用圖像識別、語音識別以及語音功能處理基本的行走任務(wù)。 技術(shù)關(guān)鍵:語音識別,漢字識別,漢字發(fā)音。 主要技術(shù)指標(biāo):智能避障、語音交互、字符識別。
科學(xué)性、先進(jìn)性
- 本作品試圖制具備閱讀能力的人工智能機(jī)器人,使機(jī)器人掌握閱讀能力,讓它們能夠看懂交通標(biāo)志和地名,從而可以自己獨(dú)立駕駛,獨(dú)立“生活”。本機(jī)器人能會話,能閱讀,能唱歌,能聽懂人的意思,是人類的好幫手。
獲獎情況及鑒定結(jié)果
- 無
作品所處階段
- 試驗(yàn)中
技術(shù)轉(zhuǎn)讓方式
- 無
作品可展示的形式
- 錄像,實(shí)物
使用說明,技術(shù)特點(diǎn)和優(yōu)勢,適應(yīng)范圍,推廣前景的技術(shù)性說明,市場分析,經(jīng)濟(jì)效益預(yù)測
- 該作品使用簡單,操作方便,打開主程序之后,可以選擇兩套控制方法,一種是語音指令控制,一種是圖像識別控制。能夠很好的控制車輛的行駛,應(yīng)用前景十分廣闊如:無人生產(chǎn)線,自動巡邏,井下探測等等
同類課題研究水平概述
- 閱讀能力和聽覺能力很重要 對于人類來說,會識字就基本上算是會閱讀了,因?yàn)槿祟悓ψx出聲來的本國文字,很容易明白文字所蘊(yùn)含的含義。比如,當(dāng)我們念出“前進(jìn)”兩個字的時候,就知道繼續(xù)走。然而,對于機(jī)器來說,識字是很難的事情。 會認(rèn)字只是閱讀能力的第一步,更重要的是要理解所看到的字詞的具體含義。但是,這對人類很簡單的事情對機(jī)器人來說就很更難了。當(dāng)機(jī)器人看到“后退”二字時,它可以輕易地讀出來,但是要讓它理解“銀行”的真正含義,并把所需完成的任務(wù)結(jié)合起來,則是一件難事。如果機(jī)器人能夠正確地理解所看到的事物和標(biāo)志,它就能夠不需用戶的幫助自由地活動了。 機(jī)器人如何進(jìn)行閱讀呢?其原理和人們進(jìn)行閱讀一樣。當(dāng)我們在街上看到某個標(biāo)牌時,這個標(biāo)牌在我們視網(wǎng)膜上會形成一個影像,然后通過視神經(jīng)傳遞到大腦,我們掌管閱讀的神經(jīng)區(qū)域就能夠認(rèn)識它,并分析它的意義。對于機(jī)器人來說,這個過程會稍微復(fù)雜一些。它首先會把看到的標(biāo)牌拍成照片輸送到電腦中,電腦中的光學(xué)文字識別系統(tǒng)(OCR)需要先把圖像中的文字識別出來,并轉(zhuǎn)化為文本,然后再分析這些文本的含義。 機(jī)器人體內(nèi)的光學(xué)文字識別系統(tǒng)有時也會出錯,隨著識別系統(tǒng)的不斷完善,機(jī)器人麻煩用戶的次數(shù)會越來越少。 牛津大學(xué)機(jī)器人專家伊格瑪?珀斯納博士表示,研制出具備閱讀能力的機(jī)器人將是一項(xiàng)巨大進(jìn)步。他在接受《新科學(xué)家》雜志采訪時說:“有時候,你可以根據(jù)一個封閉房間上的標(biāo)簽準(zhǔn)確判斷可能在這個房間內(nèi)找到什么。閱讀能力能夠幫助你探測無法直接看到的東西?!遍喿x機(jī)器人將來的一個重要用途是幫助人們完成購物和送快遞等跑腿的工作,它要比人的信任度高得多,至少它不會偷看你的郵件,或是吞沒你的貴重物品。還有一個重要的用途是搶險救災(zāi),如果沒有閱讀能力,它在火災(zāi)中不知道該進(jìn)入哪個樓層哪個房間。比如,消防人員發(fā)現(xiàn)8樓302房間有人被困,不會閱讀的機(jī)器人就很難理解被困人究竟在哪里,而閱讀機(jī)器人則可以順利地找到房間。相信隨著閱讀機(jī)器人的不斷進(jìn)化,未來的機(jī)器人將成為我們生活中的好幫手。 然而,機(jī)器人在閱讀方面卻面臨很大難度,很難判斷看到的是什么,此外,它們?nèi)詿o法閱讀書寫在曲面上的文字。圖像識別方面,關(guān)鍵問題是對于漢字、字母的識別,當(dāng)前大多數(shù)關(guān)于車輛中的識別只是僅僅對于簡單路標(biāo)符號的識別,漢字與字母等字符的識別難度較大。