基本信息
- 項目名稱:
- 視聽覺智能機器人
- 小類:
- 信息技術(shù)
- 大類:
- 科技發(fā)明制作B類
- 簡介:
- 本作品試圖制具備閱讀能力的人工智能機器人,使機器人掌握閱讀能力,讓它們能夠看懂交通標志和地名,從而可以自己獨立駕駛,獨立“生活”。本機器人能會話,能閱讀,能唱歌,能聽懂人的意思,是人類的好幫手。
- 詳細介紹:
- 本作品試圖制具備閱讀能力的人工智能機器人,使機器人掌握閱讀能力,讓它們能夠看懂交通標志和地名,從而可以自己獨立駕駛,獨立“生活”。本機器人能會話,能閱讀,能唱歌,能聽懂人的意思,是人類的好幫手。
作品專業(yè)信息
設(shè)計、發(fā)明的目的和基本思路、創(chuàng)新點、技術(shù)關(guān)鍵和主要技術(shù)指標
- 作品設(shè)計: 該機器人可以使用圖像識別、語音識別以及語音功能處理基本的行走任務(wù)。 基于計算機視覺和聽覺認知計算,設(shè)計一款具有通過語音和視覺圖像識別指令兩個渠道來指揮機器人行為。雖然它的外形像一個簡單的小車,但是它具備機器人的幾個條件。 在本機器人系統(tǒng)內(nèi)有一個強大的圖像和語音處理系統(tǒng),可以幫助它分析圖像,分析語音信號,發(fā)出行動指令。比如,用戶發(fā)出語音指令,需要機器人去掃垃圾,機器人接到指令后,開始安排路線,機器人按照路線行動,但是它必須要認識路線上的標志,知道該在哪里轉(zhuǎn)彎,然后找到用戶需要的品牌。如果它沒有閱讀能力,要完成這些任務(wù)是不可能的。當然,機器人除了需要閱讀能力外,一些基本的戶外活動能力也是必需的,比如它需要知道走人行道,需要識別障礙物,不至于被障礙物絆倒,也不會和其他行人相撞。它還要學會識別紅綠燈,知道綠燈行、紅燈停。即使在綠燈的時候,它還要學會避讓快速穿過的警車、救護車和消防車。 基本思路: 1、利用攝像頭實時采集的圖像信息,通過圖像處理和模式識別算法,來識別漢字,障礙物,從而指導其前行。 2、通過采集到的語音指令來控制其行動。 3.能夠根據(jù)語音或文字識別,來控制機器人的行走動作,如前進、后退、左轉(zhuǎn)、右轉(zhuǎn),唱歌等。 創(chuàng)新點: 設(shè)計的機器人可以使用圖像識別、語音識別以及語音功能處理基本的行走任務(wù)。 技術(shù)關(guān)鍵:語音識別,漢字識別,漢字發(fā)音。 主要技術(shù)指標:智能避障、語音交互、字符識別。
科學性、先進性
- 本作品試圖制具備閱讀能力的人工智能機器人,使機器人掌握閱讀能力,讓它們能夠看懂交通標志和地名,從而可以自己獨立駕駛,獨立“生活”。本機器人能會話,能閱讀,能唱歌,能聽懂人的意思,是人類的好幫手。
獲獎情況及鑒定結(jié)果
- 無
作品所處階段
- 試驗中
技術(shù)轉(zhuǎn)讓方式
- 無
作品可展示的形式
- 錄像,實物
使用說明,技術(shù)特點和優(yōu)勢,適應(yīng)范圍,推廣前景的技術(shù)性說明,市場分析,經(jīng)濟效益預測
- 該作品使用簡單,操作方便,打開主程序之后,可以選擇兩套控制方法,一種是語音指令控制,一種是圖像識別控制。能夠很好的控制車輛的行駛,應(yīng)用前景十分廣闊如:無人生產(chǎn)線,自動巡邏,井下探測等等
同類課題研究水平概述
- 閱讀能力和聽覺能力很重要 對于人類來說,會識字就基本上算是會閱讀了,因為人類對讀出聲來的本國文字,很容易明白文字所蘊含的含義。比如,當我們念出“前進”兩個字的時候,就知道繼續(xù)走。然而,對于機器來說,識字是很難的事情。 會認字只是閱讀能力的第一步,更重要的是要理解所看到的字詞的具體含義。但是,這對人類很簡單的事情對機器人來說就很更難了。當機器人看到“后退”二字時,它可以輕易地讀出來,但是要讓它理解“銀行”的真正含義,并把所需完成的任務(wù)結(jié)合起來,則是一件難事。如果機器人能夠正確地理解所看到的事物和標志,它就能夠不需用戶的幫助自由地活動了。 機器人如何進行閱讀呢?其原理和人們進行閱讀一樣。當我們在街上看到某個標牌時,這個標牌在我們視網(wǎng)膜上會形成一個影像,然后通過視神經(jīng)傳遞到大腦,我們掌管閱讀的神經(jīng)區(qū)域就能夠認識它,并分析它的意義。對于機器人來說,這個過程會稍微復雜一些。它首先會把看到的標牌拍成照片輸送到電腦中,電腦中的光學文字識別系統(tǒng)(OCR)需要先把圖像中的文字識別出來,并轉(zhuǎn)化為文本,然后再分析這些文本的含義。 機器人體內(nèi)的光學文字識別系統(tǒng)有時也會出錯,隨著識別系統(tǒng)的不斷完善,機器人麻煩用戶的次數(shù)會越來越少。 牛津大學機器人專家伊格瑪?珀斯納博士表示,研制出具備閱讀能力的機器人將是一項巨大進步。他在接受《新科學家》雜志采訪時說:“有時候,你可以根據(jù)一個封閉房間上的標簽準確判斷可能在這個房間內(nèi)找到什么。閱讀能力能夠幫助你探測無法直接看到的東西?!遍喿x機器人將來的一個重要用途是幫助人們完成購物和送快遞等跑腿的工作,它要比人的信任度高得多,至少它不會偷看你的郵件,或是吞沒你的貴重物品。還有一個重要的用途是搶險救災,如果沒有閱讀能力,它在火災中不知道該進入哪個樓層哪個房間。比如,消防人員發(fā)現(xiàn)8樓302房間有人被困,不會閱讀的機器人就很難理解被困人究竟在哪里,而閱讀機器人則可以順利地找到房間。相信隨著閱讀機器人的不斷進化,未來的機器人將成為我們生活中的好幫手。 然而,機器人在閱讀方面卻面臨很大難度,很難判斷看到的是什么,此外,它們?nèi)詿o法閱讀書寫在曲面上的文字。圖像識別方面,關(guān)鍵問題是對于漢字、字母的識別,當前大多數(shù)關(guān)于車輛中的識別只是僅僅對于簡單路標符號的識別,漢字與字母等字符的識別難度較大。