基本信息
- 項(xiàng)目名稱:
- 手持式助談器“易談”
- 小類:
- 信息技術(shù)
- 大類:
- 科技發(fā)明制作B類
- 簡介:
- 手持式助談器“易談”是一種向聾啞朋友提供一定的“語言聽說能力”的手持式設(shè)備,它還具有一些實(shí)用工具、電子書、圖片顯示和GPS定位等實(shí)用和娛樂功能,為聾啞朋友提供其它的服務(wù)。是一個(gè)來源于生活的原創(chuàng)性作品。 作品的硬件、操作系統(tǒng)和應(yīng)用軟件都是自行研發(fā)的,具有完整的自主知識產(chǎn)權(quán)。生產(chǎn)成本將是最低的,易于產(chǎn)品化和市場推廣。
- 詳細(xì)介紹:
- 手持式助談器“易談”是一個(gè)原創(chuàng)性的作品,是用于向聾啞朋友提供一定的“語言聽說能力”的手持式設(shè)備,特別是那些僅為語言障礙的聽力正常者,使用起來就更為方便。同時(shí)該作品是按低成本原則設(shè)計(jì)的,所以有望獲得很多聾啞人的青睞,具有很好的市場前景。 易談是一個(gè)完整的多功能產(chǎn)品,功能是這樣設(shè)計(jì)的: ①.配置研發(fā)的漢語語音合成器,且具備漢字輸入能力,可以隨時(shí)輸入任意語句并合成語音后輸出,使聾啞人獲得一定的“說話能力”。為了提高對話速度,可預(yù)存大量的常用和自定義語句,需要時(shí)快速檢索使用。 ②.配置研發(fā)的基于語音處理器LD3320和基于MFCC及隱馬爾可夫模型的雙引擎的語音識別器,雙引擎可以并行工作,識別非特定隨機(jī)人員的語句,使聾啞人獲得一定的“語言聽力”。 ③.內(nèi)置GPS定位系統(tǒng),定位顯示當(dāng)前的位置。 ④.設(shè)有緊急按鍵,按下時(shí)可以大聲呼救。 ⑤.具有實(shí)用工具、電子書和圖片顯示等學(xué)習(xí)和娛樂功能。 ⑥.具有顯示屏幕大、觸摸操作方便、體積小和續(xù)航能力強(qiáng)的特點(diǎn)。 為了達(dá)到好用、低功耗和低成本的目的,易談采用自行開發(fā)的精簡型實(shí)時(shí)操作系統(tǒng),不使用Windows CE、Linux之類的操作系統(tǒng),大大降低了對硬件要求和軟件的開銷,降低了成本、提高了啟動速度和運(yùn)行效率。由于沒使用這些流行的操作系統(tǒng),許多原來可以由它們提供的表和庫都需要自行設(shè)計(jì)開發(fā),如拼音編碼表、筆順庫、詞組庫和語音庫等,使研究開發(fā)的難度和工作量大增。但好處也是非常明顯的,針對需求自行開發(fā)的表、庫和驅(qū)動軟件占用資源小,運(yùn)行效率高;更重要的是硬件、操作系統(tǒng)和應(yīng)用軟件都是自行研發(fā)的,具有完整的自主知識產(chǎn)權(quán),生產(chǎn)成本將是最低的,易于產(chǎn)品化和市場化。
作品專業(yè)信息
設(shè)計(jì)、發(fā)明的目的和基本思路、創(chuàng)新點(diǎn)、技術(shù)關(guān)鍵和主要技術(shù)指標(biāo)
- 手持式助談器“易談”是針對聾啞朋友設(shè)計(jì)的來源于生活的原創(chuàng)性作品,它可向聾啞朋友提供一定的“語言聽說能力”,還具有實(shí)用工具、電子書、圖片和GPS等實(shí)用和娛樂功能,為聾啞朋友提供其它服務(wù)。 易談的創(chuàng)新點(diǎn)和技術(shù)關(guān)鍵主要有四個(gè): ①.自行開發(fā)的高效低成本的漢語語音合成器,與觸摸屏漢字輸入和自定義語句相結(jié)合,用語音形式較快地輸出所需的語句。 ②.自行開發(fā)的基于語音處理器LD3320和基于MFCC及隱馬爾可夫模型的雙引擎語音識別器,不需學(xué)習(xí)就可識別大部分人員的語句??朔顺R姷氖殖质皆O(shè)備(如手機(jī)等)所具有的語言識別能力是針對特定人員、需先“學(xué)習(xí)”適應(yīng)使用者的語言特征后才能使用的缺點(diǎn)。 ③.與其它手持式設(shè)備相比,易談使用時(shí)對電源續(xù)航能力要求更高。因此對硬件、軟件和電源系統(tǒng)的設(shè)計(jì)構(gòu)成上都進(jìn)行充分的研究,使易談工作的連續(xù)續(xù)航能力達(dá)8小時(shí)以上,高于大多數(shù)其它手持式設(shè)備。 ④.易談的硬件、操作系統(tǒng)、應(yīng)用軟件和語音庫都是自行研發(fā)的,具有完整的自主知識產(chǎn)權(quán)。 易談的主要技術(shù)指標(biāo)為: ①.內(nèi)置語音合成器和語音識別器,支持一二級漢字庫(6763字); ②.3.5英寸彩色LCD,點(diǎn)陣為320×240,圖形和文字混合顯示; ③.采用觸摸屏輸入,輸入法為拼音和手寫,具有詞組聯(lián)想能力; ④.預(yù)置50句常用對話,用戶還可自行隨意修改編輯,供快速對話使用。 ⑤.一鍵報(bào)警功能,緊急時(shí)可發(fā)出大聲呼救,便于及時(shí)得到救助; ⑥.具有GPS定位、電子表計(jì)算器等實(shí)用工具、電子書圖片顯示等學(xué)習(xí)和娛樂功能。
科學(xué)性、先進(jìn)性
- ①.自行開發(fā)的高效低成本的漢語語音合成器和觸摸屏漢字輸入系統(tǒng),以語音形式快速輸出所需的語句。這二種技術(shù)并不特別,但二者結(jié)合并置入手持式設(shè)備,形成為聾啞朋友服務(wù)的產(chǎn)品,未見報(bào)道。 ②.自行開發(fā)的基于語音處理器LD3320和基于MFCC及隱馬爾可夫模型的雙引擎語音識別器,雙引擎可并行工作,并針對方言傾向設(shè)置了特征庫,不需學(xué)習(xí)就可識別非特定隨機(jī)人員的語句。常見的手持式設(shè)備的語言識別是針對個(gè)別特定人員的,需要訓(xùn)練學(xué)習(xí),適應(yīng)使用者語言特征后用才能使用,不適用于本設(shè)備。 手持式設(shè)備使用雙引擎語音識別技術(shù),未見報(bào)道。 ③.易談的工作特點(diǎn)使它對電源續(xù)航能力更高要求。對硬件結(jié)構(gòu)、軟件工作方式和電源系統(tǒng)設(shè)計(jì)構(gòu)成上都進(jìn)行充分的研究,使的連續(xù)續(xù)航能力達(dá)8小時(shí)以上,遠(yuǎn)高于大多數(shù)其它手持式設(shè)備。 ④.易談的硬件、操作系統(tǒng)、應(yīng)用軟件和語音庫都是自行研發(fā)的,有完整的自主知識產(chǎn)權(quán)。在樣機(jī)研發(fā)時(shí)明顯地增加了研發(fā)難度和延長了研發(fā)時(shí)間,但在形成產(chǎn)品時(shí)將大大降低生產(chǎn)成本和提高產(chǎn)品的升級換代能力,使產(chǎn)品具有更大的生命力。
獲獎(jiǎng)情況及鑒定結(jié)果
- 第二屆“挑戰(zhàn)杯”校級大學(xué)生課外學(xué)術(shù)科技作品競賽三等獎(jiǎng)。 第十屆“挑戰(zhàn)杯”省級大學(xué)生課外學(xué)術(shù)科技作品競賽二等獎(jiǎng)。
作品所處階段
- 樣機(jī)試驗(yàn)階段
技術(shù)轉(zhuǎn)讓方式
- 面議
作品可展示的形式
- 實(shí)物、圖紙、現(xiàn)場演示、圖片、樣品、視頻
使用說明,技術(shù)特點(diǎn)和優(yōu)勢,適應(yīng)范圍,推廣前景的技術(shù)性說明,市場分析,經(jīng)濟(jì)效益預(yù)測
- 手持式助談器“易談”是針對聾啞朋友設(shè)計(jì)的原創(chuàng)性作品,配置漢語語音合成器和語音識別器,可以隨時(shí)挑選或輸入任意語句并合成語音后輸出,也可以識別非特定隨機(jī)人員的語言短句,使聾啞人獲得一定的“語言聽說能力”。特別是那些僅為語言障礙的聽力正常者,使用起來就更為方便。同時(shí)“易談”還具有GPS定位、電子表計(jì)算器等實(shí)用工具、電子書圖片顯示等學(xué)習(xí)和娛樂功能,進(jìn)一步擴(kuò)展了它的使用價(jià)值。 易談是按低成本原則設(shè)計(jì)的,具有完整的自主知識產(chǎn)權(quán),樣機(jī)不含GPS的成本價(jià)格在200元以下。按電子行業(yè)的現(xiàn)狀,如能形成批量產(chǎn)品,成本價(jià)應(yīng)該不超過100元。根據(jù)易談的性能價(jià)格比,有望獲得很多聾啞人的青睞,具有很廣泛的市場前景和很好的經(jīng)濟(jì)效益。
同類課題研究水平概述
- 為了更好地進(jìn)行手持式助談器“易談”的研究和開發(fā),仔細(xì)查詢了國內(nèi)外研究現(xiàn)狀,根據(jù)獲得的信息介紹如下: ①.關(guān)于針對聾啞朋友設(shè)計(jì)的助說和助聽設(shè)備 目前在手持式設(shè)備中,一些產(chǎn)品具有文本朗讀能力或語音識別能力,但同時(shí)具有這二種能力的很少。具有和本作品功能類似,可以為聾啞朋友提供助說和助聽(不是放大聲音,為弱聽力者服務(wù)的那種助聽器)服務(wù)的產(chǎn)品目前未見報(bào)道。 ②.關(guān)于漢語語音合成器 漢語是我們的母語,所以中文的語音系統(tǒng)主要是由中國本土研制。漢語的語音合成技術(shù)大致經(jīng)歷了共振峰合成、LPC合成、應(yīng)用PSOLA技術(shù)、基于大語料庫波形拼接合成技術(shù)等過程。目前被應(yīng)用最多的就是基于大語料庫波形拼接合成技術(shù),但這種技術(shù)有個(gè)很大的問題,就是要有存放龐大的語音庫的大容量存儲器,運(yùn)行時(shí)也需要較大的RAM空間。國內(nèi)專做語音合成識別的安徽科大訊飛信息科技股份有限公司就是采用這種技術(shù),但主要適用于臺式計(jì)算機(jī)上運(yùn)行。最近該公司也推出了可用于手持式設(shè)備的輕量級語音合成軟件模塊,但需要有償購買使用。 微軟公司也開發(fā)了語音系統(tǒng)TTS,是基于Windows的語音輸出模塊,可以方便地嵌入各種基于Windows的應(yīng)用軟件。對于手持式設(shè)備,一般只能嵌入運(yùn)行在Windows CE上的應(yīng)用軟件,而Windows CE使用費(fèi)和對硬件要求都較高,極不利于成本的控制。 ③.關(guān)于語音識別器 一般手持式設(shè)備所具有的語言識別能力基本是針對個(gè)別特定人員的,并需要訓(xùn)練學(xué)習(xí)后才能使用,而易談需要識別任意隨機(jī)人員的語音,所以這一類的語言識別器并不適用于易談。因此自行開發(fā)了軟硬件結(jié)合、不需訓(xùn)練學(xué)習(xí)的雙引擎語音識別器。