基本信息
- 項(xiàng)目名稱:
- --語(yǔ)音幽靈
- 來(lái)源:
- 第十二屆“挑戰(zhàn)杯”省賽作品
- 小類:
- 信息技術(shù)
- 大類:
- 科技發(fā)明制作B類
- 簡(jiǎn)介:
- 本項(xiàng)目的目的在于開(kāi)發(fā)出一個(gè)適合于嵌入式平臺(tái)使用的語(yǔ)音合成服務(wù)器,為嵌入式平臺(tái)上需要將文本轉(zhuǎn)換為語(yǔ)音的應(yīng)用提供服務(wù)。該語(yǔ)音合成服務(wù)器轉(zhuǎn)換速度快,支持普通話、粵語(yǔ)和英語(yǔ)三種語(yǔ)言。同時(shí)還開(kāi)發(fā)了一個(gè)有聲閱讀器的客戶端作為演示,其利用語(yǔ)音合成服務(wù)器提供的服務(wù),能將指定的文本“讀”出來(lái)。
- 詳細(xì)介紹:
- 在當(dāng)前數(shù)字信息技術(shù)和網(wǎng)絡(luò)技術(shù)高速發(fā)展的后PC(Post-PC)時(shí)代,嵌入式系統(tǒng)已經(jīng)廣泛地滲透到科學(xué)研究、工程設(shè)計(jì)、軍事技術(shù)、各類產(chǎn)業(yè)和商業(yè)文化藝術(shù)以及人們的日常生活等方方面面中。隨著國(guó)內(nèi)外各種嵌入式產(chǎn)品的進(jìn)一步開(kāi)發(fā)和推廣,嵌入式技術(shù)越來(lái)越和人們的生活緊密結(jié)合。Linux從1991年問(wèn)世到現(xiàn)在,短短的十幾年時(shí)間已經(jīng)發(fā)展成為功能強(qiáng)大、設(shè)計(jì)完善的操作系統(tǒng)之一;越來(lái)越多的企業(yè)和研發(fā)機(jī)構(gòu)都轉(zhuǎn)向嵌入式Linux的開(kāi)發(fā)和研究上,在新興的嵌入式操作系統(tǒng)領(lǐng)域內(nèi)也獲得了飛速發(fā)展。 在嵌入式設(shè)備,如在電子書(shū)、手機(jī)、智能玩具、信息家電和車載GPS上,語(yǔ)音合成技術(shù)有著越來(lái)越廣泛的應(yīng)用。采用全球衛(wèi)星定位系統(tǒng)(GPS)來(lái)提供道路狀況和定位信息是運(yùn)輸交通行業(yè)的一大趨勢(shì),幾乎已成為未來(lái)車輛的必備設(shè)備。在車載GPS上加入語(yǔ)音技術(shù),可使得駕駛員在眼與手忙的情況下,通過(guò)語(yǔ)音實(shí)時(shí)接受動(dòng)態(tài)路況信息及通知、公告,及時(shí)獲取感興趣的車主個(gè)性化定制的信息,將平面顯示導(dǎo)航上升到立體語(yǔ)音導(dǎo)航。在消費(fèi)類產(chǎn)品中結(jié)合電子書(shū),使電子書(shū)不僅可以看,還可以聽(tīng)! 隨著移動(dòng)通信的發(fā)展,手機(jī)日益普及,需求量成倍增長(zhǎng)。手機(jī)作為移動(dòng)通信終端正朝著小型化、多功能化、個(gè)性化方向發(fā)展。帶有語(yǔ)音合成功能的手機(jī),可以用語(yǔ)音播報(bào)來(lái)電號(hào)碼,概述電子郵件內(nèi)容,給予日程提醒,收聽(tīng)網(wǎng)絡(luò)信息等。嵌入式語(yǔ)音技術(shù)還能在智能語(yǔ)音玩具、測(cè)量?jī)x器等眾多領(lǐng)域得到廣泛應(yīng)用。從發(fā)展趨勢(shì)來(lái)看,語(yǔ)音技術(shù)在嵌入式設(shè)備上的全面運(yùn)用已成為不可扭轉(zhuǎn)的趨勢(shì)。
作品專業(yè)信息
設(shè)計(jì)、發(fā)明的目的和基本思路、創(chuàng)新點(diǎn)、技術(shù)關(guān)鍵和主要技術(shù)指標(biāo)
- 在嵌入式設(shè)備,如在電子書(shū)、手機(jī)、智能玩具、信息家電和車載GPS上,語(yǔ)音合成技術(shù)有著越來(lái)越廣泛的應(yīng)用。采用全球衛(wèi)星定位系統(tǒng)(GPS)來(lái)提供道路狀況和定位信息是運(yùn)輸交通行業(yè)的一大趨勢(shì),幾乎已成為未來(lái)車輛的必備設(shè)備。在車載GPS上加入語(yǔ)音技術(shù),可使得駕駛員在眼與手忙的情況下,通過(guò)語(yǔ)音實(shí)時(shí)接受動(dòng)態(tài)路況信息及通知、公告,及時(shí)獲取感興趣的車主個(gè)性化定制的信息,將平面顯示導(dǎo)航上升到立體語(yǔ)音導(dǎo)航。在消費(fèi)類產(chǎn)品中結(jié)合電子書(shū),使電子書(shū)不僅可以看,還可以聽(tīng)! 隨著移動(dòng)通信的發(fā)展,手機(jī)日益普及,需求量成倍增長(zhǎng)。手機(jī)作為移動(dòng)通信終端正朝著小型化、多功能化、個(gè)性化方向發(fā)展。帶有語(yǔ)音合成功能的手機(jī),可以用語(yǔ)音播報(bào)來(lái)電號(hào)碼,概述電子郵件內(nèi)容,給予日程提醒,收聽(tīng)網(wǎng)絡(luò)信息等。嵌入式語(yǔ)音技術(shù)還能在智能語(yǔ)音玩具、測(cè)量?jī)x器等眾多領(lǐng)域得到廣泛應(yīng)用。從發(fā)展趨勢(shì)來(lái)看,語(yǔ)音技術(shù)在嵌入式設(shè)備上的全面運(yùn)用已成為不可扭轉(zhuǎn)的趨勢(shì)。 語(yǔ)音合成,又稱文語(yǔ)轉(zhuǎn)換(Text to Speech)技術(shù),能將任意文字信息實(shí)時(shí)轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語(yǔ)音朗讀出來(lái),相當(dāng)于給機(jī)器裝上了人工嘴巴。它涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科技術(shù),是中文信息處理領(lǐng)域的一項(xiàng)前沿技術(shù),解決的主要問(wèn)題就是如何將文字信息轉(zhuǎn)化為可聽(tīng)的聲音信息,也即讓機(jī)器像人一樣開(kāi)口說(shuō)話。 利用語(yǔ)音合成技術(shù)還能增加產(chǎn)品使用的趣味性并降低使用門檻。例如:語(yǔ)音日程提醒、時(shí)間播報(bào)等更人性化的語(yǔ)音秘書(shū)功能,語(yǔ)音聽(tīng)網(wǎng)、聽(tīng)書(shū),朗讀各種來(lái)源的新聞及小說(shuō),對(duì)各種編輯軟件實(shí)現(xiàn)有聲語(yǔ)音校對(duì)等。
科學(xué)性、先進(jìn)性
- 中文語(yǔ)音處理和語(yǔ)音合成,利用中文韻律等相關(guān)知識(shí)對(duì)中文語(yǔ)句進(jìn)行分詞、詞性判斷、注音、數(shù)字符號(hào)轉(zhuǎn)換,語(yǔ)音合成通過(guò)查詢中文語(yǔ)音庫(kù)得到語(yǔ)音。我們將輸入的文本采用恰當(dāng)?shù)募夹g(shù)手段分解成若干的字或詞組,以此作為基本的拼接單位,將其對(duì)應(yīng)的語(yǔ)音進(jìn)行拼接,從而形成語(yǔ)音輸出。這種方法的計(jì)算量小、計(jì)算速度快,而且合成語(yǔ)音自然度較高,顯然比較適合于芯片性能較弱的嵌入式系統(tǒng)方面的應(yīng)用。 本作品具有如下特性: ? 支持文本、txt文件、html文件和pdf文件的語(yǔ)音合成 ? 提供普通話、粵語(yǔ)和英語(yǔ)三種語(yǔ)言的語(yǔ)音合成??蛻舳丝梢栽谡?qǐng)求包中指定語(yǔ)言。 ? 語(yǔ)音合成服務(wù)器能為嵌入式平臺(tái)上的所有應(yīng)用提供語(yǔ)音合成服務(wù),應(yīng)用程序只需和服務(wù)器建立連接,并按指定的數(shù)據(jù)包格式發(fā)送請(qǐng)求,就能獲得相應(yīng)的語(yǔ)音數(shù)據(jù)。 ? 語(yǔ)音合成速度快,占用系統(tǒng)資源少。
獲獎(jiǎng)情況及鑒定結(jié)果
- 2010年在廣東技術(shù)師范學(xué)院校團(tuán)委組織的“軟件設(shè)計(jì)大賽”中獲得一等獎(jiǎng)
作品所處階段
- 中試階段
技術(shù)轉(zhuǎn)讓方式
- 暫無(wú)
作品可展示的形式
- 現(xiàn)場(chǎng)演示
使用說(shuō)明,技術(shù)特點(diǎn)和優(yōu)勢(shì),適應(yīng)范圍,推廣前景的技術(shù)性說(shuō)明,市場(chǎng)分析,經(jīng)濟(jì)效益預(yù)測(cè)
- ? 帶有語(yǔ)音合成功能的手機(jī),可以用語(yǔ)音播報(bào)來(lái)電號(hào)碼,概述電子郵件內(nèi)容,給予日程提醒,收聽(tīng)網(wǎng)絡(luò)信息等。 ? 在車載GPS上加入語(yǔ)音技術(shù),可使得駕駛員在眼與手忙的情況下,通過(guò)語(yǔ)音實(shí)時(shí)接受動(dòng)態(tài)路況信息及通知、公告,及時(shí)獲取感興趣的車主個(gè)性化定制的信息,將平面顯示導(dǎo)航上升到立體語(yǔ)音導(dǎo)航。 ? 通過(guò)電子圖書(shū)、”會(huì)說(shuō)話的書(shū)”, 利用"聽(tīng)書(shū)"的方式輕松地度過(guò)那漫長(zhǎng)的旅途或者上下班時(shí)間。在閑暇時(shí)刻閉上眼睛悠然的收聽(tīng)喜愛(ài)的文章,給自己一個(gè)放松的機(jī)會(huì); ? 嵌入式語(yǔ)音技術(shù)還能在智能語(yǔ)音玩具、測(cè)量?jī)x器等眾多領(lǐng)域得到廣泛應(yīng)用。
同類課題研究水平概述
- TTS作為一種誘人的新技術(shù),如果能很好的嵌入到增值業(yè)務(wù)的應(yīng)用中去,必將形成一個(gè)更好的應(yīng)用前景。 目前中文TTS系統(tǒng),比較著名的有:IBM,Microsoft,F(xiàn)ujitsu,科大訊飛,捷通華聲等研究的系統(tǒng)。目前比較關(guān)鍵的就是中文韻律處理、符號(hào)數(shù)字、多音字、構(gòu)詞方面有較多的問(wèn)題,需要不斷研究,使得中文語(yǔ)音合成的自然化程度較高。 杭州音通軟件有限公司是由國(guó)家教育部和浙江省人民政府聯(lián)辦并依托浙江大學(xué)而成立的高新技術(shù)公司,音通公司主要致力于計(jì)算機(jī)語(yǔ)音技術(shù)的研發(fā)并逐步開(kāi)拓語(yǔ)音識(shí)別、語(yǔ)音流媒體傳輸?shù)绕渌Z(yǔ)音領(lǐng)域的研究。其核心技術(shù)(Intone_TTS)是具有自主知識(shí)產(chǎn)權(quán)的中文語(yǔ)音合成技術(shù),在由浙江省科技廳組織的鑒定中被專家一致鑒定為國(guó)內(nèi)領(lǐng)先地位,并已申請(qǐng)多項(xiàng)國(guó)家專利。 Intone_TTS是一套把文本信息轉(zhuǎn)換為語(yǔ)音信息的開(kāi)發(fā)工具包,為系統(tǒng)集成商、軟件開(kāi)發(fā)商提供了完備的接口函數(shù)和編程示例,使用戶能夠靈活的進(jìn)行調(diào)用,并集成到其它應(yīng)用系統(tǒng)中。接口需要語(yǔ)音合成運(yùn)行庫(kù)的支