国产性70yerg老太,狠狠的日,欧美人与动牲交a免费,中文字幕成人网站

基本信息

項目名稱:
基于身份驗證的聲音識別系統(tǒng)的開發(fā)
小類:
信息技術
簡介:
本作品旨在通過預先輸入聲音文本,經(jīng)過聲音預處理系統(tǒng)后再通過特征信號提取系統(tǒng),提取出能表征說話人身份的特征參數(shù),再利用提取出的特征序列根據(jù)一定的數(shù)學算法為說話人建立聲音庫。當說話人再次錄入聲音時,系統(tǒng)會自動進行數(shù)據(jù)庫檢索,根據(jù)匹配結果識別判斷該說話人。特征提取方面,我們采用動態(tài)MFCC和靜態(tài)MFCC相結合的方法;模板匹配方面,主要采用基于經(jīng)典的BP算法的神經(jīng)網(wǎng)絡識別模型,并在算法方面探索改進和優(yōu)化。
詳細介紹:
本作品旨在通過預先輸入聲音文本,經(jīng)過聲音預處理系統(tǒng)(濾除雜、噪音)后再通過特征信號提取系統(tǒng),提取出能表征說話人身份特征的特征參數(shù),再利用提取出的特征序列根據(jù)一定的數(shù)學算法為說話人建立聲音庫。當說話人再次錄入聲音時,系統(tǒng)會自動進行數(shù)據(jù)庫檢索,根據(jù)匹配結果識別判斷該說話人身份。 本作品主要由聲音預處理部分、特征提取部分、模式匹配部分組成。聲音預處理的目標是將原始語音信號經(jīng)過一些特定的處理手段,如采樣量化、預加重處理、取音框、加框再通過低通濾波器,處理成為利于系統(tǒng)識別的可處理信號;特征提取方面,由于單一的特征參數(shù)無法很好的表達說話人的信息,我們采用動態(tài)MFCC( Mel頻率倒譜系數(shù))和靜態(tài)MFCC相結合的方法,以在識別率上達到突破。模板匹配方面,我們主要采用基于經(jīng)典的BP算法的神經(jīng)網(wǎng)絡識別模型,并在算法方面探索改進和優(yōu)化,以期達到很好的匹配效果。 我們旨在通過編程操作,最終實現(xiàn)我們的聲音識別系統(tǒng),達到預期的效果指標。

作品專業(yè)信息

設計、發(fā)明的目的和基本思路、創(chuàng)新點、技術關鍵和主要技術指標

目的:普遍意義上聲音識別的概念是指說話人識別。說話人識別包括說話人辨認和說話人確認兩個方面。說話人辨認是一對多的分析過程,即判斷出某段語音是若干人中哪一個所說,主要應用于刑偵破案、罪犯跟蹤、國防監(jiān)聽等。說話人確認是一對一的確定過程,即確認某段語音是否屬于指定的某人,主要應用于證券交易、銀行交易、個人計算機聲控鎖、身份證、信用卡等?;诼曇糇R別系統(tǒng)更廣泛快速的應用于日常生活中的身份驗證,并且對于推廣生物特征識別技術具有重要的意義。因此,我們的研究范圍確定為以說話人確認為目的的文本相關型的聲音識別系統(tǒng),主要目的就是提出和設計開發(fā)能夠快速準確識別不同個體的可行方案。 基本思路:聲音識別技術屬于生物特征識別技術,是一種根據(jù)語音波形所反映的說話人生理和行為特征的語音參數(shù)技術?;驹砭褪翘卣魈崛『湍J狡ヅ?。識別的核心是預先錄入聲音樣本,并提取每個樣本獨一無二的特征,建立特征數(shù)據(jù)庫,使用時將待檢聲音與數(shù)據(jù)庫中的特征進行匹配,通過分析計算,實現(xiàn)說話人識別。聲音識別技術的關鍵在于對各種聲學特征參數(shù)進行處理,并確定模式匹配方法。 創(chuàng)新點:聲紋識別主要有兩大技術關鍵:特征提取和模式匹配,我們的創(chuàng)新點便在這兩個方面。首先,在特征提取方面,由于單一的特征參數(shù)無法很好地表達出說話人的信息,我們采用動態(tài)MFCC和靜態(tài)MFCC相結合的方法,以在識別率上達到突破。其次,我們把基于經(jīng)典BP算法的識別率相對比較高的人工神經(jīng)網(wǎng)絡應用在模板匹配方面,并在算法方面探索改進和優(yōu)化,以期達到很好的匹配效果。

科學性、先進性

我們在分析了各種方法的利弊后,決定采用能夠反映人對語音的感知特性的 Mel頻率倒譜系數(shù)作為特征參數(shù),主要利用靜態(tài)MFCC和動態(tài)MFCC相結合,以期達到最佳的提取效果。標準的 MFCC只反映了語音參數(shù)的靜態(tài)特性 ,而人耳對語音的動態(tài)特征更為敏感 ,一階差分 MFCC是一種動態(tài)參數(shù) ,有較好的噪聲魯棒性。因為它提取在一定程度上模擬了人耳對語音處理的特點 ,而且還具有一定的抗噪性 ,進一步地挖掘出說話人語音背后的隱性個性差異 ,識別性能優(yōu)于LPCC等其他方法。 人工神經(jīng)網(wǎng)絡是一種廣泛應用于數(shù)據(jù)分類與預測問題中的一種非線性模型,我們采用它為聲紋識別模型。BP算法是一種按誤差逆?zhèn)鞑ニ惴ㄓ柧毜亩鄬忧梆伨W(wǎng)絡,是目前應用最廣泛的神經(jīng)網(wǎng)絡之一。BP網(wǎng)絡能學習和存貯大量的輸入-輸出模式映射關系,而無需事前揭示描述這種映射關系的數(shù)學方程。它的學習規(guī)則是使用最速下降法,通過反向傳播來不斷調(diào)整網(wǎng)絡的權值和閾值,使網(wǎng)絡的誤差平方和最小?;谝陨戏治觯覀儧Q定采用經(jīng)典的BP網(wǎng)絡,以期達到最佳的匹配效果。

獲獎情況及鑒定結果

該作品獲得2010年度鄭州大學創(chuàng)新實驗項目資助

作品所處階段

實驗室階段

技術轉(zhuǎn)讓方式

作品可展示的形式

模型、現(xiàn)場演示

使用說明,技術特點和優(yōu)勢,適應范圍,推廣前景的技術性說明,市場分析,經(jīng)濟效益預測

與其他生物識別技術,諸如指紋識別、掌形識別、虹膜識別等相比較,聲紋識別具有不會遺失和忘記、不需記憶、使用方便準確、經(jīng)濟及可擴展性良好等眾多優(yōu)勢,可廣泛應用于安全驗證、控制等各方面,特別是基于電信網(wǎng)絡的身份識別。 它有著廣闊的市場應用前景,通過SR技術,可以利用本身的生物特性進行身份鑒別,例如為公安部門進行語音驗證、為一般用戶提供防盜門開啟功能等等。 比爾·蓋茨認為:“以人類生物特征(指紋、語音、臉像等)進行身份驗證的生物識別技術,在今后數(shù)年內(nèi)將成為IT產(chǎn)業(yè)最為重要的技術革命?!痹谑澜绶秶鷥?nèi),聲紋識別技術正廣泛應用于諸多領域。截止到去年初,聲紋識別產(chǎn)品的市場占有率為17.8%,僅次于指紋識別和掌形識別。目前,我國市場尚屬啟動階段,其發(fā)展空間更為廣闊,在金融、證券、社保、公安、軍隊及其他民用安全認證等行業(yè)和部門有著廣泛的需求。 該作品以期能在校園內(nèi)部實現(xiàn)預期的效果,并能在師生中廣泛推廣和應用。

同類課題研究水平概述

19世紀60年代,美國的聯(lián)邦調(diào)查局在貝爾實驗室的幫助下,把聲音進行分類。貝爾實驗室的工程師勞倫斯·科斯塔逐漸相信聲音圖譜或聲紋(他命名的)能夠提供一種有效的個人識別方法,最早提出了“聲紋(voicePrint)的概念并提出了基于模式匹配和概率統(tǒng)計方差分析的聲紋識別方法,從而形成了聲紋識別研究的一個高潮,其間的工作主要集中在各種識別參數(shù)的提取、選擇和實驗上,并將倒頻譜和線性預測分析等方法應用于聲紋識別。70年代末至今,聲紋識別的研究重點轉(zhuǎn)向?qū)Ω鞣N聲學參數(shù)的線性或非線性處理以及新的模式匹配方法上。近幾年,聲紋識別技術己逐漸走出實驗室,在個人身份識別、刑事偵破中得到應用。 在國外,AT&T研制的基于聲紋識別技術的智慧卡(smartcard)己應用于自動提款機。歐洲電信聯(lián)盟于1998年完成了CAVE計劃,并于同年又啟動了PICASSO計劃,在電信網(wǎng)上完成了聲紋識別;同時,Motorola和Visa等公司成立了V一commerce聯(lián)盟,希望實現(xiàn)電子交易的自助化,其中通過聲音確定人的身份是此項目的重要組成部分。 國內(nèi)聲紋識別技術則主要應用于司法鑒定,例如上海思壯信息技術有限公司的Vls聲紋分析鑒定系統(tǒng);還有IP呼叫系統(tǒng),比如南京北極星軟件公司的FinesuPP0rt系統(tǒng)中就用到了聲紋技術。 目前聲紋識別技術的識別率,T-NETIX公司的SPeakEZ達到94%一95%,日本巖井公司在此基礎上研制的同類產(chǎn)品據(jù)稱其識別率已達到99.8%。根據(jù)最近的報道,國內(nèi)的北京得意音通技術有限責任公司開發(fā)的“得意”身份證開發(fā)工具據(jù)其自稱辨認和確認準確度都可以到達接近100%。
建議反饋 返回頂部