国产性70yerg老太,狠狠的日,欧美人与动牲交a免费,中文字幕成人网站

基本信息

項目名稱:
基于分級BP神經(jīng)網(wǎng)絡的蛋白質二級結構預測
小類:
生命科學
簡介:
生物信息學是一門新興的交叉邊緣學科,已經(jīng)成為當今生命科學乃至整個自然科學的重大前沿領域之一。作為后基因組時代重要課題——蛋白質結構預測是生物信息學中的重要問題。蛋白質結構預測問題就是如何從蛋白質的氨基酸序列出發(fā)預測他的功能構象問題。預測蛋白質二級結構的算法大多以已知二級結構的蛋白質為依據(jù),用人工神經(jīng)網(wǎng)絡、遺傳算法等技術構建預測方法,本文采用分級BP神經(jīng)網(wǎng)絡預測蛋白質二級結構。
詳細介紹:
蛋白質二級結構的預測是生物信息學中一個重要的研究課題,進行二級結構預測對于理解蛋白質結構與功能的關系,以及分子設計、生物制藥等領域都發(fā)揮重要的現(xiàn)實意義。隨著人類基因組計劃的順利實施,已知氨基酸序列的蛋白質數(shù)量成級數(shù)增長。目前試驗手段主要依靠X射線晶體衍射與核磁共振方法測定蛋白質二級結構,但測定周期較長,導致已測定二級結構的蛋白質數(shù)量與已知氨基酸序列的蛋白質數(shù)量差距越來越大,要求有一種快速簡潔而適用性強的預測蛋白質二級結構的方法。而生物學界達成一致共識:蛋白質的氨基酸排列順序決定了它的空間結構,空間結構體現(xiàn)了蛋白質的生理功能。那么我們就可以從已知序列和結構的蛋白質出發(fā),挖掘出其中的關系,就可以預測出其他已知序列的蛋白質二級結構。如果能夠成將蛋白質二級結構預測精度提高到80%,就可以為生物學家了解蛋白質三級結構,設計新藥物提供數(shù)據(jù),免去實驗測定的麻煩,節(jié)省研究成本。 近年來,人們利用序列同源信息能夠預測精度提高到80%,但這種方法不僅工作量大,而且對于那些低同源和無同源蛋白質的預測非常困難,因此,神經(jīng)網(wǎng)絡方法被認為是目前最有前景的方法。該方法最先是在1988年由Qian和Sejnowski提出,隨即引起了一波又一波的神經(jīng)網(wǎng)絡預測高潮,各種神經(jīng)網(wǎng)絡模型不斷提出和改進,精度一次次被提高:zhu采用多模神經(jīng)網(wǎng)絡取得68%的精度,王艷春采用級聯(lián)神經(jīng)網(wǎng)絡取得69.61%的精度。 本課題在前人的基礎上,改進了BP神經(jīng)網(wǎng)絡算法,將預測精度提高到69.92%。其創(chuàng)新點在于:采用分級神經(jīng)網(wǎng)絡的思想,分為一二兩級各級有不同的目標和意義,所以每一級的網(wǎng)絡結構也有區(qū)別。一級網(wǎng)絡采用了profile編碼,攜帶有較大的進化信息,二級網(wǎng)絡采用改進的正交編碼,所謂改進的正交編碼,就是在常用的20位正交編碼后加一位表示成分信息,這樣使得編碼中含有了蛋白質序列的全局信息,這種創(chuàng)新改進對預測精度提高有一定幫助。同時使用兩種編碼是本文的大膽嘗試,取得了很好的效果。其二,考慮到本課題網(wǎng)絡訓練的數(shù)據(jù)比較大,利用多模神經(jīng)網(wǎng)絡將訓練集分開到每個子網(wǎng)絡,使得每個子網(wǎng)絡訓練數(shù)據(jù)都相對較小,分攤了整個網(wǎng)絡的負荷,最終收斂性更好收斂時間也更短。 蛋白質二級結構的預測目前是一個大有可為的研究領域,是數(shù)據(jù)挖掘技術在生物信息學中成功典型應用。為了能夠提高精度,為生物學家提供研究提供依據(jù),各種機器學習方法得以應用,以及傳統(tǒng)的統(tǒng)計方法也做了改進和創(chuàng)新。這些方法也可以結合起來,都是值得本文繼續(xù)研究的地方。

作品圖片

  • 基于分級BP神經(jīng)網(wǎng)絡的蛋白質二級結構預測
  • 基于分級BP神經(jīng)網(wǎng)絡的蛋白質二級結構預測
  • 基于分級BP神經(jīng)網(wǎng)絡的蛋白質二級結構預測
  • 基于分級BP神經(jīng)網(wǎng)絡的蛋白質二級結構預測
  • 基于分級BP神經(jīng)網(wǎng)絡的蛋白質二級結構預測

作品專業(yè)信息

撰寫目的和基本思路

為了提高蛋白質預測精度,本文改進了BP神經(jīng)網(wǎng)絡的方法,將預測精度提高到70%以上。如果能夠成將蛋白質二級結構預測精度提高到80%,就可以為生物學家了解蛋白質三維結構,設計新藥物提供理論數(shù)據(jù),給生物學家研究帶來方便。將氨基酸殘基片段作為BP神經(jīng)網(wǎng)絡的輸入,二級結構即為對應的輸出,神經(jīng)網(wǎng)絡可以有效地學習蛋白質二級結構形成的復雜規(guī)律或模型,提取需要的信息,并利用所掌握的信息進行預測。

科學性、先進性及獨特之處

本作品用機器學習方法去解決生物學中模式分類問題,是數(shù)據(jù)挖掘技術在生物信息學中的成功應用案例。蛋白質二級結構預測目前依舊是一個難題,主要是預測精度不夠高,本作品將神經(jīng)網(wǎng)絡結構與編碼方式做了改進,將預測精度從同類研究的68%,提高到73.1%,具有一定的科學性及先進性。且本作品提出的操作方法簡單,具有較強的可操作性及可重復性,能夠提供蛋白質數(shù)據(jù)方便驗證結論。

應用價值和現(xiàn)實意義

進行二級結構預測對于理解蛋白質結構與功能的關系,以及分子設計、生物制藥等領域都發(fā)揮重要的現(xiàn)實意義。如果能夠對蛋白質結構做出較為精確的預測,就可以根據(jù)預測出來的結構設計出我們所需要功能蛋白質藥物分子。美國加州理工學院設計和合成了具有鋅指蛋白結構模式的23肽,就是一個按實際需要設計的非天然蛋白質。這些工作前提是要蛋白質二級結構預測精度提高。

學術論文摘要

為提高蛋白質二級結構預測的精度,本文對BP神經(jīng)網(wǎng)絡結構與編碼方式做了改進。構建了一個由5個子網(wǎng)絡集成的多模神經(jīng)網(wǎng)絡,蛋白質二級結構的預測結果由5個子網(wǎng)絡綜合得到。方法是對于每個子網(wǎng)絡采用神經(jīng)網(wǎng)絡分級思想分為二級網(wǎng)絡。一級網(wǎng)絡將蛋白質一級序列用含有進化信息的profile編碼作為輸入,二級結構作為輸出;二級網(wǎng)絡以一級網(wǎng)絡輸出作為輸入,以對一級網(wǎng)絡結果進行精煉,同時開創(chuàng)性地將一級序列用改進正交編碼作為另一輸入以提高精度。本文首創(chuàng)了改進的21位正交編碼,即在傳統(tǒng)20位編碼最后加一位表示氨基酸成分比例。網(wǎng)絡訓練利用子網(wǎng)絡差異訓練方式進行,實驗采用交叉驗證,最終的預測精度達到73.1%,比DSC,PREDATOR,PHD方法精度分別提高4.7%,4.41%,0.90%,可為生物工作者蛋白質結構研究提供便捷方法。

獲獎情況

鑒定結果

參考文獻

[1] 閻隆飛 孫之榮.蛋白質分子結構 [M].清華大學學術專著,1999 [2] Qian Ning, Sejnowski T J. Predicting the Secondary Structure of Globular Proteins Using Network Modals [J]. Journal of Molecular Biology,1988. 865-884 [3]Hanxi Zhu,Ikuo YOSHIHHARA. Kunihito YAMAMORI Prediction of Protein Secondary Structure by Multi-Modal Neural Networks [J]. International Joint Conference on Neural Networks, 2002.280-285. [4] Xin Huang, De-Shuang Huang, Guang-Zheng Zhang, Prediction of Protein Secondary Structure Using Improved Two-Level Neural Network Architecture [J].Protein & Peptide Letter ,2005. (12) 805-811. [5] 王艷春,何東健,王守志,基于級聯(lián)神經(jīng)網(wǎng)絡的蛋白質二級結構預測 [J].計算機工程,2010.36(4). [6] 馮永娥,蛋白質二級結構的預測以及二級結構與三級結構之間關聯(lián)的探討 [D].內蒙古:內蒙古大學. 2008. [7] cuff J.A, Barton G.J, Evaluation and improvement of multiple sequence methods for protein secondary structure prediction [J] ,Proteins.1999. 508-519. [8] Pierre Baldi,張東暉譯,生物信息學——機器學習方法 [M],2003. [9] 林麗玉,基于神經(jīng)網(wǎng)絡的蛋白質二級結構預測的研究 [D],大連:大連理工大學.2005.

同類課題研究水平概述

目前,采用DSC方法的蛋白質二級結構預測精度為68.4%,PREDATOR方法為68.69%,PHD方法為72.1%,PHD方法雖然精度較高但比起神經(jīng)網(wǎng)絡方法更復雜,適用性范圍較小。 Hanxi Zhu等人采用多模神經(jīng)網(wǎng)絡網(wǎng)絡預測精度為68%, 王艷春等人采用級聯(lián)神經(jīng)網(wǎng)絡預測精度為69.61, Huang Xin和Li Yixue等采用改進的二級神經(jīng)網(wǎng)絡預測精度,71.19%.本文提出的神經(jīng)網(wǎng)絡預測精度為 73.1%.
建議反饋 返回頂部