本書系統(tǒng)地介紹了進(jìn)化算法在生物多序列比對(duì)中的應(yīng)用,根據(jù)內(nèi)容的分類,分為“多序列比對(duì)基礎(chǔ)篇”“多序列比對(duì)模擬篇”和“多序列比對(duì)參數(shù)篇”三個(gè)模塊。首先介紹生物多序列比對(duì)的基礎(chǔ)知識(shí),包括多序列比對(duì)的基本概念、原理、方法、常用數(shù)據(jù)庫、常用工具和應(yīng)用等內(nèi)容,并介紹進(jìn)化算法和化理論的基礎(chǔ)知識(shí),以及遺傳算法、粒子群優(yōu)化算法和量子粒子群優(yōu)化算法的優(yōu)化過程及收斂性分析,為進(jìn)行多序列比對(duì)的模擬提供理論基礎(chǔ);然后詳細(xì)介紹各進(jìn)化算法模擬多序列比對(duì)的過程與結(jié)果;后對(duì)于多序列比對(duì)重要的目標(biāo)函數(shù)參數(shù)進(jìn)行建模與分析。本書具有系統(tǒng)性強(qiáng)、可讀性強(qiáng)、可操作性強(qiáng)等特點(diǎn)。
介紹生物多序列比對(duì)的基礎(chǔ)知識(shí),包括多序列比對(duì)的基本概念、原理、方法、常用數(shù)據(jù)庫、常用工具和應(yīng)用等內(nèi)容,并介紹進(jìn)化算法和化理論的基礎(chǔ)知識(shí),以及遺傳算法、粒子群優(yōu)化算法和量子粒子群優(yōu)化算法的優(yōu)化過程及收斂性分析,為進(jìn)行多序列比對(duì)的模擬提供理論基礎(chǔ);然后詳細(xì)介紹各進(jìn)化算法模擬多序列比對(duì)的過程與結(jié)果;后對(duì)于多序列比對(duì)重要的目標(biāo)函數(shù)參數(shù)進(jìn)行建模與分析。本書具有系統(tǒng)性強(qiáng)、可讀性強(qiáng)、可操作性強(qiáng)等特點(diǎn)。
作 者 簡(jiǎn) 介龍海俠 1980年生,2007年獲江南大學(xué)計(jì)算機(jī)軟件與理論碩士學(xué)位,2010年獲江南大學(xué)輕工信息技術(shù)與工程博士學(xué)位,現(xiàn)就職于海南師范大學(xué)信息科學(xué)技術(shù)學(xué)院,副教授。研究方向:群體智能算法、進(jìn)化算法、生物信息。碩士期間從事群體智能算法和進(jìn)化算法的研究及其在聚類、圖像分割上的應(yīng)用研究;博士期間從事生物信息的研究,重點(diǎn)研究多序列比對(duì)和培養(yǎng)基的優(yōu)化;近5年從事深度學(xué)習(xí)算法和生物信息的研究。已出版教材1部、專著1部,30余篇,主持省級(jí)課題2項(xiàng),作為及時(shí)完成人獲得省級(jí)獎(jiǎng)勵(lì)2項(xiàng)。
李滿枝 1979年生,2004年6月獲西北工業(yè)大學(xué)計(jì)算數(shù)學(xué)專業(yè)理學(xué)碩士學(xué)位,現(xiàn)就職于海南師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,副教授。主要研究方向:生物信息學(xué)、計(jì)算機(jī)數(shù)值模擬、算法構(gòu)造等。碩士期間從事基于蒙特卡羅方法的計(jì)算機(jī)模擬,近5年從事生物信息中的蛋白質(zhì)功能預(yù)測(cè)研究。已在國內(nèi)外核心期刊及學(xué)術(shù)會(huì)議上發(fā)表多篇論文,出版專著1部,并作為主要成員參與省級(jí)和自然科學(xué)項(xiàng)目多項(xiàng),現(xiàn)主持海南省自然科學(xué)基金“生物多序列比對(duì)的遺傳算法模擬及改進(jìn)”。 王洪濤 1978年生,2008年6月獲海南師范大學(xué)應(yīng)用數(shù)學(xué)專業(yè)理學(xué)碩士學(xué)位,現(xiàn)就職于海南師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,副教授。主要研究方向:計(jì)算機(jī)數(shù)值模擬、算法構(gòu)造、數(shù)學(xué)建模等。在國內(nèi)外核心期刊及學(xué)術(shù)會(huì)議上發(fā)表多篇論文,出版專著1部,并作為主要成員參與海南省自然科學(xué)基金項(xiàng)目多項(xiàng),目前是海南省自然科學(xué)基金“生物多序列比對(duì)的遺傳算法模擬及改進(jìn)”的第二參與人。
付海艷 1978年生,2002年獲山東大學(xué)人工智能與模式識(shí)別碩士學(xué)位,2009年獲山東大學(xué)系統(tǒng)理論博士學(xué)位,現(xiàn)就職于海南師范大學(xué)信息科學(xué)技術(shù)學(xué)院,教授。研究方向:評(píng)價(jià)理論與方法、決策理論與方法、不確定信息處理。碩士期間從事基于模糊集理論的評(píng)價(jià)方法和決策方法的研究,博士期間從事基于粗糙集理論和模糊集理論的不確定信息處理,近5年從事數(shù)據(jù)挖掘算法的研究。已出版教材2部、專著1部,30余篇,主持課題1項(xiàng)、省級(jí)課題6項(xiàng),作為及時(shí)完成人獲得省級(jí)獎(jiǎng)勵(lì)2項(xiàng)。
上篇 多序列比對(duì)基礎(chǔ)篇
第1章 生物多序列比對(duì) 3
1.1 生物信息學(xué) 3
1.1.1 生物信息學(xué)的起源 3
1.1.2 生物信息學(xué)的概念 4
1.1.3 生物信息學(xué)的主要研究?jī)?nèi)容 4
1.2 序列比對(duì)的概念及其發(fā)展歷史 8
1.2.1 序列比對(duì)的提出與基本概念 8
1.2.2 序列比對(duì)的目的和意義 8
1.2.3 國內(nèi)外研究現(xiàn)狀 10
1.2.4 多序列比對(duì)面臨的挑戰(zhàn) 10
1.3 多序列比對(duì)的基本原理 11
1.3.1 多序列比對(duì)的相關(guān)概念 11
1.3.2 序列比對(duì)的分類 12
1.3.3 多序列比對(duì)的數(shù)學(xué)定義 13
1.3.4 多序列比對(duì)的打分方法 14
1.4 多序列比對(duì)方法 22
1.4.1 比對(duì)方法 22
1.4.2 多序列比對(duì)算法 23
1.5 多序列比對(duì)常用數(shù)據(jù)庫 33
1.5.1 綜合性數(shù)據(jù)庫 34
1.5.2 基準(zhǔn)數(shù)據(jù)庫 36
1.6 多序列比對(duì)常用工具 40
1.6.1 搜索工具 40
1.6.2 常用的在線多序列比對(duì)工具 42
1.7 多序列比對(duì)的應(yīng)用 45
1.8 其他說明 46
1.8.1 多序列比對(duì)算法存在的問題 46
1.8.2 多序列比對(duì)算法的運(yùn)算指標(biāo) 47
1.8.3 多序列比對(duì)算法的展望 48
1.9 本章小結(jié) 48
參考文獻(xiàn) 49
第2章 進(jìn)化算法和化理論 53
2.1 進(jìn)化算法 53
2.1.1 遺傳算法 53
2.1.2 遺傳規(guī)劃 54
2.1.3 進(jìn)化策略 56
2.1.4 進(jìn)化規(guī)劃 57
2.1.5 粒子群優(yōu)化算法 58
2.1.6 量子粒子群優(yōu)化算法 61
2.2 化理論 63
2.2.1 化問題 64
2.2.2 局部?jī)?yōu)化算法 66
2.2.3 全局優(yōu)化算法 67
2.2.4 化問題的求解 67
2.3 本章小結(jié) 69
參考文獻(xiàn) 69
第3章 遺傳算法、粒子群優(yōu)化算法和量子粒子群優(yōu)化算法 73
3.1 遺傳算法 73
3.1.1 遺傳算法的基本思想 73
3.1.2 遺傳算法中的基本術(shù)語 74
3.1.3 遺傳算法的步驟及流程圖 75
3.1.4 遺傳算法的構(gòu)成要素 76
3.1.5 遺傳算法的優(yōu)缺點(diǎn) 82
3.1.6 遺傳算法的應(yīng)用現(xiàn)狀 84
3.1.7 遺傳算法的改進(jìn) 86
3.2 粒子群優(yōu)化算法 87
3.2.1 基本粒子群優(yōu)化算法 87
3.2.2 帶慣性權(quán)重w的粒子群優(yōu)化算法 89
3.2.3 帶收縮因子 的粒子群優(yōu)化算法 91
3.3 量子粒子群優(yōu)化算法 92
3.3.1 勢(shì)阱模型的建立 92
3.3.2 粒子的基本進(jìn)化方程 95
3.3.3 QPSO算法的流程 96
3.3.4 QPSO算法的收斂性分析 97
3.4 QPSO算法的改進(jìn)——基于選擇操作的QPSO算法 103
3.4.1 引言 103
3.4.2 采用錦標(biāo)賽選擇操作的QPSO算法(QPSO-TS) 105
3.4.3 采用輪盤賭選擇操作的QPSO算法(QPSO-RS) 106
3.4.4 算法的收斂性分析 107
3.5 本章小結(jié) 110
參考文獻(xiàn) 110
中篇 多序列比對(duì)模擬篇
第4章 遺傳算法在多序列比對(duì)中的應(yīng)用 115
4.1 基本遺傳算法模擬多序列比對(duì) 115
4.1.1 引言 115
4.1.2 多序列比對(duì)問題及數(shù)學(xué)描述 117
4.1.3 算法設(shè)計(jì) 117
4.1.4 實(shí)驗(yàn)算例與分析 120
4.1.5 結(jié)論 123
4.2 改進(jìn)遺傳算法之初始種群優(yōu)化 124
4.2.1 引言 124
4.2.2 優(yōu)化原理 125
4.2.3 幾種初始化方法的構(gòu)造 127
4.2.4 加入MAFFT種子的初始化 130
4.2.5 實(shí)驗(yàn)算例與結(jié)果 130
4.2.6 結(jié)論 135
4.3 改進(jìn)遺傳算法之交叉算子優(yōu)化 136
4.3.1 引言 136
4.3.2 交叉算子設(shè)計(jì) 137
4.3.3 實(shí)驗(yàn)算例與結(jié)果 140
4.3.4 結(jié)論 143
4.4 本章小結(jié) 144
參考文獻(xiàn) 144
第5章 QPSO算法在多序列比對(duì)中的應(yīng)用 149
5.1 多序列比對(duì)的含義 149
5.2 基于二進(jìn)制QPSO算法的序列比對(duì) 151
5.2.1 二進(jìn)制的PSO算法(BPSO) 151
5.2.2 二進(jìn)制的QPSO算法(BQPSO) 152
5.2.3 基于BPSO或BQPSO的多序列比對(duì) 156
5.3 本章小結(jié) 163
參考文獻(xiàn) 165
第6章 基于隱馬爾可夫模型和QPSO算法的多序列比對(duì) 167
6.1 引言 167
6.2 隱馬爾可夫模型 168
6.2.1 隱馬爾可夫模型的基本原理 168
6.2.2 隱馬爾可夫模型的基本問題與算法 169
6.3 基于剖面HMM和QPSO的多序列比對(duì) 172
6.3.1 融合多樣性的QPSO算法 174
6.3.2 評(píng)估訓(xùn)練算法的質(zhì)量 179
6.3.3 模型的聯(lián)配問題 179
6.3.4 評(píng)估比對(duì)序列的質(zhì)量 181
6.4 本章小結(jié) 191
參考文獻(xiàn) 191
第7章 多序列比對(duì)的并行計(jì)算 193
7.1 長(zhǎng)序列首尾分段并行比對(duì)算法 193
7.1.1 引言 193
7.1.2 構(gòu)造原理 195
7.1.3 數(shù)值模擬結(jié)果 196
7.1.4 結(jié)論 198
7.2 本章小結(jié) 198
參考文獻(xiàn) 199
下篇 多序列比對(duì)參數(shù)篇
第8章 多序列比對(duì)的參數(shù)研究 203
8.1 基于SP目標(biāo)函數(shù)的多序列比對(duì)參數(shù)研究 203
8.1.1 引言 203
8.1.2 基本定義 204
8.1.3 公式推導(dǎo) 206
8.1.4 實(shí)驗(yàn)結(jié)果與分析 210
8.1.5 結(jié)論 217
8.2 在線工具M(jìn)AFFT參數(shù)研究 218
8.2.1 引言 218
8.2.2 基本定義 220
8.2.3 實(shí)驗(yàn)結(jié)果與分析 222
8.2.4 結(jié)論 229
8.3 本章小結(jié) 230
參考文獻(xiàn) 231
附錄 相關(guān)的源代碼 235
附錄A 基本遺傳算法總程序 235
附錄B 生成初始種群bio_var 239
附錄C 生成初始種群rand_var 243
附錄D 選擇算子selection 245
附錄E 橫向多行交叉算子hhor_crossover4to2 248
附錄F 縱向交叉算子ver_crossover4to2 253
附錄G 變異算子mutation 259
附錄H 適應(yīng)度函數(shù):SP函數(shù) 262
附錄I 多序列比對(duì)參數(shù)研究的相關(guān)程序 264
附錄J HMM和QPSO算法用于多序列比對(duì)的程序 266