目录
一、问题重述 2
二、基本的模型假设 4
三、名词解释 4
四、符号化 4
五、模型的建立与求解 4
5.1 问题一的分析、建模与求解 4
5.1.2 问题一的模型建立 5
5.1.2.1 巴氏距离模型 5
5.1.2.2 理想基因模型 6
5.1.2.3 综合模型 7
5.1.3 问题一的模型求解 8
5.1.4 问题一的结果及分析 10
5.2.1 问题二的分析 10
5.2.2 基于 FSSM 算法的特征子集的生成 10
5.2.3.1 基于支持向量机(SVM)的分类特征子集选择 11
5.2.3.2 基于人工神经网络(ANN)的分类特征子集选择 12
5.2.4 问题二的结果及分析 12
5.3 问题三的分析、建模与求解 15
5.3.2 问题三的模型建立 16
5.3.2.1 异常数据滤波模型和主成分分析去噪模型 16
1)异常数据滤波模型 17
2)主成分分析去噪模型 17
5.3.2.2 随机噪音的高斯模型 17
5.3.3 问题三的讨论 19
5.4 问题四的分析、建模与求解 20
5.4.2 问题四的模型建立 20
5.4.2.1 癌症基因知识库 21
5.4.2.2 基因图谱数据预处理 22
5.4.2.3 基于知识库的 FSSM 的分类特征子集生成算法 24
5.4.2.4 改进型的 SVM 和 ANN 分类器 26
5.4.3 问题四的模型求解 26
5.4.3.1 结肠癌信息基因知识库的建立 26
5.4.3.2 采用 KFS 模型处理结肠癌图谱分析过程 26
5.4.4 问题四的结果及分析 28
5.4.4.2 结论分析 28
六、总结 30
6.1 模型的总结 30
参考文献 30
附录 1:FSSM 法生成的 34 个特征子集 31
附录 3 基于人工神经网络的分类正确率最好的前 5 个基因组合 34
面对提取基因表达谱信息这样前沿性课题,命题人根据自己科学研究的经历和思考,猜测以下几点是解决前沿性课题的有价值的工作。这种猜测是科学研究文章来源:https://www.toymoban.com/news/detail-837199.html
中的重要环节,当然猜测不会总是可行的,更不一定总是正确的。但不探索就不能前进,如果能够通过数学建模,得到的部分结果可以佐证你们的猜测或为新探索提供若干依据,就很有价值。我们的目的只是给研究生以启发,鼓励研究生培养这样的创造性发现的能力。所以研究生完全可以独立设计自己的技术路线,只要能够有效提取附件的基因表达谱信息就行。
1、由于基因表示之间存在着很强的相关性,所以对于某种特定的肿瘤,似乎会有大量的基因都与该肿瘤类型识别相关,但一般认为与一种肿瘤直接相关的突变基因数目很少。对于给定的数据(见附件),如何从上述观点出发,选择最好的分类因素?
2、相对于基因数目,样本往往很小,如果直接用于分类会造成小样本的学习问题,如何减少用于分类识别的基因特征是分类问题的核心,事实上只有当这种特征较少时,分类的效果才更好些。对于给定的结肠癌数据如何从分类的角度确定相应的基因“标签”?
3、基因表达谱中不可避免地含有噪声(见 1999 年 Golub 在《Science》发表的文章),有的噪声强度甚至较大,对含有噪声的基因表达谱提取信息时会产生偏差。通过建立噪声模型,分析给定数据中的噪声能否对确定基因标签产生有利的影响?
4、在肿瘤研究领域通常会已知若干个信息基因与某种癌症的关系密切,建立融入了这些有助于诊断肿瘤信息的确定基因“标签”的数学模型。比如临床有下面的生理学信息:大约 90%结肠癌在早期有 5 号染色体长臂 APC 基因的失活, 而只有 40%~50%的 ras 相关基因突变。
文章来源地址https://www.toymoban.com/news/detail-837199.html
到了这里,关于MATLAB实现确定肿瘤的重要基因信息的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!