|
技术服务 |
|
|
|
|
|
|
技术服务>生物信息学 |
|
表达谱芯片数据分析 |
聚类分析
针对多芯片结果进行了芯片间及差异表达基因之间的双向聚类,同时对新基因的功能进行预测,目的是对不同的样本进行分类,并对差异基因进行相似性分析。聚类方法包括层次聚类,K-means聚类及SOM等。实例见下截图。
基因功能分析注释(GO分类)
对差异基因进行相应的生物学功能分类,采用GO(gene ontology) 数据库中的功能聚类注释结果,并根据统计检验方法(P-value)筛选显著显异的分类。最后针对客户的需求进行结果的输出。
信号通路分析(pathway)
建立信号通路和生物功能网络,将差异基因与相关的信号通路进行比较、整合,找出基因之间的相互关系,进行通路动态仿真。并根据统计检验方法(P-value)筛选显著显异的代谢通路,以期对致病基因构建模拟疾病状态的通路网络;对目的基因进行分析,以期发现目的基因与疾病之间在生物学通路或生化途径上的关联。
转录因子(TF)分析
利用相关的转录因子(TF)数据库,采用pwmatch算法对每个转录因子分析其在差异基因中的分布情况,利用chi-square test等统计方法寻找有差异的转录因子。目的在于找到调控目标生物性状,统计学上有显著差别的转录因子。
Data-driven Network分析
对差异基因进行Co-expression基因调控网络的构建。采用贝叶斯方法,通过对表达数据进行机器学习,来构建差异基因之间的动态网络。这是一种数据驱动的网络构建,可以发现一些新的调控关系。
Knowledge-driven Network分析
通过整合PubMed text mining,同源预测,基因neighbor,蛋白-蛋白相互作用,基因融合等数据,建立一个all differentially expressed genes in a single plot的调控网络。这是一种已有知识驱动的网络构建。目的在于对前人的研究结果和本实验的生物信息进行关联分析,以期找到一些新的基因共表达的线索,发现新的规律。
基于已有生物学知识的基因网络。图中可以发现,一些调控因子等与大量基因相连接,即所谓的hub基因。可能是整个基因网络的重要的功能基因。
疾病的分型
主要是针对复杂的疾病,利用芯片数据对这些疾病的子类型进行区分,识别传统诊断手段无法辨别、但对预后却有重要意义的亚型。
左图显示的聚类结果中红色标记的样本代表肿瘤病人,从结果中可以明显辨别出该类型肿瘤分为两类。预示着该肿瘤可能为两个亚型。
(疾病)预测模型的构建
利用Bayesian network, PAM及SVM等机器学习语言对芯片结果进行预测模型的构建,将部分芯片数据拿来做预测模型,然后部分芯片数据作为测试数据集(独立样本)来验证模型的准确性。目的在于利用实验数据来筛选出一批靶标基因,并以此构建模型,以进行早期诊断、疾病预测和预后分析。
实例:用于构建疾病预测模型的特征基因的表达值情况。每个基因在两类(红色和蓝色)中的表达量都是有比较显著的差异的。通过利用测试数据集来对该模型进行准确性分析,可以得出该模型的准确率。
|
|
[上一页] [1] [2] [3] [4] [下一页] |
|
|