环境污染物致癌性预测模型的训练方法和预测方
发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370
申请号: | 申请日: | ||
公开(公告)号: | 公开(公告)日: | ||
发明(设计)人: | 申请(专利权)人: | ||
主分类号: | 分类号: | ||
代理公司: | 代理人: | ||
地址: | 国省代码: | ||
权利要求书: | 说明书: | ||
微信咨询: | 添加微信:543646或【点此在线咨询】 | 文件下载: | 【点此下载】请正确填写本页网址和接收邮箱 |
摘要: | 本发明涉及生物信息学与深度学习的,尤其涉及一种基于卷积神经网络和转录组数据的环境污染物致癌性预测模型的训练方法和预测方法。、癌症是一种严重的全球性健康问题,其发病率不断上升。多年来,研究人员一直在努力揭示癌症发病的复杂原因,其中包括环境因素中的污染物。然而,传统的致癌性物质评估方法通常非常... | ||
相关服务: | 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理 | ||
本发明涉及生物信息学与深度学习的,尤其涉及一种基于卷积神经网络和转录组数据的环境污染物致癌性预测模型的训练方法和预测方法。背景技术:1、癌症是一种严重的全球性健康问题,其发病率不断上升。多年来,研究人员一直在努力揭示癌症发病的复杂原因,其中包括环境因素中的污染物。然而,传统的致癌性物质评估方法通常非常耗时、资源密集且受限于大量动物实验和临床试验,这限制了对环境污染物的全面评估。此外,尽管转录组数据的挖掘已经成为一种重要的方法来理解癌症的分子机制,但仍然存在一些挑战。转录组数据提供了关于基因表达的宝贵信息,但通常需要高度复杂的分析和解释,以揭示潜在的致癌性物质。这使得需要一种更高效、准确的方法来识别和评估环境污染物的潜在致癌性。技术实现思路1、有鉴于此,本发明的主要目的在于提供了一种基于卷积神经网络和转录组数据的环境污染物致癌性预测模型的训练方法和预测方法,以期至少部分地解决上述提及的技术问题中的至少之一。2、为实现上述目的,本发明的技术方案如下:3、作为本发明的一个方面,提供了一种环境污染物致癌性预测模型的训练方法,包括:对多个生物组织各自的转录组数据分别进行分析,得到多个样本数据,其中每个样本数据用于表征每个生物组织对应的多个基因集各自的表达水平,所述生物组织包括肿瘤组织或正常组织;将每个所述样本数据转化为灰度图像,其中,所述灰度图像的单个像素的灰度值用于表征一个所述样本数据中一个基因集的表达水平,所述灰度图像按照肿瘤或正常组织进行分类标记;将转化得到的多个所述灰度图像输入至卷积神经网络模型,进行二分类训练,得到所述环境污染物致癌性预测模型。4、作为本发明的另一个方面,提供了一种环境污染物致癌性预测方法,包括:将在环境污染物影响下待预测生物组织的转录组数据进行分析,得到待预测数据,其中所述待预测数据用于表征所述环境污染物影响下多个基因集各自的表达水平;将所述待预测数据转化为灰度图像,其中,所述灰度图像的单个像素的灰度值用于表征所述待预测数据中一个基因集的表达水平;将转化得到的灰度图像输入至环境污染物致癌性预测模型,输出用于表征环境污染物致癌性的预测结果,其中,所述环境污染物致癌性预测模型为按照如上所述的训练方法训练得到。5、基于上述技术方案,本发明的基于卷积神经网络和转录组数据的环境污染物致癌性预测模型的训练方法和预测方法至少具有以下有益效果其中之一或其中一部分:6、(1)广泛性致癌性评估:基于环境污染物的潜在致癌性对于生物组织的基因表达影响与肿瘤组织的基因表达影响存在一致性,因此利用与肿瘤相关的转录组数据转成灰度图像后,将灰度图像导入卷积神经网络(cnn)模型进行训练,得到环境污染物致癌性预测模型,该环境污染物致癌性预测模型适用于对各种环境污染物的致癌性进行评估。7、(2)高通量数据处理:通过创新地将基因表达数据转化成灰度图像,在保留与基因表达相关信息的同时,较大地减少了数据的复杂性和提高了处理速度。相较于基因表达分析,这种图像处理方式更高效。8、(3)无需复杂分析:使用卷积神经网络模型,能够将转化成的灰度图像输入模型,自动且有效地提取与基因表达相关的特征,对图像进行分类,而不需要进行繁琐的传统分析,如动物实验或临床试验,这节省了大量的时间和资源。9、(4)早期癌症预防和环境保护:本发明可以更早期地识别潜在的致癌性物质,为早期癌症预防提供更多有效的策略和措施,并且,有助于更全面地了解环境污染物对健康的潜在威胁,为环境保护提供更多有效的策略和措施。技术特征:1.一种环境污染物致癌性预测模型的训练方法,包括:2.根据权利要求1所述的训练方法,其中,所述对多个生物组织各自的转录组数据分别进行分析,得到多个样本数据包括:3.根据权利要求1所述的训练方法,其中,所述将每个所述样本数据分别转化为灰度图像包括:4.根据权利要求3所述的训练方法,其中,所述根据灰度图的像素取值范围,将所述归一化后的基因集的表达量转换为灰度值包括:5.根据权利要求1所述的训练方法,其中,所述将转化得到的多个所述灰度图像输入卷积神经网络模型,进行二分类训练,得到所述环境污染物致癌性预测模型包括:6.根据权利要求1所述的训练方法,还包括:7.一种环境污染物致癌性预测方法,包括:8.根据权利要求7所述的方法,还包括:9.根据权利要求8所述的方法,其中,所述根据所述预测结果,对所述环境污染物的癌变潜力进行分级,得到用于表征所述环境污染物的潜在致癌性程度的分级结果包括:10.根据权利要求7所述的方法,还包括:技术总结一种环境污染物致癌性预测模型的训练方法和预测方法,该训练方法,包括:对多个生物组织各自的转录组数据分别进行分析,得到多个样本数据,其中每个样本数据用于表征每个生物组织对应的多个基因集各自的表达水平,所述生物组织包括肿瘤组织或正常组织;将每个所述样本数据转化为灰度图像,其中,所述灰度图像的单个像素的灰度值用于表征一个所述样本数据中一个基因集的表达水平,所述灰度图像按照肿瘤或正常组织进行分类标记;将转化得到的多个所述灰度图像输入至卷积神经网络模型,进行二分类训练,得到所述环境污染物致癌性预测模型。技术研发人员:李庆元,杨仁君,殷诺雅,费凡受保护的技术使用者:中国科学院生态环境研究中心技术研发日:技术公布日:2024/8/15
- 上一篇:带有辅助取放结构的灭菌装置的制作方法
- 下一篇:踝关节康复袜