医疗专利数据库

一种单细胞质谱数据处理方法

发布日期:2024-08-22 浏览次数:

本技术涉及数据处理,尤其涉及一种单细胞质谱数据处理方法。背景技术:1、细胞是生命活动的基本单元,在相关技术中,可以将细胞流式进样与电喷雾离子源质谱(electrospray ionization mass spectrometry,esi-ms)联用,实现细胞检测通量与较高覆盖度的代谢物检测。2、然而,对于单细胞中代谢物离子来说,基于上述方式只能检测代谢物离子的质荷比(m/z),如果仅通过质荷比进行代谢物的注释,会存在拥有相同分子式的代谢物同分异构体的干扰,降低代谢物注释的准确性,进而影响后续单细胞代谢组学数据的精准定性和精确定量。技术实现思路1、本技术实施例的目的是提供一种单细胞质谱数据处理方法、装置、计算机设备和计算机可存储介质,能够解决相关技术中代谢物注释的准确性低,影响后续单细胞代谢组学数据的精准定性和精确定量的问题。2、为了解决上述技术问题,本技术是这样实现的:3、第一方面,本技术实施例提供了一种单细胞质谱数据处理方法,该方法可以包括:4、获取单细胞离子化事件的数据帧,数据帧用于记录n个离子的离子数据,离子数据包括质荷比和离子信号强度,n为正整数;5、根据n个离子的离子数据,对n个离子进行分箱,得到k个子箱,其中,k个子箱包括以下至少一种类型的子箱:满足预设划分条件的第一类子箱、不满足预设划分条件的第二类子箱,第一类子箱中的离子符合以下至少一项条件:第一类子箱中的离子的质荷比相同、第一类子箱中的离子的质荷比小于或等于第一预设阈值,k为正整数;6、分别对k个子箱中每个子箱中的离子进行整合,得到k个整合离子,k个整合离子包括k个子箱中每个子箱对应的整合离子,整合离子的整合离子数据包括整合质荷比和整合离子信号强度,整合质荷比由子箱中每个离子的质荷比和离子信号强度确定,整合离子信号强度由子箱中每个离子的离子信号强度确定;7、对k个整合离子进行整合,得到与数据帧对应的细胞叠加数据帧,细胞叠加数据帧用于检测代谢物离子淌度流出峰,以通过代谢物离子淌度流出峰进行注释代谢物。8、在本技术提供的一些实施例中,上述涉及的“根据n个离子的离子数据,对n个离子进行分箱,得到k个子箱”的步骤中,具体可以包括:9、在单细胞离子化事件的数据帧由流式-质谱技术获取,k个子箱包括第一类子箱和第二类子箱的情况下,根据n个离子中每个离子的离子信号强度,从n个离子中筛选第一离子,第一离子的离子信号强度大于或等于第一预设阈值;10、根据第一离子的质荷比,从n个离子中筛选出第二离子和第三离子,第二离子的质荷比与第一离子的质荷比相同,第三离子的质荷比小于或等于第二预设阈值;11、将第一离子、第二离子和第三离子划分到第一类子箱;以及,将n个离子中除第一类子箱中离子之外的第四离子划分为第二类子箱。12、在本技术提供的一些实施例中,上述涉及的“根据n个离子的离子数据,对n个离子进行分箱,得到k个子箱”的步骤之前,该单细胞质谱数据处理还可以包括:13、在单细胞离子化事件的数据帧由流式-离子淌度-质谱技术获取,离子数据还包括离子淌度值,k个子箱包括第一类子箱和第二类子箱的情况下,根据n个离子中每个离子的离子淌度值,对n个离子进行分箱,得到m个箱;其中,m个箱中每个箱包括p个离子,每个箱中p个离子的离子淌度值相同,m个箱中不同箱中离子的离子淌度值不同,p、m为大于1的整数;14、基于此,上述涉及的“根据n个离子的离子数据,对n个离子进行分箱,得到k个子箱”的步骤具体可以包括:15、根据m个箱中第i个箱中每个离子的离子信号强度,从第i个箱中的p个离子中筛选出第五离子,第五离子的离子信号强度大于或等于第三预设阈值,i∈[1,m];16、根据第五离子的质荷比,从第i个箱中的p个离子中筛选出第六离子和第七离子,第六离子的质荷比与第五离子的质荷比相同,第七离子的质荷比小于或等于第四预设阈值;17、将第五离子、第六离子和第七离子划分到第i个箱中的第一类子箱;以及,将第i个箱中除第i个箱中的第一类子箱之外的第八离子划分为第i个箱中的第二类子箱。18、在本技术提供的一些实施例中,整合离子的整合离子数据还包括整合离子淌度值,整合离子淌度值为子箱所属箱的离子淌度值。19、在本技术提供的一些实施例中,上述涉及的“根据n个离子的离子数据,对n个离子进行分箱,得到k个子箱”的步骤之前,该单细胞质谱数据处理还可以包括:20、对每个子箱中的离子的质荷比和离子信号强度进行加权求和,得到加权值;21、基于加权值与每个子箱中的离子的离子信号强度,计算整合质荷比。22、第二方面,本技术实施例提供了一种单细胞质谱数据处理方法,该方法可以包括:23、从被测数据帧集合中提取单细胞离子化事件的l个被测数据帧,l为正整数;24、将l个被测数据帧中每个被测数据帧确定为如第一方面中所示的任一项中单细胞离子化事件的数据帧,执行如第一方面中任一项单细胞质谱数据处理方法的步骤,得到被测细胞叠加数据帧,被测细胞叠加数据帧包括被测数据帧中r个离子中每个离子在单细胞离子化事件中的被测细胞叠加数据帧;25、根据被测细胞叠加数据帧,检测代谢物离子淌度流出峰;26、根据代谢物离子淌度流出峰在单个细胞中的离子数据,确定代谢物离子淌度流出峰在单个细胞中的代谢物结果信息,代谢物结果信息包括定量信息和定性信息。27、在本技术提供的一些实施例中,上述涉及的“从被测数据帧集合中提取单细胞离子化事件的l个被测数据帧”的步骤具体可以包括:28、在被测数据帧集合中的被测数据帧由流式-离子淌度-质谱技术获取、且收到用户输入的与单细胞离子化事件对应的单细胞离子化事件标志物的第一预设质荷比和预设离子淌度值的情况下,从被测数据帧集合中的目标被测数据帧中提取与第一预设质荷比和预设离子淌度值匹配的至少两个离子;29、对至少两个离子中每个的离子信号强度求和,得到目标被测数据帧的目标离子信号强度;30、按照色谱保留时间的顺序,对目标被测数据帧的目标离子信号强度进行排序,得到色谱流出峰;31、基于第一预设峰宽,在色谱流出峰上提取第一峰区域,第一峰区域中的色谱峰顶点的色谱保留时间在单细胞离子化事件标志物对应的预设色谱保留积分范围内;32、将第一峰区域对应的数据帧确定为被测单细胞离子化事件的被测数据帧。33、在本技术提供的一些实施例中,上述涉及的“根据被测细胞叠加数据帧,检测代谢物离子淌度流出峰”的步骤具体可以包括:34、按照被测细胞叠加数据帧中离子的离子淌度值,对被测细胞叠加数据帧进行排列,得到第一序列;35、从第一序列中筛选目标离子,目标离子的离子信号强度大于或等于第五预设阈值;36、基于目标离子的离子淌度值,从第一序列中筛选与目标离子匹配的相关离子,相关离子的质荷比与目标离子的质荷比满足以下至少一个条件:相关离子的质荷比与目标离子的质荷比相同、相关离子的质荷比小于或等于第六预设阈值;37、基于目标离子和相关离子,构建潜在峰目标;38、在潜在峰目标的连续信号的长度小于第七预设阈值的情况下,按照离子的离子信号强度,对第一序列中的离子排序,得到第二序列;39、按照第二预设峰宽,在第二序列中提取第二峰区域;40、在第二峰区域中的目标峰的离子淌度峰大于或等于第八预设阈值的情况下,将目标峰确定为代谢物离子淌度流出峰的峰顶点;41、根据第二峰区域中离子的质荷比和离子信号强度,计算代谢物离子淌度流出峰的质荷比;并将目标峰的离子淌度值作为代谢物离子淌度流出峰的离子淌度值;42、基于代谢物离子淌度流出峰的质荷比和代谢物离子淌度流出峰的离子淌度值,生成代谢物离子淌度流出峰。43、在本技术提供的一些实施例中,上述涉及的“根据代谢物离子淌度流出峰在单个细胞中的离子数据,确定代谢物离子淌度流出峰在单个细胞中的代谢物结果信息”的步骤具体可以包括:44、在代谢物离子淌度流出峰在单个细胞中的离子数据包括代谢物离子淌度流出峰的质荷比和代谢物离子淌度流出峰的离子淌度值,代谢物结果信息为定量信息的情况下,基于代谢物离子淌度流出峰的质荷比和代谢物离子淌度流出峰的离子淌度值,从单细胞离子化事件中筛选与代谢物离子淌度流出峰匹配的至少两个事件离子,事件离子的质荷比满足以下至少一个条件:事件离子的质荷比与第二预设质荷比相同、事件离子的质荷比小于或等于第七预设阈值;事件离子的离子淌度值小于或等于第九预设阈值;45、对至少两个事件离子中每个事件离子的离子信号强度求和,得到代谢物离子淌度流出峰在单个细胞中的定量信息。46、在本技术提供的一些实施例中,上述涉及的“根据代谢物离子淌度流出峰在单个细胞中的离子数据,确定代谢物离子淌度流出峰在单个细胞中的代谢物结果信息”的步骤具体可以包括:47、在代谢物结果信息为定性信息的情况下,根据代谢物离子淌度流出峰在单个细胞中的离子数据,确定代谢物离子淌度流出峰在单个细胞中的代谢物结果信息。48、第三方面,本技术实施例提供了一种单细胞质谱数据处理装置,该装置可以包括:49、获取模块,用于获取单细胞离子化事件的数据帧,数据帧用于记录n个离子的离子数据,离子数据包括质荷比和离子信号强度,n为正整数;50、分箱模块,用于根据n个离子的离子数据,对n个离子进行分箱,得到k个子箱,其中,k个子箱包括以下至少一种类型的子箱:满足预设划分条件的第一类子箱、不满足预设划分条件的第二类子箱,第一类子箱中的离子符合以下至少一项条件:第一类子箱中的离子的质荷比相同、第一类子箱中的离子的质荷比小于或等于第一预设阈值,k为正整数;51、整合模块,用于分别对k个子箱中每个子箱中的离子进行整合,得到k个整合离子,k个整合离子包括k个子箱中每个子箱对应的整合离子,整合离子的整合离子数据包括整合质荷比和整合离子信号强度,整合质荷比由子箱中每个离子的质荷比和离子信号强度确定,整合离子信号强度由子箱中每个离子的离子信号强度确定;52、整合模块还可以用于,对k个整合离子进行整合,得到与数据帧对应的细胞叠加数据帧,细胞叠加数据帧用于检测代谢物离子淌度流出峰,以通过代谢物离子淌度流出峰进行注释代谢物。53、在本技术提供的一些实施例中,分箱模块具体可以用于,在单细胞离子化事件的数据帧由流式-质谱技术获取,k个子箱包括第一类子箱和第二类子箱的情况下,根据n个离子中每个离子的离子信号强度,从n个离子中筛选第一离子,第一离子的离子信号强度大于或等于第一预设阈值;54、根据第一离子的质荷比,从n个离子中筛选出第二离子和第三离子,第二离子的质荷比与第一离子的质荷比相同,第三离子的质荷比小于或等于第二预设阈值;55、将第一离子、第二离子和第三离子划分到第一类子箱;以及,将n个离子中除第一类子箱中离子之外的第四离子划分为第二类子箱。56、在本技术提供的一些实施例中,获取模块还可以用于,在单细胞离子化事件的数据帧由流式-离子淌度-质谱技术获取,离子数据还包括离子淌度值,k个子箱包括第一类子箱和第二类子箱的情况下,根据n个离子中每个离子的离子淌度值,对n个离子进行分箱,得到m个箱;其中,m个箱中每个箱包括p个离子,每个箱中p个离子的离子淌度值相同,m个箱中不同箱中离子的离子淌度值不同,p、m为大于1的整数;57、基于此,分箱模块具体可以包括:58、根据m个箱中第i个箱中每个离子的离子信号强度,从第i个箱中的p个离子中筛选出第五离子,第五离子的离子信号强度大于或等于第三预设阈值,i∈[1,m];59、根据第五离子的质荷比,从第i个箱中的p个离子中筛选出第六离子和第七离子,第六离子的质荷比与第五离子的质荷比相同,第七离子的质荷比小于或等于第四预设阈值;60、将第五离子、第六离子和第七离子划分到第i个箱中的第一类子箱;以及,将第i个箱中除第i个箱中的第一类子箱之外的第八离子划分为第i个箱中的第二类子箱。61、在本技术提供的一些实施例中,整合离子的整合离子数据还包括整合离子淌度值,整合离子淌度值为子箱所属箱的离子淌度值。62、在本技术提供的一些实施例中,单细胞质谱数据处理装置还可以包括计算模块;其中,63、计算模块,用于对每个子箱中的离子的质荷比和离子信号强度进行加权求和,得到加权值;基于加权值与每个子箱中的离子的离子信号强度,计算整合质荷比。64、第四方面,本技术实施例提供了一种单细胞质谱数据处理装置,该装置可以包括:65、提取模块,用于从被测数据帧集合中提取单细胞离子化事件的l个被测数据帧,l为正整数;66、处理模块,用于将l个被测数据帧中每个被测数据帧确定为如第一方面中所示的任一项中单细胞离子化事件的数据帧,执行如第一方面中任一项单细胞质谱数据处理方法的步骤,得到被测细胞叠加数据帧,被测细胞叠加数据帧包括被测数据帧中r个离子中每个离子在单细胞离子化事件中的被测细胞叠加数据帧;67、获取模块,用于根据被测细胞叠加数据帧,检测代谢物离子淌度流出峰;68、确定模块,用于根据代谢物离子淌度流出峰在单个细胞中的离子数据,确定代谢物离子淌度流出峰在单个细胞中的代谢物结果信息,代谢物结果信息包括定量信息和定性信息。69、在本技术提供的一些实施例中,上述涉及的提取模块具体可以用于,在被测数据帧集合中的被测数据帧由流式-离子淌度-质谱技术获取、且收到用户输入的与单细胞离子化事件对应的单细胞离子化事件标志物的第一预设质荷比和预设离子淌度值的情况下,从被测数据帧集合中的目标被测数据帧中提取与第一预设质荷比和预设离子淌度值匹配的至少两个离子;70、对至少两个离子中每个的离子信号强度求和,得到目标被测数据帧的目标离子信号强度;71、按照色谱保留时间的顺序,对目标被测数据帧的目标离子信号强度进行排序,得到色谱流出峰;72、基于第一预设峰宽,在色谱流出峰上提取第一峰区域,第一峰区域中的色谱峰顶点的色谱保留时间在单细胞离子化事件标志物对应的预设色谱保留积分范围内;73、将第一峰区域对应的数据帧确定为被测单细胞离子化事件的被测数据帧。74、在本技术提供的一些实施例中,获取模块具体可以用于,按照被测细胞叠加数据帧中离子的离子淌度值,对被测细胞叠加数据帧进行排列,得到第一序列;75、从第一序列中筛选目标离子,目标离子的离子信号强度大于或等于第五预设阈值;76、基于目标离子的离子淌度值,从第一序列中筛选与目标离子匹配的相关离子,相关离子的质荷比与目标离子的质荷比满足以下至少一个条件:相关离子的质荷比与目标离子的质荷比相同、相关离子的质荷比小于或等于第六预设阈值;77、基于目标离子和相关离子,构建潜在峰目标;78、在潜在峰目标的连续信号的长度小于第七预设阈值的情况下,按照离子的离子信号强度,对第一序列中的离子排序,得到第二序列;79、按照第二预设峰宽,在第二序列中提取第二峰区域;80、在第二峰区域中的目标峰的离子淌度峰大于或等于第八预设阈值的情况下,将目标峰确定为代谢物离子淌度流出峰的峰顶点;81、根据第二峰区域中离子的质荷比和离子信号强度,计算代谢物离子淌度流出峰的质荷比;并将目标峰的离子淌度值作为代谢物离子淌度流出峰的离子淌度值;82、基于代谢物离子淌度流出峰的质荷比和代谢物离子淌度流出峰的离子淌度值,生成代谢物离子淌度流出峰。83、在本技术提供的一些实施例中,确定模块具体可以用于,在代谢物离子淌度流出峰在单个细胞中的离子数据包括代谢物离子淌度流出峰的质荷比和代谢物离子淌度流出峰的离子淌度值,代谢物结果信息为定量信息的情况下,基于代谢物离子淌度流出峰的质荷比和代谢物离子淌度流出峰的离子淌度值,从单细胞离子化事件中筛选与代谢物离子淌度流出峰匹配的至少两个事件离子,事件离子的质荷比满足以下至少一个条件:事件离子的质荷比与第二预设质荷比相同、事件离子的质荷比小于或等于第七预设阈值;事件离子的离子淌度值小于或等于第九预设阈值;84、对至少两个事件离子中每个事件离子的离子信号强度求和,得到代谢物离子淌度流出峰在单个细胞中的定量信息。85、在本技术提供的一些实施例中,确定模块具体可以用于,在代谢物结果信息为定性信息的情况下,根据代谢物离子淌度流出峰在单个细胞中的离子数据,确定代谢物离子淌度流出峰在单个细胞中的代谢物结果信息。86、第五方面,本技术实施例提供了一种计算机设备,该计算机设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第一方面或第二方面所示的单细胞质谱数据处理方法的步骤。87、第六方面,本技术实施例提供了一种计算机可读存储介质,可读存储介质上存储程序或指令,程序或指令被处理器执行时实现如第一方面或第二方面所示的单细胞质谱数据处理方法的步骤。88、第七方面,本技术实施例提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如如第一方面或第二方面所示的单细胞质谱数据处理方法的步骤。89、综上,本技术实施例提供的单细胞质谱数据处理方法,可以获取单细胞离子化事件的数据帧,数据帧用于记录n个离子的离子数据,离子数据包括质荷比和离子信号强度;接着,根据n个离子的离子数据,对n个离子进行分箱,得到k个子箱,其中,k个子箱包括以下至少一种类型的子箱:满足预设划分条件的第一类子箱、不满足预设划分条件的第二类子箱,第一类子箱中的离子符合以下至少一项条件:第一类子箱中的离子的质荷比相同、第一类子箱中的离子的质荷比小于或等于第一预设阈值;再者,分别对k个子箱中每个子箱中的离子进行整合,得到k个整合离子,k个整合离子包括k个子箱中每个子箱对应的整合离子,整合离子的整合离子数据包括整合质荷比和整合离子信号强度,整合质荷比由子箱中每个离子的质荷比和离子信号强度确定,整合离子信号强度由子箱中每个离子的离子信号强度确定;然后,对k个整合离子进行整合,得到与数据帧对应的细胞叠加数据帧,细胞叠加数据帧用于检测代谢物离子淌度流出峰,以通过代谢物离子淌度流出峰进行注释代谢物。这样,由于代谢物的离子淌度流出峰由每个离子淌度值分箱中质荷比等于该代谢物的离子的信号强度依次相连组成,属于该代谢物的离子总是在特定若干个分箱中出现,而噪音离子信号随机出现在不同的分箱中,若只是观察一个单细胞离子化事件中某一个代谢物的离子淌度流出峰,其信噪比可能因为代谢物含量较少而非常低,甚至无法区分属于代谢物的离子与噪音离子,所以,通过本技术实施例提供的单细胞质谱数据处理方法可以极大程度地增加同一代谢物离子的信号强度,而噪音信号由于随机出现,在细胞叠加过程中信号强度的增加程度远远小于代谢物信号,因此,在通过累积同一离子在所有单细胞离子化事件中的信号强度,从而提升了代谢物离子淌度流出峰的信噪比与质谱峰的信噪比,进而促进检测代谢物离子淌度流出峰的灵敏度与覆盖度,从而实现通过代谢物离子淌度流出峰进行注释代谢物的准确性。