腾讯新研究登Nature子刊 让细胞与计算机“对话”辅助精准治癌

2022-10-01 16:24:19 来源:网络


但是,以前受制于数据样本量小、人工干预多等因素,一直难以推广使用。

这次腾讯首次将“transformer”应用到该领域,使其真正实现了高解释性高泛化性高稳定性

目前,该模型已在GitHub上开源 (链接附在文末)。

新模型怎么做到的?

众所周知,人类各种组织之间细胞的类型、状态和相互作用差异巨大。

单细胞RNA测序技术的出现,可以细粒度地观察和刻画各个物种中组织、器官和有机体中单细胞分子图谱(细胞表达),堪称给细胞中的每个基因都印上专属“身份证”。

通过这一技术,研究人员可以更好地研究这些组织及其中存在的不同类型的细胞。

更进一步地说,还可以更好地了解肿瘤微环境,以达到精细分析病因、精准匹配治疗方案的效果。


但是,受数据样本量小、人工干预多、过度依赖marker gene(已报道的特异性基因)等因素的影响,单细胞测序细胞类型注释技术一直面临着泛化性、可解释性、稳定性均比较低的问题,现存的算法也难以有更广泛的应用。

具体来说,人工注释费时、主观性强、误差大、不利于发现新的细胞类型;机器注释则经常出现在一个检测组织里有效,换到另外一个检测组织里就没效的问题,还是需要人工参与。

为此,研究人员开发了一种基于预训练深度神经网络的模型:scBERT模型,并首次将“transformer”运用到单细胞转录组测序数据分析领域。

scBERT模型,顾名思义是基于BERT的思路和范式。


在预训练数据选择上,为了保证全基因组内基因级别的可解释性,scBERT没有做任何的降维或筛选处理,最大程度上保留数据本身的特性和信息。

此外,该模型复用了大规模的公开数据集,包含不同实验来源、批次和组织类型的单细胞数据,以保证模型能学习到更为“通用”的知识,精准捕获单个基因的表达信息及两两基因之间的作用关系。


在实验中,scBERT模型也证实了其在单细胞测序上呈现出的高解释性、高泛化性、高稳定性。

截至目前,通过了9个独立数据集、超过50万个细胞、覆盖17种主要人体器官和主流测序技术组成的大规模benchmarking测试数据集上,该算法模型的优越性均得以验证。

值得一提的是,在极具挑战的外周血细胞亚型细分任务上,相较现有最优方法的70%准确度提升了7%。


不仅如此,这一技术的突破在实际应用中也有很重要的价值:

未来可用于临床单细胞测序数据,并辅助医生描述准确的肿瘤微环境、检测出微量癌细胞,从而实现个性化治疗方案或者癌症早筛。

同时,对疾病致病机制分析、耐药性、药物靶点发现、预后分析、免疫疗法设计等领域都具有极其重要的作用。

研究团队

研究团队主要来自腾讯AI Lab,共同一作有三位:Fan Yang、Wenchuan Wang和Fang Wang。

研究人员称,未来他们会继续基于自身先进AI技术的积累,与下游临床、制药和生命科学基础研究领域进行密切合作。

GitHub链接和论文链接放在文末,感兴趣的小伙伴可以自取~

GitHub链接:

https://github.com/TencentAILabHealthcare/scBERT

论文链接:

https://www.nature.com/articles/s42256-022-00534-z#Abs1

,腾讯新研究登Nature子刊湖南卫视在线 让细胞与计算机“对话”辅助精准治癌

相关:

无缘冠军!中国女篮不敌美国队,武桐桐伤退,追平历史最佳战绩北京时间10月1日,女篮世界杯决赛,中国女篮61-83不敌美国队,无缘冠军,获得世界杯亚军,追平历史最佳战绩。李梦缺席决赛,中国女篮大部分时间处于落后,上半场落后对手10分,下半场分差被拉大,武桐桐伤退,中国女篮无缘逆转。美国队实现四连冠,中国队亚军,澳大利亚队季军。数据统计:中国女篮:黄思静2分8板3助,李月汝19分12板,王思雨11分4助,杨力维3板4助,武桐桐13分3助,韩旭8分6板;美国队:格雷10分4板8助3断,洛伊..

5年磨一剑,中国女篮成为世界亚军有太多故事可讲10月1日,2022年女篮世界杯在澳大利亚悉尼落下大幕,中国女篮时隔28年再次获得世界大赛亚军,追平历史最佳战绩。从2017年许利民成为主帅,到今年年初郑薇接任,中国女篮奋起直追,用了5年站上世界大赛领奖台。东京奥运会,许利民穿着护靴在场边指挥比赛。他对中国女篮的复兴发挥了很重要作用。 资料图/IC photo低谷中强势崛起中国女篮并非没有陷入低谷,而且时间并不遥远。2015年亚洲杯(亚锦赛),中国女篮决赛惨败于日本队,..

中国女篮本届世界杯征程:8场比赛只败给了1个对手准绝杀澳大利亚队之后,中国女篮拿着国旗合影。图/IC photo10月1日,澳大利亚悉尼,中国女篮在2022年女篮世界杯决赛中不敌卫冕冠军美国队,屈居亚军。纵观本届世界杯的表现,中国女篮8场比赛6胜2负,只在小组赛、决赛不敌美国队,已然跻身世界女子篮坛一线强队之列。本届世界杯开打前,郑薇执教的这支中国女篮便被寄予很高的期待,外界普遍认为,球队很有可能时隔多年再次闯进世界大赛4强。9月22日,中国女篮正式开始世界杯之旅..

中国女篮时隔28年再夺世界杯亚军 追平历史最佳成绩北京时间10月1日下午2时,2022年女篮世界杯决赛在澳大利亚悉尼上演,中国女篮对阵卫冕冠军美国队。首节李月汝和王思雨状态出色,两人包揽球队首节全部13分,不过美国女篮靠着出色的中距离占据上风;次节武桐桐成为奇兵开局连拿9分带队周旋,但美国的反击犀利数次凭借抓失误的进攻将分差拉大至两位数,金维娜最后的压哨三分帮助女篮落后10分进入下半场。下半场开局女篮连续失误错失追分良机,而美国女篮靠着出色的个人能力不断扩..

从“鲁迅有点帅”说起说起鲁迅的外貌,我们最先想到的可能是他在其诗作《自嘲》中的形容——“横眉冷对”,虽然有如此严肃冷峻的加持,然而一米六左右的身高以如今的审美标准来看,恐怕怎么都称不上“帅气”。鲁迅、萧伯纳、蔡元培从左至右,摄于1933年对于鲁迅的外貌描述最准确的,应该是他身边的亲人、好友、学生们。在鲁迅的挚友、作家许寿裳笔下,鲁迅“额角开展,颧骨微高,双目澄清如水精,其光炯炯而带着幽郁”;而作家郁达夫甚至称鲁迅为“中..

莫言的国庆假期书单:一起阅读《史记》等经典大家好,我是莫言。国庆长假就要到了,跟大家分享我读过的好书,我们在假期里一起阅读经典。《史记》我们读《史记》,何尝不是在读司马迁的心灵史。司马迁一生最大的特点是好奇。他是童心活泼的大作家。他笔下那些成功的人物都有出奇之处,都有行为奇怪、超出常人之处。项羽奇在学书不成学剑不成学兵也不成,不学而有术,奇在他是一个天生的战斗之神。韩信奇在以雄伟之躯甘受胯下之辱,拜将后屡出奇计,最后被糊糊涂涂地处死。奇..

母乳与奶粉:一段有关喂养的文化史十月怀胎、一朝分娩。对于初为人母的女性来说,这只是故事的开始。生产之后,是选择母乳喂养还是奶粉喂养,背后既有理性计算,也是科学话语与道德观念的必争之地。这也是为什么,在当下有关生育、人口问题的讨论之中,喂养议题一直备受关注。事实上,无论是母乳还是奶粉,它从来都不是一个简单的选择问题。近代以来,无论东西方,都经历过从母乳喂养到牛乳哺育的话语转变。近年来,母乳喂养重被提倡为最佳的哺乳方式,围绕母乳喂..

中国人的性格就是这几位诗人的杂糅说起唐朝诗人,我们耳熟能详的已经太多,陈子昂、孟浩然、李白、杜甫、王维、白居易……等等,然而在这些如雷贯耳的大名之外,还另有一个唐朝诗人在其中显得尤其特别——王梵志。作为一名唐初河南的底层农民,王梵志创作的一大主题就是道德劝诫,所谓“教你做人”,然而他在“讲道理”、劝诫讽喻的时候,真的触及了社会现实,讽刺当时的官吏司法、世态人情,在通达、通透之处看透了生死、爱憎与得失。下文摘选自王晓磊(六神磊磊..

一生中难免有那么几次,人会荒唐地去怀疑自己的价值 | 星期天文学周五好,这里是「星期天文学」。也许有读者还记得这个名字,它初创于2016年,是凤凰网读书最早的文学专栏之一。这几年,我们与网络环境相伴共生,有感于其自由开放,也意识到文字载体的不易,和文学共同体的珍稀。接下来的日子里,「星期天文学」将以一种“细水长流”的方式,为纯文学爱好者设宴。这里推荐的小说家,年轻而富有才华,是新文学的旗手,他们持续而毫不功利的写作,值得我们多花一点时间,也补缀、延展了我们的时间..

没人关心女性的性爱 | 上野千鹤子×铃木凉美上野千鹤子 & 铃木凉美上野千鹤子,日本女性主义先驱,其作品《厌女》《从零开始的女性主义》启发了无数女性。铃木凉美,拍过100多部成人电影的“前AV女演员”,她将此段经历与观察写成学术论文后,被东京大学录取。相差35岁的她们经历迥异:铃木在性交易市场目睹过男性低劣的欲望,已对男人彻底绝望;上野经历过无数次愤怒与失望,但仍对世界充满信心。她们在2020年开始通信,围绕恋爱与性、婚姻、工作、独立、男人等12个不同..