贝瑞基因CIO于福利博士专访:如何下好基因大数据这盘棋?

目前健康医疗大数据被广泛提及,在福州市滨海新区的国家级健康医疗大数据产业园里,作为第一批入驻的基因检测企业,贝瑞基因的数字生命产业园已切实落地并开始正式运营。作为国内基因检测行业龙头企业之一的贝瑞基因,对于基因大数据这盘大棋,有着怎样的筹谋规划?#25335;?#26085;,贝瑞基因于福利博士接受了测序中国记者专访,向公众详?#35813;?#32472;了贝瑞基因的宏图。

揭秘:贝瑞基因100万人基因数据库

于福利博士认为,在精准医学?#36125;?#19968;直被反复提及的“基因大数据?#20445;?#26159;整合测序与医疗、上游与下游的关键所在。从测序数据形成药物基因组,到临床指导用药,再到医疗保险与体检体系——整体医疗方案的形成,基因大数据都贯穿其?#23567;?/p>

搭建、整合中国人群的基因组数据库,是贝瑞基因下好这盘棋的第一步。“贝瑞基因在2010年成立,从2015年起,我们就开始将内部数据进行整合,到现在已经积累了100万人左右的全基因组测序数据。这些数据都经过?#22763;?#21644;过滤,质量不高的数据已经被剔除,阳性数据也不会放进去,因为我们搭建的是中国健康人群的基因数据库。”于福利博士介绍道。

据悉,贝瑞基因这个100万人基因组数据库已经应用于临床研究,并利用数据库的部分数据完成了一些科研项目。于福利博士向测序中国介绍了该数据库目前的一些应用进展。“鉴于数据安全问题,数据库目前仅用于贝瑞基因内部临床研究应用,例如携带者筛查。此外在全外显子组测序、全基因组测序以及其他测序产?#20998;?#35774;计中?#19981;?#29992;?#20581;?#25105;们还与阿里云?#29486;?#24320;发了?#26412;?#21644;深圳的数据集群和技术平台。”他表示,根据目前得到的基因数据,他们发现了一些有意思?#21335;?#35937;,不同省份有?#30424;?#23450;的基因突变频率,这一发现细化了此前基因突变的地区分布规律。

尤其对于携带者筛查研究,这个数据库更显用武之地。于博士表示,携带者筛查和新生儿代谢性疾病筛查属于政府项目。根据不同省份的突变频率,当地政府的政策和资金支持也可以进行针?#23381;?#22320;调整,达到节省成本,提高筛查效率,做到精准预防。希望贝瑞基因的研究成果能够为政府的政策制定提供一些参考信息。

谈到国外已有的数据库,于博士指出,中国人群的基因突变频?#35270;?#22269;外人群存在一定的差异,数据库不能直接套用,相关产品的研?#23458;?#24191;也存在偏差,所以建立中国人自己的基因数据库是精准医疗发展的必然。他举例谈到:“对于某些疾病,犹太人群中的基因突变频?#22763;?#33021;比全球人群平均突变频率高十几二十倍,但这些突变在中国的临床中并不常见,所以国内在这些方面的筛查就没有意义。而我们是利用中国百万人的基因数据开发相关检测产品,定位更加准确。”

愿景:实现数据与临床的互联互通

随着测序技术的不断发展,各领域基因检测产品也在不断开发、完善,基因测序数据的获取也愈?#23588;?#26131;。如何让这些数据产生更大的价值?

?#28304;耍?#20110;福利博士认为,从国家层面考虑,尤其在国家健康医疗大数据?#34892;?#30340;建设中,想要实现基因数据的价值,研发数据共享机制、实现医联体数据互联互通是关键。

以某肺癌患者为例。该患者于基层医院进行影像学检查和基因检测后,基层医院不具备相应治疗条件,转诊到上级医院,由于他?#21335;?#32454;病例没有向上级医院开放,还要做同样重复的检查。如果建立起医院间互联网体系,实现医联体互联互通,上级医院就可以直接调用下级医院的数据,进而减少?#35797;?#28010;?#36873;?#25552;高诊断治疗效?#30465;?/p>

于福利博士表示,要想实现数据与临床真正意义上的互联互通和数据共享,除了保证数据质量外,还需要遵守两个原则。

第一个原则是保证数据安全和患者隐?#20581;?/strong>目前的数据获得和测序技术不再是瓶?#20445;?#32780;数据安全已经成为重中之重,除了IT层面的数据系统安全措施,如防火?#20581;?#25968;据传输?#29992;?#22806;,从业人员的职业操守也同样重要。

第二个原则是数据互通和共享要切实产生附加值,实现互惠互利。在保证数据安全的前提下,研发和临床数据的整合共享要产生实在的应用价值,为医疗诊治和疾病预防产出更高的价值,这也是最为核心的。如经过大量的数据分析,得到与临床表征相关的基因靶点,由此入手?#29486;?#24320;发新药,将大大加速科学研究与医疗的进?#20581;?#21478;一方面,政策推动让医院有主观能动性开放数据?#35797;矗?#20114;惠互利,有利于高效利用公共?#35797;矗?#23454;现精准治疗、精准预防。

虽然真正意义上的大数据互联互通?#34892;?#19968;段时间才能实现,但贝瑞基因内部已经在整合检测技术和数据挖掘上搭建了完整的闭环,对基因检测技术实现临床转化产生了提升和推动作用。?“由基因检测技术加大数据搭建的闭环能进一步提升技术能力,优化医疗服务功能,提供精准医疗服务,真正实现大数据产业核心价值。”由此,贝瑞基因在福州建立了贝瑞基因数字生命产业园。

布局:下好基因大数据这盘棋

早在2017年7月,贝瑞基因即宣布,拟在福建省福州市滨海新城,投资建设以中国人群致病基因信息库的大数据为核心的基因大数据?#34892;?#20135;业园。根据2018年4月的报道,贝瑞基因建设的医学检验所已完成调试,很快将投入运营。于福利博士表示,贝瑞基因还将在滨海新城建设贝瑞基因数字生命产业园,搭建覆盖产、学、?#23567;⒆识?#32500;度的生态系?#24120;?#36890;过基因检测技术将生命数字化,最终实现婚前、孕前、产前、新生儿、幼儿、少年、壮年到老年的全生命周期的健康管理。

据悉,位于福州市滨海新城核心区的中国东南大数据产业园由“三园一区”构成,即健康医疗大数据产业园、虚拟现实产业园、大数据融合产业园和融合创新支撑服务区。在这个切实落地的中国第?#24739;?#22269;?#21494;?#20301;的健康医疗大数据?#34892;?#20013;,贝瑞基因是第?#24739;仪?#23454;落地的基因检测企业,也在开创基因行业以企业为核心的产业链模?#20581;?/p>

这是贝瑞基因将闭环的“拉大一些”的必然一?#20581;?#20110;福利博士表示:“鉴于测序工作产出的数据量大,在医院建立数据?#34892;?#24182;不划算。比如一年测一万个样本,建设相应的数据?#34892;?#38656;要投入四五千万,而且医院的后续运营未必能跟上。而福州大数据?#34892;?#26159;国家平台,很多医院机构都可以使用,数据的互联互通不是问题,而且不必担心安全性。目前我们正在探索构建云端数据?#34892;模?#24076;望让数据发挥出最大的价值。”

谈及继福州大数据?#34892;?#20043;后,贝瑞基因是否会在其他区域建立数据?#34892;模?#20110;福利博士笑言:“我们更关注模式的创新,提升数据附加值,把事做成!?#36125;?#36890;大数据的上下通路,才能继续保持在基因测序领域的领跑地位。贝瑞基因,正积极准备着下一盘布局基因测序行业的大棋。

采访临近?#37319;?#20110;福利博士对本次精准医疗与基因测序大会表示了极大地肯定,他表示:“明年,欢迎咱们的精准医疗与基因测序大会挪到福州来!”