貝瑞基因CIO于福利博士專訪:如何下好基因大數據這盤棋?

目前健康醫療大數據被廣泛提及,在福州市濱海新區的國家級健康醫療大數據產業園里,作為第一批入駐的基因檢測企業,貝瑞基因的數字生命產業園已切實落地并開始正式運營。作為國內基因檢測行業龍頭企業之一的貝瑞基因,對于基因大數據這盤大棋,有著怎樣的籌謀規劃?近日,貝瑞基因于福利博士接受了測序中國記者專訪,向公眾詳細描繪了貝瑞基因的宏圖。

揭秘:貝瑞基因100萬人基因數據庫

于福利博士認為,在精準醫學時代,一直被反復提及的“基因大數據”,是整合測序與醫療、上游與下游的關鍵所在。從測序數據形成藥物基因組,到臨床指導用藥,再到醫療保險與體檢體系——整體醫療方案的形成,基因大數據都貫穿其中。

搭建、整合中國人群的基因組數據庫,是貝瑞基因下好這盤棋的第一步。“貝瑞基因在2010年成立,從2015年起,我們就開始將內部數據進行整合,到現在已經積累了100萬人左右的全基因組測序數據。這些數據都經過質控和過濾,質量不高的數據已經被剔除,陽性數據也不會放進去,因為我們搭建的是中國健康人群的基因數據庫。”于福利博士介紹道。

據悉,貝瑞基因這個100萬人基因組數據庫已經應用于臨床研究,并利用數據庫的部分數據完成了一些科研項目。于福利博士向測序中國介紹了該數據庫目前的一些應用進展。“鑒于數據安全問題,數據庫目前僅用于貝瑞基因內部臨床研究應用,例如攜帶者篩查。此外在全外顯子組測序、全基因組測序以及其他測序產品中設計中也會用到。我們還與阿里云合作開發了北京和深圳的數據集群和技術平臺。”他表示,根據目前得到的基因數據,他們發現了一些有意思的現象,不同省份有著特定的基因突變頻率,這一發現細化了此前基因突變的地區分布規律。

尤其對于攜帶者篩查研究,這個數據庫更顯用武之地。于博士表示,攜帶者篩查和新生兒代謝性疾病篩查屬于政府項目。根據不同省份的突變頻率,當地政府的政策和資金支持也可以進行針對性地調整,達到節省成本,提高篩查效率,做到精準預防。希望貝瑞基因的研究成果能夠為政府的政策制定提供一些參考信息。

談到國外已有的數據庫,于博士指出,中國人群的基因突變頻率與國外人群存在一定的差異,數據庫不能直接套用,相關產品的研究推廣也存在偏差,所以建立中國人自己的基因數據庫是精準醫療發展的必然。他舉例談到:“對于某些疾病,猶太人群中的基因突變頻率可能比全球人群平均突變頻率高十幾二十倍,但這些突變在中國的臨床中并不常見,所以國內在這些方面的篩查就沒有意義。而我們是利用中國百萬人的基因數據開發相關檢測產品,定位更加準確。”

愿景:實現數據與臨床的互聯互通

隨著測序技術的不斷發展,各領域基因檢測產品也在不斷開發、完善,基因測序數據的獲取也愈加容易。如何讓這些數據產生更大的價值?

對此,于福利博士認為,從國家層面考慮,尤其在國家健康醫療大數據中心的建設中,想要實現基因數據的價值,研發數據共享機制、實現醫聯體數據互聯互通是關鍵。

以某肺癌患者為例。該患者于基層醫院進行影像學檢查和基因檢測后,基層醫院不具備相應治療條件,轉診到上級醫院,由于他的詳細病例沒有向上級醫院開放,還要做同樣重復的檢查。如果建立起醫院間互聯網體系,實現醫聯體互聯互通,上級醫院就可以直接調用下級醫院的數據,進而減少資源浪費、提高診斷治療效率。

于福利博士表示,要想實現數據與臨床真正意義上的互聯互通和數據共享,除了保證數據質量外,還需要遵守兩個原則。

第一個原則是保證數據安全和患者隱私。目前的數據獲得和測序技術不再是瓶頸,而數據安全已經成為重中之重,除了IT層面的數據系統安全措施,如防火墻、數據傳輸加密外,從業人員的職業操守也同樣重要。

第二個原則是數據互通和共享要切實產生附加值,實現互惠互利。在保證數據安全的前提下,研發和臨床數據的整合共享要產生實在的應用價值,為醫療診治和疾病預防產出更高的價值,這也是最為核心的。如經過大量的數據分析,得到與臨床表征相關的基因靶點,由此入手合作開發新藥,將大大加速科學研究與醫療的進步。另一方面,政策推動讓醫院有主觀能動性開放數據資源,互惠互利,有利于高效利用公共資源,實現精準治療、精準預防。

雖然真正意義上的大數據互聯互通尚需一段時間才能實現,但貝瑞基因內部已經在整合檢測技術和數據挖掘上搭建了完整的閉環,對基因檢測技術實現臨床轉化產生了提升和推動作用。?“由基因檢測技術加大數據搭建的閉環能進一步提升技術能力,優化醫療服務功能,提供精準醫療服務,真正實現大數據產業核心價值。”由此,貝瑞基因在福州建立了貝瑞基因數字生命產業園。

布局:下好基因大數據這盤棋

早在2017年7月,貝瑞基因即宣布,擬在福建省福州市濱海新城,投資建設以中國人群致病基因信息庫的大數據為核心的基因大數據中心產業園。根據2018年4月的報道,貝瑞基因建設的醫學檢驗所已完成調試,很快將投入運營。于福利博士表示,貝瑞基因還將在濱海新城建設貝瑞基因數字生命產業園,搭建覆蓋產、學、研、資多維度的生態系統,通過基因檢測技術將生命數字化,最終實現婚前、孕前、產前、新生兒、幼兒、少年、壯年到老年的全生命周期的健康管理。

據悉,位于福州市濱海新城核心區的中國東南大數據產業園由“三園一區”構成,即健康醫療大數據產業園、虛擬現實產業園、大數據融合產業園和融合創新支撐服務區。在這個切實落地的中國第一家國家定位的健康醫療大數據中心中,貝瑞基因是第一家切實落地的基因檢測企業,也在開創基因行業以企業為核心的產業鏈模式。

這是貝瑞基因將閉環的“拉大一些”的必然一步。于福利博士表示:“鑒于測序工作產出的數據量大,在醫院建立數據中心并不劃算。比如一年測一萬個樣本,建設相應的數據中心需要投入四五千萬,而且醫院的后續運營未必能跟上。而福州大數據中心是國家平臺,很多醫院機構都可以使用,數據的互聯互通不是問題,而且不必擔心安全性。目前我們正在探索構建云端數據中心,希望讓數據發揮出最大的價值。”

談及繼福州大數據中心之后,貝瑞基因是否會在其他區域建立數據中心,于福利博士笑言:“我們更關注模式的創新,提升數據附加值,把事做成!”打通大數據的上下通路,才能繼續保持在基因測序領域的領跑地位。貝瑞基因,正積極準備著下一盤布局基因測序行業的大棋。

采訪臨近尾聲,于福利博士對本次精準醫療與基因測序大會表示了極大地肯定,他表示:“明年,歡迎咱們的精準醫療與基因測序大會挪到福州來!”