3月19日,國際學術期刊Bioinformatics 在線發表了中國科學院上海生命科學研究院生物化學與細胞生物學研究所系統生物學重點實驗室陳洛南研究組題為Detecting critical state before phase transition of complex biological systems by hidden Markov model 的最新研究成果。該成果展示了通過分析時序列生物數據,建立生物過程相應的隱馬爾科夫模型,同時利用機器學習算法對復雜生物系統動態發展過程中的狀態臨界遷移進行預警的新方法。
基于數據進行復雜系統臨界變化的預測一直是生命科學、環境科學、金融學等領域的研究熱點,大數據時代的來臨更為開發穩定、有效、能夠標識臨界狀態的標志物帶來了新的手段和可能。然而,現實的復雜系統往往具有如下特點:一是容易受到外界噪聲的干擾;二是在系統真正到達臨界點前不會表現出明顯的表型或特征;三是個體差異的普遍存在使得科學家很難找到普適的生物標志物。因此,如何利用個體的時序列動態信息,準確預測系統狀態發生遷移的臨界點,已經成為一個極具科研價值和現實意義的研究熱點。
針對復雜生物過程的時序列數據,陳洛南研究組與華南理工大學劉銳研究組合作開發了一套新的數據處理和分析方法,即:利用隱馬爾科夫模型對數據進行分段刻畫。具體來說,他們根據生物過程發生狀態的動態轉移特點,把生物動態過程劃分成三個階段:轉移前狀態、臨界狀態和轉移后狀態,并把轉移前狀態和轉移后狀態這兩個穩定狀態看作是平穩的馬爾科夫過程(stationary Markov process),把臨界狀態看作是一個時變的馬爾科夫過程(time-varying Markov process),于是把探測將要發生的臨界現象轉化成探測轉移前狀態這個平穩馬爾科夫過程的終點。該方法利用的是機器學習中的非監督學習方法,具有效率高、穩定性強和僅依賴于個體的動態數據等優勢,并能準確捕捉到系統發生狀態變化的預警信號。該方法成功應用在三組生物數據上,成功預警了小鼠肺部急性傷害的臨界期、MCF-7乳腺癌的臨界期以及肝部腫瘤的臨界期。
該研究得到了中國科學院和國家自然科學基金委的經費支持。
運用馬爾科夫模型預測生物系統臨界狀態
標簽:
相關資訊