近日,中國科學院重慶綠色智能技術研究院大數據挖掘及應用中心研究團隊在時間序列的多粒度預測模型的研究方面取得進展,相關研究成果發表在Chemometrics and Intelligent Laboratory Systems 和Neurocomputing上。
具有不確定性特征的數據集一直以來都是數據挖掘領域的難點和熱點問題,傳統的時間序列預測模型幾乎都是采用數據填充等不確定性的方法處理不確定性數據集,這使得這些模型在許多領域得不到預期的預測精度。大數據挖掘研究團隊通過分析不同領域的時間序列數據的共同基本特征,以粒計算理論為基礎,分別建立了基于水平粒化(屬性粒化)和垂直粒化(樣本值粒化)的多粒度知識空間,然后結合模糊時間序列預測、時間序列近似周期和粒子群優化算法等,提出了兩種時間序列的多粒度預測模型。該模型通過在不同粒度層次上的切換,實現了以確定性方法處理不確定性數據集的構想,并且在“臺灣加權股票指數(TAIEX)”、“城市失業率”等經典的時間序列預測數據集上的模擬實驗中獲得了高精度的預測結果。另外,在三峽庫區長江干流的水質預測模擬試驗中表明,該模型完全可以適應三峽庫區復雜的時間序列水質預測,為庫區的水質預測預警提供依據。
該研究得到國家科技重大專項“水體污染控制與治理”(2014ZX07104-006)的資助。
標簽:
相關資訊