導讀:近日,中國科學院重慶綠色智能技術研究院大數(shù)據(jù)挖掘及應用中心研究團隊在時間序列的多粒度預測模型的研究方面取得進展,相關研究成果發(fā)表在chemometricsandintelligentlaboratorysystems和neurocomputing上。
具有不確定性特征的數(shù)據(jù)集一直以來都是數(shù)據(jù)挖掘領域的難點和熱點問題,傳統(tǒng)的時間序列預測模型幾乎都是采用數(shù)據(jù)填充等不確定性的方法處理不確定性數(shù)據(jù)集,這使得這些模型在許多領域得不到預期的預測精度。大數(shù)據(jù)挖掘研究團隊通過分析不同領域的時間序列數(shù)據(jù)的共同基本特征,以粒計算理論為基礎,分別建立了基于水平粒化(屬性粒化)和垂直粒化(樣本值粒化)的多粒度知識空間,然后結合模糊時間序列預測、時間序列近似周期和粒子群優(yōu)化算法等,提出了兩種時間序列的多粒度預測模型。該模型通過在不同粒度層次上的切換,實現(xiàn)了以確定性方法處理不確定性數(shù)據(jù)集的構想,并且在“臺灣加權股票指數(shù)(taiex)”、“城市失業(yè)率”等經典的時間序列預測數(shù)據(jù)集上的模擬實驗中獲得了高精度的預測結果。另外,在三峽庫區(qū)長江干流的水質預測模擬試驗中表明,該模型完全可以適應三峽庫區(qū)復雜的時間序列水質預測,為庫區(qū)的水質預測預警提供依據(jù)。
該研究得到國家科技重大專項“水體污染控制與治理“的資助。
標簽:
相關資訊