需要實時流計算。各種實時警告或預測不再僅僅是基于某個閾值,而是需要通過一個或多個設備生成的數據流的實時聚合來計算,而不僅僅是基于時間點,而是基于時間窗口。不僅如此,計算要求也非常復雜,因方案而異,因此應允許使用用戶定義的函數進行計算。
需要在操作員級別提供高度可靠的服務。物聯網系統通常連接到生產和操作系統。如果數據處理系統出現故障,將直接導致停產,從而導致經濟損失并導致無法向最終用戶提供服務。例如,智能電表,如果系統出現故障,將直接導致成千上萬的家庭無法正常用電。因此,物聯網大數據系統必須高度可靠,必須支持實時數據備份,必須支持遠程容災,必須支持軟件和硬件在線升級,必須支持在線IDC機房遷移,否則服務必須中斷。
實時數據和歷史數據的處理必須合并為一個。實時數據在高速緩存中,歷史數據在持久性存儲介質中,并且可以根據持續時間保留在不同的存儲介質中。系統應將存儲隱藏在其后方,并向用戶和應用程序提供相同的接口和接口。無論是訪問十年前的新數據還是舊數據,除了輸入的時間參數不同外,其余都應該相同。
需要提供靈活的數據管理策略。大型系統具有廣泛的收集數據,除了收集的原始數據外,還存在大量的派生數據。這些數據中的每一個都有不同的特征,一些數據收集頻繁,某些數據需要較長的保留時間,某些數據需要多個副本以確保更高的安全性,而某些數據則需要快速訪問。因此,物聯網大數據平臺必須提供多種策略,允許用戶根據自己的特點進行選擇和配置,多種策略共存。