1、原始数据种类多样,格式zd、位置、存储、时效性等迥异。数据收集从异构数据源中收集数据并转换成相应的格式方便处理。
2、收集好的数据需要根据成本、格式、查询、业务逻辑等需求,存放在合适的存储中,方便进一步的分析。
3、原始数据需要变形与增强之后才适合分析,比如网页日志中把IP地址替换成省市、传感器数据的纠错、用户行为统计等。
4、通过整理好的数据分权析what happened、wh鲻戟缒男y it happened、what is happening和what will happen,帮助企业决策。