数据治理是新型政务数据共享交换平台稳健、高效运行的基础保障。分布式数据治理技术课题的主要研究内容包括:
ü 针对当前数据治理存在的体系不明晰、与实际平台相偏离等问题,立足平台实际需求,研究构建实用的数据治理体系,明晰核心治理内容,提供技术建议,使得数据治理有纲可依。
ü 针对数据家底不清楚、人工授权管控效率低等问题,研究提出基于数据时空地图和关联关系挖掘的分布式数据全生命周期应用管控方法,使得平台数据在空间上可定位、时间上可追溯;通过对数据和用户分类分层,实现数据资源与需求自动匹配授权,提高数据应用管控的效率和一致性。
ü 针对跨源异构数据检索计算效率低、响应不及时等问题,研究提出基于HiveMetaStore的数据检索计算方法,提高响应速度,改善用户体验。
ü 针对数据治理和平台效能欠评价、迭代升级缺依据等问题,从主客观、动静态等多个维度研究设计效能评价指标,提出基于熵值和层次分析的综合效能评估方法,支撑平台迭代优化。
本课题构建形成了 “1个体系”+“2项核心支撑点”+“1面效能评估验证”的分布式数据治理闭环框架,可为新型政务数据共享交换平台的建设运行和优化升级提供理论技术保障。
图1 课题研究框架
图2 课题核心内容
图3 课题研究团队