登录 注册 | 服务热线:400 886 1266 | ENGLISH | 
 
|
您当前的位置:首页 > 产品 > 软件产品 > 数据质量校核软件 > 正文
概述

  数据是否可用和可信,是用户对数据最关心的两个层面。

   可用是技术层面的问题,通过技术手段使数据规范化、格式化,按照规定要求组织和存放,数据就能达到可用。

   可信是数据的质量问题,涉及多方面要素,需要通过采取管理手段、建立数据质量监控系统等技术手段等来努力来解决。

  


   据了解,目前大部分数据质量监控系统一般采用的是SQL拼接的方式来进行数据质量检查,这种校核方式存在以下弊端:

基于SQL查询比对进行数据质量管理,技术门槛高,数据质量的问题大多来源于业务部门,而业务部门难于操作SQL查询,技术门槛成为数据质量校核的一大瓶颈。

基于SQL的查询比对基本是基于命令行的操作,参数选择和任务配置较为繁琐,很难实现灵活的模型管理和任务流调度管理,系统架构较为死板,灵活性与开放性均较差。

数据质量校核的模型管理没有专业的工具来进行,只能借助数据库的现有的工具来进行,当模型数量增加时,管理较为吃力。


业务变动或者新增需求时模型的修改与新建较为繁琐。



很难进行基于统计意义的数据质量校核,例如孤立点探测,离群值探测等等。

 
分享到:
查看更多行业成功案例及解决方案