登录 注册 | 服务热线:400 886 1266 | ENGLISH | 
 
|
您当前的位置:首页 > 产品 > 软件产品 > 数据挖掘软件 > 正文
概述


什么是数据挖掘?

数据挖掘,是在海量的数据当中通过分析和建模,发现数据背后隐藏的模式和微妙的关系,以揭示过去的规律、预测未来的趋势。




  数据挖掘方法可以依据其功能被分成四组:分类预测、聚类、关联规则和时间序列预测。为实现数据挖掘的每一项功能,有许多不同的方法或算法可以使用。

  例如:分类模型可以通过使用决策树、神经网络分类、逻辑回归或概率回归等算法来建立。而这些可归属于统计类或非统计类方法。统计类方法是建立在传统统计理论上的,而非统计类方法则是主要基于神经网络技术上的,每一项功能都可以被开发和修改成为适应商业的应用。比如:分类模型可以被运用到建立目标模型、预选模型、风险模型、流失模型、欺诈预测模型和破产模型。而这些模型可以用来提高市场销售效率、增强风险管理和提高客户管理的效率和效力。




数据挖掘的处理过程

1、业务理解:找问题——确定商业目标,对现有资源进行评估,确定问题是否能够通过数据挖掘来解决,确定数据挖掘的目标,制定数据挖掘计划。
2、数据理解:确定数据挖掘所需要的数据,对数据进行描述和数据的初步探索,检查数据的质量。
3、数据准备:选择数据,清理数据,对数据进行重建,调整数据格式使之适合建模。
4、建立模型:对各个模型进行评价,选择数据挖掘模型并建立模型。
5、模型发布:把数据挖掘模型的结果送到相应的管理人员手中,对模型进行日常监测和维护,定期更新数据挖掘模型。



 
分享到:
查看更多行业成功案例及解决方案