登录 注册 | 服务热线:400 886 1266 | ENGLISH | 
 
|
理论知识

利用数据挖掘进行税收的深度分析

发布时间:2012-11-22 16:53:56  点击数:2851

税务挖掘的基础数据

1.税务机关内部信息

纳税人属性信息

纳税人基本信息

纳税人项目登记信息

纳税人征管鉴定信息

纳税人行为信息

纳税人申报信息

纳税人纳税信息

纳税人财务信息

发票购领信息

违章信息

税务机关行为信息

稽查信息

2.相关管理机构信息

国家统计局部分数据

国家信息中心部分数据

国家工商部门部分数据


数据挖掘在税收中的应用构想

1.税种关联分析

源自:零售行业的商品销售之间的关联

图书馆查阅资料之间的关联/网上购物之间的关联

构想:税种相当于纳税人的购买商品,税种之间的关联可以得出税种相关的一些潜在规则。

模型:GRI

效果:初步尝试的结果是营业税与城建税、教育附加关联最大,这和业务上的关系是吻合的。但不是我们想要的潜在规则,应该排除业务上的规则,如城建税与教育附加两项,考察内在的税种关联规律。

问题:企业所纳税种不是由企业随意决定的,和企业的性质、行业以及政策都有关系,这种分析的意义和价值不大,且结果不能进行很好的解释。


2.企业经营纳税行为的关联分析

构想:通过制定一系列规则判断企业在经营、纳税方面的异常行为,通过异常行为的关联尽可能的挖出企业的问题所在。如企业本期的管理费用增加较多,是否同时具有利润降低、纳税减少等避税问题。

问题:这些规则之间已经存在一定的关联性,如何确定规则是一个更为复杂的问题。


3.异常纳税人聚类分析

源自:哪些病人具有相同的特征/股票板块的聚类找出最具实力的龙头板块

构想:通过多个规则判断出一批异常纳税户,进行聚类分析,再分类采取措施。

模型:Kohenen /K_mean/Two step

问题:还没有做过尝试,重点是前期规则判断。


4.纳税企业信用评价的因子分析模型

源自:客户满意度的因子分析/公司业绩评价

构想:列举纳税企业的各种属性,包括企业的基本属性、纳税信息、财务各指标信息等进行因子分析,最终归结为几个重点影响因子,作为企业评价的组成部分。

模型:PCA/Factor

问题:企业的这些属性之间类别比较明显,得到的结果是否有意义或者是否便于解释?


5.潜在纳税收入挖掘

源自:潜在市场细分

构想:把具有偷漏税嫌疑的企业进行细分,聚焦那些可以通过加强征管避免损失的企业。

模型:CHAID

问题:关键是提取进行市场细分的变量。


6.异常企业检测

源自:异常病例检测

构想:对重点税源进行异常检测

模型:Anomaly

问题:还没有尝试,应选取什么变量尚没有确定。


7.企业纳税收入预警分析

源自:促销政策的选择,预测的收入比实际收入的差异越大,促销正常越好。

构想:纳税人实际税收与预测的收入之间的差异越大,偷漏税嫌疑越大,为稽查选案缩小范围。

分两步走,第一步预测企业的下一期的纳税税收,建立回归模型,企业的税收作为因变量,用企业的基本属性等信息作为自变量,预测收入。第二步,计算预测收入与实际收入的差别,划定差别较大的范围。

模型:回归、神经网络

问题:对预测的精度要求较大,模型的精度不够好的话此方法的实际意义不大。

此外,涉及到企业的收入预测,时间范围的划定和自变量的选择都比较重要。


 
分享到:
查看更多行业成功案例及解决方案