Pentaho中国爱好者社区   Pentaho 授权经销商

 找回密码
 申请账户

用新浪微博连接

一步搞定

搜索
热搜: 活动 交友 discuz

Pentaho数据挖掘和预测分析--成本/收益分析

2012-8-17 15:49| 发布者: admin| 查看: 4454| 评论: 0

摘要: Pentaho的数据挖掘是一套基于Weka,全面的数据挖掘工具。其广泛的分类,回归,关联规则,聚类算法的套件,额可以帮助客户更好的了解业务,同时也可以通过预测分析来改善将来的业绩。 以下是部分截图: 成本/ ...

Pentaho的数据挖掘是一套基于Weka,全面的数据挖掘工具。其广泛的分类,回归,关联规则,聚类算法等套件可以帮助客户更好的了解业务,同时也可以通过预测分析来改善未来的业绩。

以下是部分截图:

 

 

 

成本/收益分析工具可以在ExploerKnowledge Flow用户界面里进行操作。下面的图例展示的是在直邮应用程序里用Knowledge Flow建立一个预测模型。图例中的数据是一个慈善机构发出募捐邮件的历史数据。该数据集有47,706条记录和476个标量(捐助者捐赠记录,覆盖人口的等)。数据显示捐赠者比例近5%。在Navi Bayes分类里用10倍交叉验证法做预测分析,然后将这些预测发送到成本/收益分析工具。

 

 

成本/收益分析工具显示如下图。该工具左侧显示的是一个累积收益图表。右侧是某个成本/收益的情况。客户可以拖动滑块来研究与各种人口子集,各级撤销(目标的比例)或各种正面预测可能性的临界值等相关的成本/收益。可能会产生的成本/收益也会显示出来。

 

 

在直邮数据集的例子里,平均捐赠额为15.75美元和邮寄成本为0.68美元。我们可以把这些值输入到成本模型里,研究邮寄到各种人口子集所产生的利益。点击“最大化成本/收益按钮,系统会自动分析发多少邮件可以获得最大化利益。我们可以看到,发出人口数量50.74%的邮件可以获得最高10,235.52美元的收益。

 

所有Weka临界值曲线类型都适用于成本/收益工具。

本文为Pentaho官方认证合作伙伴翻译稿,若需转载和引用请注明文章来源于PentahoChina中国爱好者社区

 

 

1

鲜花

握手

雷人

路过

鸡蛋

刚表态过的朋友 (1 人)

Pentaho 技术支持电话: 13716483677 (Jason)       Pentaho 技术支持QQ:2253715

联系邮箱|Archiver|Pentaho中国爱好者社区 ( 京ICP备12007697号-2 )

GMT+8, 2017-9-20 22:49 , Processed in 0.021997 second(s), 11 queries .

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部