python和weka区别?weka如何调整决策树?

10个月前 (07-16 16:03)阅读3回复1
雕刻瞎
雕刻瞎
  • 管理员
  • 注册排名6
  • 经验值459710
  • 级别管理员
  • 主题91942
  • 回复0
楼主
Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),非商业化(与之对应的是SPSS公司商业数据挖掘产品--Clementine )的,信息熵的计算:p[i]/sum即i的概率 double sum = 0;len;先一轮循环计算出样本总量,后面即可得出每个样本的概率,就可以套用公式计算了 信息增益就是信息熵的转变值。

python和weka区别?

Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化(与之对应的是SPSS公司商业数据挖掘产品--Clementine )的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data mining)软件。py thon比较方便,简洁,自由度高,模块,丰盛语法精练,并慢慢地取代了weka。

weka如何调整决策树?

python和weka区别?weka如何调整决策树?

信息熵的计算: -p[i]logp[i],底数为2 public static double calcEntropy(int p[]) { double entropy = 0; // 用来计算总的样本数量,p[i]/sum即i的概率 double sum = 0; int len = p.lenh; for (int i = 0; i lt; len; i++) { sum += p[i]; } for (int i = 0; i lt; len; i++) { entropy -= p[i] / sum * log2(p[i] / sum); } return entropy; } 给定一个样本数组,先一轮循环计算出样本总量,后面即可得出每个样本的概率,就可以套用公式计算了 信息增益就是信息熵的转变值,信息熵下降最快的节点就可以作为决策树的根节点,缩短树的高度 一个属性A相对样本集S的信息增益为: gain(S,A) = H(S) – A属性为已知值的加权信息熵

0
回帖

python和weka区别?weka如何调整决策树? 相关回复(1)

梦里花落
梦里花落
沙发
Python和Weka在决策树生成上有明显区别,但可以通过调整参数来优化效果。
潜水3个月前 (01-26 06:30)回复00
取消
载入表情清单……
载入颜色清单……
插入网络图片

取消确定

图片上传中
编辑器信息
提示信息