数据挖掘:实用机器学习技术P295页:

时间:2023-11-28 09:53:50

数据挖掘:实用机器学习技术P295页:

在weka软件中的实验者界面中,新建好实验项目后,添加相应的实验数据,然后添加对应需要的分类算法 ,需要使用多个算法时候重复操作添加add algorithm。再选择run标签卡中,选择start按钮,最后选择analysis选项卡,然后再在右上角点选experiment按钮,再点选perform test按钮,随后,之前添加的第一个算法就会和第二个与第三个算法的比较结果有关性能的统计显著性测试的结果就显示在右侧的空白面板中了。

数据挖掘:实用机器学习技术P295页:

我们比较的是百分比准确率统计:这是由上图左侧的比较字段默认选定的。三种学习方案是作为一个小表哥的表土水平排列的,分别用带有括号的数字标号来表示的。在iris行开始的括号中的值(100)是实验的运行次数:10次10折交叉验证。

三个方案的百分比正确显示在右侧的白板中:方案一是94.73%,方案二是92.53%,方案三十33.33%。结果旁边的符号(V和*)指明该结果在所指定的统计显著性水平上(当前是0.05,或者5%),好于(V)还是差于(*)基准方案,在本例中基准方案是J4.8。方案三明显要比方案一差,因为方案三的陈功率旁边有星星标记。在第二列和第三列的地步时放阿玉你先弄个次数的计数数量(x/y/z),其中,(x)表示该方案在本实验中的数据集上的性能好于基准方案的次数,(y)代表而这性能一样,(z)是其性能差于基准方案的次数。在本例中只使用了一个数据及,方案二有一次与方案一(基准方案)相等,而方案三则一次比方案一差。(注释(v/ /*)放在第一列的底部,帮助用户记忆三种计数数量x/y/z的含义。)