data-balance:玩自制的数据平衡技术

时间:2024-06-06 10:01:01
【文件属性】:

文件名称:data-balance:玩自制的数据平衡技术

文件大小:14KB

文件格式:ZIP

更新时间:2024-06-06 10:01:01

Python

数据平衡 在此仓库中,我将探索各种数据集平衡技术。 问题说明 在这个问题中,我们可以看到整个MNIST训练集(无标签),我们可以随意使用它。 然后,我们得到了测试集的不平衡子集。 例如,可能给我们1000 2s和100 3s。 我们的目标是利用我们在训练集中的知识对测试集中的样本进行加权,以使所有类别的总权重相似。 结果 平衡器的工作不如我所希望的那样,但是它们几乎都比随机的要好得多。 下表显示了每行中的不同任务,并给出了结果的重新加权的类熵。 类别熵衡量从重新加权分布平均编码样本类别所需的信息位数。 对于两个类别,最大值为ln(2)〜= 0.69。 任务 制服 密度 沃罗诺伊 box_voronoi smooth_voronoi 簇 de 2,3(平衡) 0.693 0.686 0.693 0.685 0.689 0.692 0.690 2(x2),3(x1)


【文件预览】:
data-balance-master
----data_balance()
--------vae.py(3KB)
--------pixel_rnn.py(3KB)
--------__init__.py(41B)
--------balance.py(9KB)
--------data.py(3KB)
----run_pixel_rnn.py(4KB)
----run_plots.py(1003B)
----setup.py(388B)
----.gitignore(26B)
----run_vae.py(6KB)
----README.md(2KB)
----run_balancers.py(3KB)

网友评论