【原创】 Shuffling

时间:2023-03-09 09:49:49
【原创】 Shuffling

在机器学习领域中,经常会听到“shuffling"这个术语。那么,shuffling到底是什么意思呢。

通常,shuffling指的是在SGD怎样依赖训练数据输入顺序的算法中,将训练数据随机打乱,达到让SGD这样的算法得到与Batch算法类似结果的方法。

【原创】 Shuffling

如上图所示,如果训练数据按1,2,3,...,10,11的顺序输入,采用sgd训练,得到的模型可能一开始是绿线,然后转为红线。而batch算法得到的模型是在红绿之间的一条直线。

那么,是不是所有的算法shuffling都是有效的呢?答案是否定的。

1. 对于batch算法,shuffling无效

2. 对于online算法,有时候我们就是想捕捉趋势的变化,这是,shuffling就是反向效果了。