Link: 分布式机器学习系列讲座 - 04 Deep Learning
WANG Yi.
- https://cxwangyi.wordpress.com/
- https://www.zhihu.com/people/wang-yi-21/answers
- http://cxwangyi.github.io/
该系列视频信息量巨大,有空慢慢消化。
Kernel machine, such as SVM
但互联网没有低维数据,不可行。
维度越高,线性反而“更可能”可分。
降维的重要性。
01 Infrequent Pattern Mining using MapReduce
https://www.youtube.com/watch?v=eCrhaUCqiiE&t=112s 12:00
Mahout pfp
FP-tree
识别猫:Gobar filter的重要性。
Deep learning的本质:feature engineering,feature结构层次的挖掘是最重要的工作之一。
Concept Hierarchy: http://people.cs.umass.edu/~mccallum/papers/pam-icml06.pdf
PAM: pachinko allocation model
LDA 与 DEEP LEARNING的关系
- Stacking RBM variants over and over.
- Just like stacking LDA over and over.