近半年来,都一直想研究下Hadoop和mahout的源码。但是,犹豫来犹豫去的都迟迟没有动静。眨眼睛毕业半年了,现在因公司业务需求,需要调研下数据挖掘相关的技术。在工作的压力下,开始慢慢的掀开Hadoop和mahout等这些分布式开源软件的源码的研究之路。
其实,真的没自己想象的那么难。与其不断的去等待一个完美的时间开始,还不如立马动手研究。我记得在我们IT界,有这么一句话,跑出来"Hello World!"就学会了50%。之前感觉这句话,有点扯淡,但是现在想想,的确对于我们IT人士来说还是蛮对的。开始就相对于成功了一半;没有跨出第一步,永远不可能学会,更别谈搞懂了。
在这里写下这篇文章记录下自己的一些思考。分享下自己一些想法,感觉挺好的。只要开始去做了,其实一切都没想的那么难。后续,我将会在这里分享我对mahout里面数据挖掘算法和hadoop等开源软件的学习研究和理解。
相关文章
- 用了那么久居然没发现firefox快捷键有如此多
- 外企面试,哪有你想象的那么难!(已收埃森哲、NTTDATA等8家外企offer)
- 全站 HTTPS 没你想象的那么简单
- 做SOL交易机器人拆解步骤,其实没有那么复杂。
- JAVA反射其实就是那么一回事
- iOS没你想的那么安全?
- BIND简易教程(0):在Ubuntu下源码安装BIND(其实跟前面的教程没太大关系)
- 报表中的多维数据分析,并没有你想象的那么难!
- 原来提升一个数据库的性能并没有那么难!TiDB 性能挑战赛完结撒花
- CVE-2024-3094:Linux生态供应链攻击-CVE-2024-3094:供应链攻击? 一个潜伏3年只为通杀的漏洞,今天更新了一个CVE漏洞,XZ-utils5.6.0/5.6.1版本后门风险(CVE-2024-3094)这个后门并非作者无意加入的,也不是引入存在后门的库文件导致的问题,而是有人经过三年的潜伏,积极参与该项目的维护,在获得了直接commit代码的权限以后将后门代码注入其中。 这个代码一共存活了不到2个月的时间,发现者是PostgreSQL 开发人员兼软件工程师 Andres Freund 意外发现的,在观察到 liblzma(xz 包的一部分)Debian sid(使用 ssh 登录占用了大量 CPU,valgrind 错误,然后找见了上游 xz 存储库和 xz tarball 已被后门。 幸运的是,xz 5.6.0 和 5.6.1 尚未被 Linux 发行版广泛集成,而且大部分是在预发行版本中。 但是kali linux如果每周更新或者最近3月26到29号之间更新了,不好意思。 根据kali官方说法希望更新, 首先我们apt-cache policy liblzma5 更新命令 sudo apt update && sudo apt install -y --only-upgrade liblzma5 更新 难的追一回滚动更新就这样玩吗?看来以后也不要追最新的。 当然我们还可以cat /var/log/apt/history.log 查看更新时间和都更新了哪些内容! 附: 各大linux系统可以查看自己对应的系统,查看官网说明 比如我的kali可以直接在https://www.kali.org/blog/about-the-xz-backdoor/看到 当然了这个供应链后门只能说差一点就完美成功,因为他写的有bug在sshd运行的时候直接cpu飙升,引起了研究员的注意,否则如果在发行版中大规模集成,估计可以造成linux的一个通杀,现在只是在预发行版中,但是更新快的比如kali linux中如果滚动更新那么就会被影响到。 参考链接: