Apache-Web-Log-Analysis-Spark

时间:2024-05-24 02:34:05
【文件属性】:

文件名称:Apache-Web-Log-Analysis-Spark

文件大小:4KB

文件格式:ZIP

更新时间:2024-05-24 02:34:05

Python

使用Spark进行Web服务器日志分析 该程序说明了如何在真实的基于文本的生产日志上使用Apache Spark。 数据文件:Apache通用日志格式(CLF) CLF中生成的日志文件条目将如下所示: 127.0.0.1 - - [01/Aug/1995:00:00:01 -0400] "GET /images/launch-logo.gif HTTP/1.0" 200 1839 详细信息-> 为什么选择星火 服务器日志分析是Spark的理想用例。 它是一个非常大的通用数据源,并且包含一组丰富的信息。 Spark允许您将日志便宜地存储在磁盘上的文件中,同时仍然提供一种快速,简单的方式对它们执行数据分析。 潜在的应用 日志数据来自许多来源,例如Web,文件和计算服务器,应用程序日志,用户生成的内容,可用于监视服务器,改善业务和客户智能,构建推荐系统,欺诈检测等。


【文件预览】:
Apache-Web-Log-Analysis-Spark-master
----apache_log_spark.py(9KB)
----README.md(1012B)

网友评论