由一个简单需求到Linux环境下的syslog、unix domain socket

时间:2022-09-17 17:30:39

  本文记录了因为一个简单的日志需求,继而对linux环境下syslog、rsyslog、unix domain socket的学习。本文关注使用层面,并不涉及rsyslog的实现原理,感兴趣的读者可以参考rsyslog官网。另外,本文实验的环境实在debian8,如果是其他linux发行版本或者debian的其他版本,可能会稍微有些差异。

需求:

  工作中有一个在Linux(debian8)环境下运行的服务器程序,用python语言实现,代码中有不同优先级的日志需要记录,开发的时候都是使用python的logging模块输出到文件,示例代码如下:

  

 import logging, os

 logger = None
def get_logger():
global logger
if not logger:
logger = logging.getLogger('ServerLog')
logger.setLevel(logging.INFO)
filehandler = logging.FileHandler(os.environ['HOME'] + '/Server.log', encoding='utf8')
filehandler.setFormatter(logging.Formatter("%(asctime)s - %(levelname)s - %(message)s"))
logger.addHandler(filehandler)
return logger def some_func():
get_logger().info("call some_func") if __name__ == '__main__':
some_func()

  运行上面这段代码,就会在home目录下面产生一个server.log文件。

  后来数据分析的部门说他们希望能够实时拿到一部分日志,他们有一台专门处理日志的服务器,那么怎么把日志发给他们呢?笔者之前并没有相关经验,数据分析部门的同事说,这种需求他们都是找运维人员帮忙。运维同事给出的方案很简单:产品把日志写到syslog,然后他们负责把带有某些关键字的日志转发给数据分析部门,在运维同事的指导下,把代码改成了这样:

 import logging
import logging.handlers logger = None
def get_logger():
global logger
if not logger:
logger = logging.getLogger('ServerLog')
logger.setLevel(logging.INFO) sys_handler = logging.handlers.SysLogHandler('/dev/log', facility=logging.handlers.SysLogHandler.LOG_LOCAL0)
syslog_tag = 'ServerLog'
sys_handler.setFormatter(logging.Formatter(syslog_tag + ":%(asctime)s - %(name)s - %(levelname)s - %(message)s")) logger.addHandler(sys_handler)
return logger def some_func():
get_logger().info("call some_func") if __name__ == '__main__':
some_func()

  上面的代码修改了日志的输出形式,直观的感受就是从文件server.log 到了 /dev/log,但/dev/log对应的是SysLogHandler,并不是FileHandler,所以肯定不是一个普通的文件。此时,我有两个疑问:第一,这里我并没有将日志输出到home目录下的Server.log文件,但是程序运行的时候生成了这么一个文件;第二,怎么讲日志发送到数据分析部门的服务器。

  不懂就问:

  Q:新的代码下怎么生成Server.log文件,日志内容又是怎么转发到数据分析部门的服务器?

  A:  这个是/etc/init.d/rsyslog这个后台程序根据/etc/rsyslog.conf 这个配置文件 将日志输出到不同的文件,包括网络文件,即其他服务器。看/etc/rsyslog.conf这个配置就明白了。

  Q:OK,那python代码将文件输出到/dev/log跟 rsyslog又是什么关系呢?

  A:python的sysloghandler会将日志发送到rsyslog,他们之间使用unix domain socket通信,具体看logging模块的源码就知道了

unix domain socket:

  按照上面的对话的意思,python程序先将日志发送给rsyslog这个程序,然后rsyslog再处理收到的日志数据,所以先看logging代码:

  SysLogHandler这个类在logging.handlers.py, 核心代码如下:

     def __init__(self, address=('localhost', SYSLOG_UDP_PORT),
facility=LOG_USER, socktype=socket.SOCK_DGRAM):
"""
Initialize a handler. If address is specified as a string, a UNIX socket is used. To log to a
local syslogd, "SysLogHandler(address="/dev/log")" can be used.
If facility is not specified, LOG_USER is used.
"""
logging.Handler.__init__(self) self.address = address
self.facility = facility
self.socktype = socktype if isinstance(address, basestring):
self.unixsocket = 1
self._connect_unixsocket(address)
else:
self.unixsocket = 0
self.socket = socket.socket(socket.AF_INET, socktype)
if socktype == socket.SOCK_STREAM:
self.socket.connect(address)
self.formatter = None def _connect_unixsocket(self, address):
self.socket = socket.socket(socket.AF_UNIX, socket.SOCK_DGRAM)
# syslog may require either DGRAM or STREAM sockets
try:
self.socket.connect(address)
except socket.error:
self.socket.close()
self.socket = socket.socket(socket.AF_UNIX, socket.SOCK_STREAM)
self.socket.connect(address)

  在__init__.doc里面写得很清楚,如果address是一个字符串(默认值是一个tuple),那么会建立一个unix socket(unix domain socket)。如果address为“/dev/log”(正如我们之前的python代码),那么输出到本机的syslogd程序。另外,在第27行 self.socket = socket.socket(socket.AF_UNIX, socket.SOCK_DGRAM) socket.socket的第一个参数family 的值为AF_UNIX,而不是我们经常使用的AF_INET(IPV4)或者AF_INET6(IPV6)。那么什么是unix domain socket呢?

  

  unix domain socket是进程间通信(IPC:inter-process communication)的一种方式,其他还有管道、命名管道、消息队列、共享内存、socket之类的。unix domain socket与平常使用的socket(狭义的internet socket)有什么区别呢,那就是unix domain socket只能在同一台主机上的进程之间通信,普通的socket也可以通过'localhost'来在同一台主机通信,那么unix domain socket有哪些优势呢?

  第一:不需要经过网络协议栈

  第二:不需要打包拆包、计算校验和、维护序号和应答等

  所以,优势就是性能好,一个字,快。

  下面用一个简单的服务器客户端例子来看看unix domain socket的使用方法与过程:

  服务器:uds_server.py

 ADDR = '/tmp/uds_tmp'

 import socket, os

 def main():
try:
sock = socket.socket(socket.AF_UNIX, socket.SOCK_STREAM)
if os.path.exists(ADDR):
os.unlink(ADDR)
sock.bind(ADDR)
sock.listen(5)
while True:
connection, address = sock.accept()
print "Data : %s" % connection.recv(1024);
connection.send("hello uds client")
connection.close()
finally:
sock.close() if __name__ == '__main__':
main()

  客户端:uds_client.py

 ADDR = '/tmp/uds_tmp'

 import socket

 def main():
sock = socket.socket(socket.AF_UNIX, socket.SOCK_STREAM)
sock.connect(ADDR)
sock.send('hello unix domain socket server')
print 'client recieve', sock.recv(1024)
sock.close() if __name__ == '__main__':
main()

  首先:运行服务器 python uds_server.py,这个时候在/tmp 目录下产生了文件,用ls查看详细信息如下:

  由一个简单需求到Linux环境下的syslog、unix domain socket

  可以看到,文件类型(第一个字段)为s,代表socket文件。(PS: 如果进程间用命令管道通信,也是利用中间文件,ls显示的文件类型为p)

  运行客户端 python uds_client.py,在客户端和服务器端都有相应的输出,使用方法与普通socket没有什么大的差异。

日志转发流程:

  在了解了unix domain socket这个概念之后,下面就比较简单了,首先是/dev/log这个文件,我们用ls来查看这个文件的信息

  由一个简单需求到Linux环境下的syslog、unix domain socket

  可以看到这个文件是一个符号链接文件,真实的文件是/run/systemd/journal/dev-log, 那么再来查看这个文件

  由一个简单需求到Linux环境下的syslog、unix domain socket

  ok,是一个socket文件,复合预期,按照之前的unix domain socket的例子,rsyslog也应该咋这个文件上监听,我们来看看

  由一个简单需求到Linux环境下的syslog、unix domain socket

  lsof fd可以列出所有使用了这个文件(linux下文件的概念比较宽泛)的进程,事实上我们看到只有systemd和systemd-j两个不明所以的进程。那么直接看看rsyslog使用的unix domain socket吧

  由一个简单需求到Linux环境下的syslog、unix domain socket

由一个简单需求到Linux环境下的syslog、unix domain socket

  额,可以看到rsyslogd使用的socket domain socket是/run/systemd/journal/syslog,并不是/run/systemd/journal/dev-log,这两个文件在同一个目录下,那么再来看看还有哪些进程使用了/run/systemd/journal/syslog。

  由一个简单需求到Linux环境下的syslog、unix domain socket

  so,systemd和rsyslogd都使用了这个文件,感觉像是应用进程(e.g. 上面的python程序)将日志通过/run/systemd/journal/dev-log(/dev/log背后真正的文件)发送到systemd, 然后systemd 再将日志通过/run/systemd/journal/syslog发送到rsyslogd,是不是这样呢,google了一下,发现了这篇文章understand-logging-in-linux,确实是这么一个过程:

  

systemd has a single monolithic log management program, systemd-journald. This runs as a service managed by systemd.

  • It reads /dev/kmsg for kernel log data.
  • It reads /dev/log (a symbolic link to /run/systemd/journal/dev-log) for application log data from the GNU C library's syslog() function.
  • It listens on the AF_LOCAL stream socket at /run/systemd/journal/stdout for log data coming from systemd-managed services.
  • It listens on the AF_LOCAL datagram socket at /run/systemd/journal/socket for log data coming from programs that speak the systemd-specific journal protocol (i.e. sd_journal_sendv() et al.).
  • It mixes these all together.
  • It writes to a set of system-wide and per-user journal files, in /run/log/journal/ or /var/log/journal/.
  • If it can connect (as a client) to an AF_LOCAL datagram socket at /run/systemd/journal/syslogit writes journal data there, if forwarding to syslog is configured.

  

  ok,到现在为止,我们知道了应用程序的日志是怎么转发到rsyslog,那么rsyslog怎么处理接收到的日志,秘密就在/etc/rsyslog.conf, 在打开这个配置文件之前,我们先看看rsyslog官网的简单描述:

  RSYSLOG is the rocket-fast system for log processing.

  原来R是rocket-fast的意思!火箭一般快!官网声称每秒可以处理百万级别的日志。rsyslogd在部分linux环境是默认的syslogd程序(至少在笔者的机器上),d是daemon的意思,后台进程。系统启动的时候就会启动该进程来处理日志(包括操作系统自身和用户进程的日志)。打开修改过的/etc/rsyslog.conf, 接下来就是见证奇迹的时刻

  由一个简单需求到Linux环境下的syslog、unix domain socket

  原来一举一动都在监控之中。这个文件是系统提供的,直接在这个文件上做修改显然不是明智之举。如上图红色部分,可以再rysyslog.d文件夹下增加自己的配置文件,定制日志过滤规则。那么看看的rsyslog.d文件夹下新增的tmp.conf

 $FileOwner USERNAME
$FileGroup USERNAME
$FileCreateMode 0644
$DirCreateMode 0755
$Umask 0022
$template serverLog,"/home/USERNAME/Server.log"
$template LogFormat,"%msg%\n"
if $syslogfacility-text == 'local0' and $syslogtag contains 'ServerLog' then -?serverLog;LogFormat #if $syslogfacility-text == 'local0' and $syslogtag contains 'ServerLog' then @someip:port
& stop

  再来回顾一下对应的应用代码:

 import logging
import logging.handlers logger = None
def get_logger():
global logger
if not logger:
logger = logging.getLogger('ServerLog')
logger.setLevel(logging.INFO) sys_handler = logging.handlers.SysLogHandler('/dev/log', facility=logging.handlers.SysLogHandler.LOG_LOCAL0)
syslog_tag = 'ServerLog'
sys_handler.setFormatter(logging.Formatter(syslog_tag + ":%(asctime)s - %(name)s - %(levelname)s - %(message)s")) logger.addHandler(sys_handler)
return logger def some_func():
get_logger().info("call some_func") if __name__ == '__main__':
some_func()

  注意:配置文件需要与应用代码配合,比如代码中第11行 facility=logging.handlers.SysLogHandler.LOG_LOCAL0 与 配置中 $syslogfacility-text == 'local0' 相对应;代码第12行 syslog_tag = 'ServerLog' 与 配置文件 $syslogtag contains 'ServerLog' 对应。关于python代码中syslogtag的设置,参考了*上的这个问答

  当我们修改了配置时候需要通过命令 /etc/init.d/rsyslog restart 来重启rsyslogd,重启之后再运行之前的python文件,就可以了。

  由一个简单需求到Linux环境下的syslog、unix domain socket

发送到远端服务器:

  上面的tmp.conf文件注释掉了第10行,这一行的作用是将满足条件的日志发送到指定的其他机器上,IP:Port用来指定接受日志的远端rsyslogd程序。默认情况下rsyslogd在514端口监听。假设我需要给局域网内10.240.10.10发送syslog,第10行改成这样就行了:

if $syslogfacility-text == 'local0' and $syslogtag contains 'ServerLog' then @10.240.10.10

  那么10.240.10.10主要开启rsyslogd的远程监听,并指定远端日志的输出规则,for example:

  由一个简单需求到Linux环境下的syslog、unix domain socket

  这个配置,让rsyslogd使用UDP和TCP协议同时在514端口上监听,并将非本机的日志输出到对应远端主机名的文件。注意,以上修改 都需要重启rsyslogd才能生效。

总结:

  日志从应用程序到最终的日志文件(或者远程服务器)的流程如下:

  由一个简单需求到Linux环境下的syslog、unix domain socket

  

references:

inter-process communication

unix domain socket

understand-logging-in-linux

在 Linux 上配置一个 syslog 服务器

由一个简单需求到Linux环境下的syslog、unix domain socket的更多相关文章

  1. java 在linux环境下写入 syslog 问题研究

    1.Syslog 在Unix类操作系统上,syslog广泛应用于系统日志.syslog日志消息既可以记录在本地文件中,也可以通过网络发送到接收syslog的服务器.接收syslog的服务器可以对多个设 ...

  2. linux一切皆文件之Unix domain socket描述符(二)

    一.知识准备 1.在linux中,一切皆为文件,所有不同种类的类型都被抽象成文件(比如:块设备,socket套接字,pipe队列) 2.操作这些不同的类型就像操作文件一样,比如增删改查等 3.主要用于 ...

  3. Nginx学习——Nginx简单介绍和Linux环境下的安装

    一:Nginx的简介 百科百科:Nginx Nginx 是一个俄罗斯的哥们开发的,并将其进行了开源. Nginx是一款轻量级的Web 服务器/反向代理服务器及电子邮件(IMAP/POP3)代理服务器, ...

  4. Linux环境下用C语言实现socket 通信---简单代码

    Socket编程实例: 服务器端:一直监听本机的8000号端口,如果收到连接请求,将接收请求并接收客户端发来的消息,并向客户端返回消息. 客户端:client.c /* File Name: clie ...

  5. libpqxx接口的在linux下的使用,解决psql:connections on Unix domain socket "/tmp/.s.PGSQL.5432"错误

    在项目中使用postgresql数据库时要求在windows和linux双平台兼容.于是在windows下使用的接口在linux下爆出异常: psql:connections on Unix doma ...

  6. Linux环境下部署完JDK后运行一个简单的Java程序

    前言 前一篇文章详细讲解了如何在Windows环境下安装虚拟机+Linux系统,并且成功部署了JDK. 不过部署完JDK之后,我们判断部署是否成功的依据是看"java -version&qu ...

  7. Linux环境下C语言线程创建---简单代码

    在Linux环境下用C语言编写线程创建. //file name: pthreadtext.c #include <stdio.h> #include <pthread.h> ...

  8. 【云和恩墨】性能优化:Linux环境下合理配置大内存页&lpar;HugePage&rpar;

    原创 2016-09-12 熊军 [云和恩墨]性能优化:Linux环境下合理配置大内存页(HugePage)   熊军(老熊) 云和恩墨西区总经理 Oracle ACED,ACOUG核心会员 PC S ...

  9. PHP 命令行模式实战之cli&plus;mysql 模拟队列批量发送邮件&lpar;在Linux环境下PHP 异步执行脚本发送事件通知消息实际案例&rpar;

    源码地址:https://github.com/Tinywan/PHP_Experience 测试环境配置: 环境:Windows 7系统 .PHP7.0.Apache服务器 PHP框架:ThinkP ...

随机推荐

  1. 使用Github Pages创建自己的网站

    这是一篇使用Github Pages创建自己网站的教程,操作很简单,相信,亲们肯定一学就会,但是大家也要有一定的github基础呀,所以小编给大家附上一个链接(http://www.cnblogs.c ...

  2. CSU 1060 Nearest Sequence

    题意:求三个序列的最长公共子序列. 思路:一开始以为只要求出前两个的LCS,然后和第三个再求一遍LCS就是答案了.但是样例就对我进行啪啪啪打脸了.实际上就跟两个序列的差不多,换成三维的就行了. 代码: ...

  3. 二级联动banner【墨芈原创,大神勿喷】

    这个banner效果在几个月前都做了,不过因为代码添乱,而且不宜调用就没发布,经过2周时间间间断断的编写,插件终于搞定了,除框架外其它都开源发布,至于框架没给源码是因为还没做好,后期做好了也会发布出来 ...

  4. Js注册等待

    <为维护网上公共秩序和社会稳定,请您自觉遵守以下条款: <br> <br>  一.不得利用本站危害国家安全.泄露国家秘密,不得侵犯国家社会集体的和公民的合法权益,不得利用 ...

  5. ural 1303 Minimal Coverage&lpar;贪心&rpar;

    链接: http://acm.timus.ru/problem.aspx?space=1&num=1303 按照贪心的思想,每次找到覆盖要求区间左端点时,右端点最大的线段,然后把要求覆盖的区间 ...

  6. C语言入门(4)——常量、变量与赋值

    对于基本数据类型量,按其取值是否可改变又分为常量和变量两种.在程序执行过程中,其值不发生改变的量称为常量,其值可变的量称为变量.它们可与数据类型结合起来分类. 常量 常量有字符常量(Character ...

  7. deep learning入门:感知机

    权重和偏置 import numpy as np # 求x1 and x2 def AND(x1, x2): x = np.array([x1, x2]) w = np.array([0.5, 0.5 ...

  8. c&plus;&plus;函数参数类型-引用、指针、值

    c++函数参数类型-引用.指针.值 https://www.cnblogs.com/lidabo/archive/2012/05/30/2525837.html

  9. EntityFramework Code-First 简易教程(三)-------数据库初始化

    现在我们来学习,当数据库初始化的时候,Code First怎样设置数据库的名字. 下面的图显示了数据库初始化的工作流程,根据传入给context基类的构造函数的参数来初始化: 根据上面的图,conte ...

  10. 跟大佬一起读源码:CurrentHashMap的扩容机制

    并发编程——ConcurrentHashMap#transfer() 扩容逐行分析 前言 ConcurrentHashMap 是并发中的重中之重,也是最常用的数据结构,之前的文章中,我们介绍了 put ...