1. 什么是自省?
自省就是自我评价、自我反省、自我批评、自我调控和自我教育,是孔子提出的一种自我道德修养的方法。他说:“见贤思齐焉,见不贤而内自省也。”(《论语·里仁》)当然,我们今天不是想说党员的批评与自我批评。表明意思上,自省(introspection)是一种自我检查行为。在计算机编程中,自省是指这种能力:检查某些事物以确定它是什么、它知道什么以及它能做什么。自省向程序员提供了极大的灵活性和控制力。
本文介绍了 Python 编程语言的自省能力。整个 Python 语言对自省提供了深入而广泛的支持。实际上,很难想象假如 Python 语言没有其自省特性是什么样子。
2. Python的help
在进入python的终端IDE时我们就能见到help的身影:
zhouyl@zhouyl:~/repository/blog/python$ python
Python 2.7.3 (default, Jan 2 2013, 16:53:07)
[GCC 4.7.2] on linux2
Type "help", "copyright", "credits" or "license" for more information.
最后一行清晰的提释我们可以输入help来获取更多的信息。
>>> help # 输入help之后,系统提示输入help()进入交互式的help界面,或者使用help(obj)来获取obj的help信息
Type help() for interactive help, or help(object) for help about object.
>>> help() # 输入help() Welcome to Python 2.7! This is the online help utility. If this is your first time using Python, you should definitely check out
the tutorial on the Internet at http://docs.python.org/2.7/tutorial/. Enter the name of any module, keyword, or topic to get help on writing
Python programs and using Python modules. To quit this help utility and
return to the interpreter, just type "quit". To get a list of available modules, keywords, or topics, type "modules",
"keywords", or "topics". Each module also comes with a one-line summary
of what it does; to list the modules whose summaries contain a given word
such as "spam", type "modules spam". help> # 在输入一段“说明”后,进入交互式help界面(Ctrl+C或者输入quit退出)
help> list # 输入list之后进入另一类似于“man”的窗口,完整介绍list help> keywords # 输入keywords只打印python的关键字列表 Here is a list of the Python keywords. Enter any keyword to get more help. and elif if print
as else import raise
assert except in return
break exec is try
class finally lambda while
continue for not with
def from or yield
del global pass help> if # 输入关键字if,也是类似于上面list在另一窗口下介绍if
当然,我们也可以在python的IDE下使用help(object)来获取某一对象的help信息,比如:
>>> help(os) # 想看os模块?^_^,没门,你还没加载呢
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
NameError: name 'os' is not defined
>>> import os
>>> help(os) # 加载之后即可查看os的help信息了 >>>
3. sys 模块
对于sys模块,使用比较频繁见的也比较多,那么它是干吗的?python官网是这么介绍的:“System-specific parameters and functions”(系统特定的参数和函数)。所以sys 模块是提供关于 Python 本身的详尽内在信息的模块。通过导入模块,并用点(.)符号引用其内容(如变量、函数和类)来使用模块。 sys 模块包含各种变量和函数,它们揭示了当前的 Python 解释器有趣的详细信息。
platform 变量告诉我们现在处于什么操作系统上:sys.platform 属性
>>> import sys
>>> sys.platform
'linux2'
在当前的 Python 中,
版本以字符串和元组(元组包含对象序列)来表示:
>>> sys.version
'2.7.3 (default, Jan 2 2013, 16:53:07) \n[GCC 4.7.2]'
>>> sys.version_info
sys.version_info(major=2, minor=7, micro=3, releaselevel='final', serial=0)
maxint 变量反映了可用的最大整数值:
sys.maxint 属性
>>> sys.maxint
2147483647
argv 变量是一个包含命令行参数的列表(如果参数被指定的话)。第一项 argv[0] 是所运行脚本的路径。当我们以交互方式运行 Python 时,这个值是空字符串: sys.argv 属性
>>> sys.argv
['']
关于sys.argv的使用,我们在前面介绍函数的学习笔记中已有介绍,它可以用来接收函数的脚本,比如:
#!/usr/bin/python
import sys
print"The script name is "+sys.argv[0]
print"The first parameter is %s" % sys.argv[1]
print"The second parameter is %r" % sys.argv[2]
在脚本使用时,我们可以给脚本带入参数:
long@zhouyl:/tmp/test$ python arg.py 1 2 3 # 虽然程序中只要求打印前2个参数,但是我们也可以带更多的,只是没打印而已
The script name is arg.py
The first parameter is 1
The second parameter is '2'
path 变量是模块搜索路径,Python 在导入期间将在其中的目录列表中寻找模块。:
sys.path 属性
>>> sys.path
['', '/home/pobrien/Code', # 最前面的空字符串 '' 是指当前目录
'/usr/local/lib/python2.2',
'/usr/local/lib/python2.2/plat-linux2',
'/usr/local/lib/python2.2/lib-tk',
'/usr/local/lib/python2.2/lib-dynload',
'/usr/local/lib/python2.2/site-packages']
modules 变量是一个字典,它将当前已装入的所有模块的名称映射到模块对象。如您所见,缺省情况下,Python 装入一些特定的模块:
sys.modules 属性
>>> sys.modules
{'stat': <module 'stat' from '/usr/local/lib/python2.2/stat.pyc'>,
'__future__': <module '__future__' from '/usr/local/lib/python2.2/__future__.pyc'>,
'copy_reg': <module 'copy_reg' from '/usr/local/lib/python2.2/copy_reg.pyc'>,
'posixpath': <module 'posixpath' from '/usr/local/lib/python2.2/posixpath.pyc'>,
'UserDict': <module 'UserDict' from '/usr/local/lib/python2.2/UserDict.pyc'>,
'signal': <module 'signal' (built-in)>,
'site': <module 'site' from '/usr/local/lib/python2.2/site.pyc'>,
'__builtin__': <module '__builtin__' (built-in)>,
'sys': <module 'sys' (built-in)>,
'posix': <module 'posix' (built-in)>,
'types': <module 'types' from '/usr/local/lib/python2.2/types.pyc'>,
'__main__': <module '__main__' (built-in)>,
'exceptions': <module 'exceptions' (built-in)>,
'os': <module 'os' from '/usr/local/lib/python2.2/os.pyc'>,
'os.path': <module 'posixpath' from '/usr/local/lib/python2.2/posixpath.pyc'>}
4.<dive into python>中的自省模块
在阅读dive into python时,第四章讲到了自省,代码如下:
# apihelper.py
def info(object, spacing=10, collapse=1):
"""Print methods and doc strings. Takes module, class, list, dictionary, or string."""
methodList = [method for method in dir(object) if callable(getattr(object, method))]
processFunc = collapse and (lambda s: " ".join(s.split())) or (lambda s: s)
print "\n".join(["%s %s" %
(method.ljust(spacing),
processFunc(str(getattr(object, method).__doc__)))
for method in methodList])
使用起来也很方便,如下:
>>> from apihelper import info
>>> li = []
>>> info(li)
__add__ x.__add__(y) <==> x+y
__class__ list() -> new empty list list(iterable) -> new list initialized from iterable's items
...
>>> import apihelper
>>> info(apihelper)
info Print methods and doc strings. Takes module, class, list, dictionary, or string.
>>> info(apihelper,20)
info Print methods and doc strings. Takes module, class, list, dictionary, or string.
>>> info(apihelper,20,0)
info Print methods and doc strings. Takes module, class, list, dictionary, or string.
4.1. 几个内置函数介绍
其中使用了几个函数,主要介绍如下:
dir([obj])
:
dir() 函数可能是 Python 自省机制中最著名的部分了。它返回传递给它的任何对象的属性名称经过排序的列表(会有一些特殊的属性不包含在内)。如果不指定对象,则 dir() 返回当前作用域中的名称(obj的默认值是当前的模块对象)。
eg.
>>> li
[1, 4, 8, 16, 2, 3]
>>> dir(li)
['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__delslice__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getslice__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__setslice__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']
getattr(obj, attr)
:
getattr是一个有用到无法置信的内置函数(自省的核心哦),可以返回任意对象的任何属性。调用这个方法将返回obj中名为attr值的属性的值,例如如果attr为'bar',则返回obj.bar。使用getattr函数,可以得到一个直到运行时才知道名称的函数的引用。getattr的返回值是方法,可以调用。
eg.
>>> li
[1, 4, 8, 16]
>>> li.append(2)
>>> li
[1, 4, 8, 16, 2]
>>> getattr(li,'append')(3)
>>> li
[1, 4, 8, 16, 2, 3]
类似还有:
hasattr(obj, attr):
这个方法用于检查obj是否有一个名为attr的值的属性,返回一个布尔值。
setattr(obj, attr, val):
调用这个方法将给obj的名为attr的值的属性赋值为val。例如如果attr为'bar',则相当于obj.bar = val。
callable(obj)
:
可以调用表示潜在行为(函数和方法)的对象。可以用 callable() 函数测试参数对象的可调用性,参数对象可调用返回True,否则返回False。
eg.
>>> li
[1, 2 , 4, 8, 16]
>>> callable(li)
False
>>> callable(li.append)
True
string.ljust(length)
:
ljust用空格填充字符串以符合指定的长度。如果指定的长度(length)小于字符串的长度(len(string)),ljust将简单滴返回未变化的字符串,不会截断字符串。
eg.
>>> s = "Zhou"
>>> print s.ljust(10)+"Hello"
Zhou Hello
>>> print s.ljust(1)+"Hello"
ZhouHello
4.2. 列表解析
Python有着强大的列表解析即将列表映射到其他列表的强大能力。列表解析同过滤机制结合使用,使列表中有些元素被映射而跳过其他元素。
列表解析:
[mapping-expression for item in source-list]
eg.
>>> li = [1,2,4,8,16]
>>> [item*2 for item in li]
[2, 4, 8, 16, 32]
过滤列表语法:
[mapping-expression for item in source-list if filter-expression]
eg.
>>> li = [1,2,4,8,16]
>>> [item*2 for item in li if item%2 == 0]
[4, 8, 16, 32]
如上所示,过滤列表就是列表解析的扩展,前三部分是相同的,最后一步分添加if开头的过滤表达式(过滤表达式可以是返回值为真或假的任何表达式,而在Python中几乎是任何东西)。
注意:如果仔细查看上面的apihelper.py实例,可以发现作者将一行命令放在多行,这也可以?这里可以告诉你的是“列表解析是可以一个表达式分割成多行的”,因为整个表达式都在一个方括号中括起来了。
4.3 逐析模块
对于上述模块中还有一些用法在上面两节中并没有提及。比如and-or用法和lambda函数,这些都在本系列的前文学习笔记中有所涉及,本文再不赘述。
下面对于上述模块逐句进行分析:
def info(object, spacing=10, collapse=1):
# 首先,我们可以看到,定义的函数使用了三个参数:
@ object -- 当然是我们想要查看的目标了,本函数使用dir获取object的属性,而又因dir函数的强大,所以此处的object可以是python中的任意东西,包括模块对象、函数对象、字符串对象、列表对象、字典对象...
@ spacing = 10,这里定义了一个关键参数,也就是说,如果调用info函数时没有给spacing赋值,spacing将使用默认的10。那么这个spacing是干吗的?向下看,对!没错它是给ljust做参数的!也就是说长度不足10的字符串会使用空格补气,而超过10的不做修改
@ collapse = 1,这里也定了一个关键参数,如果不赋值,使用默认值1。collapse在函数中用作and-or用法的判断语句。
"""Print methods and doc strings.
Takes module, class, list, dictionary, or string."""
# 这是什么?没错,当然是docstring了
methodList = [method for method in dir(object) if callable(getattr(object, method))]
# 使用上面介绍的过滤列表,首先使用dir对object解析获取object的所有属性的一个列表,使用列表解析对其进行映射并通过if对其进行过滤,过滤条件是object.method可调用!因此,最后得到的methodList是一个object的所有可调用的属性的列表
processFunc = collapse and (lambda s: " ".join(s.split())) or (lambda s: s)
# 这一句定义了一个函数,对,只有一行的lambda函数哦,并使用第三个参数作为and-or用法的判断。如果collapse为True,processFunc = lambda s: " ".join(s.split()),也即将s先使用split函数分割在使用" ".join将其使用空格连接起来。如果collapse为False,processFunc = lambda s: s,也即对s不做任何处理
print "\n".join(["%s %s" %
(method.ljust(spacing),
processFunc(str(getattr(object, method).__doc__)))
for method in methodList])
# 这里就是上面提到的将列表解析放在几行中使用的一个典型案例,首先使用method遍历methodList列表(上面获得的object的所有可调用的属性的列表),在使用processFunc对object.method的__doc__(docstring)进行处理,与使用ljust调整好的method名一同打印出来。并使用"\n".join将每个不同的method信息之间进行分割,分割在不同行打印。
5. 打印一些函数的可获取信息
下面是《Python 自省指南》中使用到的自省方法,主要使用了一些内置函数(id(),type(),repr()等)打印对象的信息:
def interrogate(item):
"""Print useful information about item."""
if hasattr(item, '__name__'):
print "NAME: ", item.__name__
if hasattr(item, '__class__'):
print "CLASS: ", item.__class__.__name__
print "ID: ", id(item)
print "TYPE: ", type(item)
print "VALUE: ", repr(item)
print "CALLABLE:",
if callable(item):
print "Yes"
else:
print "No"
if hasattr(item, '__doc__'):
doc = getattr(item, '__doc__')
doc = doc.strip() # Remove leading/trailing whitespace.
firstline = doc.split('\n')[0]
print "DOC: ", firstline
我们把它添加到apihelper模块中作为我们的自省模块的另一个方法,使用起来如下:
>>> import apihelper # 加载我们的apihelper
>>> apihelper.info(apihelper) # 调用前面的info函数查看apihelper中有哪些属性
info Print methods and doc strings. Takes module, class, list, dictionary, or string.
interrogate Print useful information about item.
>>> apihelper.interrogate(apihelper) # 使用interrogate查看我们的apihelper的信息
NAME: apihelper
CLASS: module
ID: 3075144100
TYPE: <type 'module'>
VALUE: <module 'apihelper' from 'apihelper.py'>
CALLABLE: No
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "apihelper.py", line 30, in interrogate
doc = doc.strip() # Remove leading/trailing whitespace.
AttributeError: 'NoneType' object has no attribute 'strip'
>>> apihelper.interrogate(apihelper.info) # 查看apihelper.info信息
NAME: info
CLASS: function
ID: 3075150932
TYPE: <type 'function'>
VALUE: <function info at 0xb74b1454>
CALLABLE: Yes
DOC: Print methods and doc strings.
>>> apihelper.interrogate(123) # 查看整数的信息
CLASS: int
ID: 153002672
TYPE: <type 'int'>
VALUE: 123
CALLABLE: No
DOC: int(x[, base]) -> integer
>>> apihelper.interrogate("Hello") # 查看字符串的信息
CLASS: str
ID: 3075198208
TYPE: <type 'str'>
VALUE: 'Hello'
CALLABLE: No
DOC: str(object) -> string
至此,我们的自省模块apihelper也就有了比较强大的功能,其自省能力也是不错的~~~
=============================
引用:
[1] http://www.ibm.com/developerworks/cn/linux/l-pyint/index.html?ca=drs-#ibm-pcon
[2] dive into python - section4 :(在线可阅读)
http://woodpecker.org.cn/diveintopython/power_of_introspection/index.html
[3] http://www.cnblogs.com/huxi/archive/2011/01/02/1924317.html
python 学习笔记 9 -- Python强大的自省简析的更多相关文章
-
Python强大的自省简析
1. 什么是自省? 自省就是自我评价.自我反省.自我批评.自我调控和自我教育,是孔子提出的一种自我道德修养的方法.他说:"见贤思齐焉,见不贤而内自省也."(<论语·里仁> ...
-
python学习笔记(python简史)
一.python介绍 python的创始人为吉多·范罗苏姆(Guido van Rossum) 目前python主要应用领域: ·云计算 ·WEB开发 ·科学运算.人工智能 ·系统运维 ·金融:量化交 ...
-
python 学习笔记一——Python安装和IDLE使用
好吧,一直准备学点啥,前些日子也下好了一些python电子书,但之后又没影了.年龄大了,就是不爱学习了.那就现在开始吧. 安装python 3 Mac OS X会预装python 2,Linux的大多 ...
-
python学习笔记(一):python简介和入门
最近重新开始学习python,之前也自学过一段时间python,对python还算有点了解,本次重新认识python,也算当写一个小小的教程.一.什么是python?python是一种面向对象.解释型 ...
-
python学习笔记(1)--python特点
python诞生于复杂的信息系统时代,是计算机时代演进的一种选择. python的特点,通用语言,脚本语言,跨平台语言.这门语言可以用于普适的计算,不局限于某一类应用,通用性是它的最大特点.pytho ...
-
python学习笔记之——python模块
1.python模块 Python 模块(Module),是一个 Python 文件,以 .py 结尾,包含了 Python 对象定义和Python语句. 模块让你能够有逻辑地组织你的 Python ...
-
Python学习笔记 - day12 - Python操作NoSQL
NoSQL(非关系型数据库) NoSQL,指的是非关系型的数据库.NoSQL有时也称作Not Only SQL的缩写,是对不同于传统的关系型数据库的数据库管理系统的统称.用于超大规模数据的存储.(例如 ...
-
[Python学习笔记1]Python语言基础 数学运算符 字符串 列表
这个系列是我在学习Python语言的过程中记录的笔记,主要是一些知识点汇总,而非学习教程,可供有一定编程基础者参考.文中偏见和不足难以避免,仅供参考,欢迎批评指正. 本系列笔记主要参考文献是官网文档: ...
-
python学习笔记一 python入门(基础篇)
简单介绍一下python2.x和3.5的区别 print 在python3.5中print 变为print() Old: print * New: print( * ) 如果想要不换行,之前的 ...
随机推荐
-
160905、c3p0详细配置
官方文档 : http://www.mchange.com/projects/c3p0/index.html <c3p0-config> <default-config> &l ...
-
[转载]char * 和char []的区别---之第二篇
原文地址:http://blog.sina.com.cn/s/blog_74a4593801019keb.html main() { char *p="abc123ABC";//c ...
-
win7音量控制图标不见了怎么办啦?
1.打开程序管理器(ctrl+alt+delete)2.在进程那里找到"explorer.exe",然后按结束进程(此时工具栏会消失)3.然后在文件(程序管理器左上角),点击&qu ...
-
git 分支策略
转 http://www.ruanyifeng.com/blog/2012/07/git.html 作者: 阮一峰 如果你严肃对待编程,就必定会使用"版本管理系统"(Versio ...
-
读书笔记 effective c++ Item 36 永远不要重新定义继承而来的非虚函数
1. 为什么不要重新定义继承而来的非虚函数——实际论证 假设我告诉你一个类D public继承类B,在类B中定义了一个public成员函数mf.Mf的参数和返回类型并不重要,所以假设它们都是void. ...
-
sql中奇怪的sum(1),sum(2),count(1),count(6),count(*):统计总数
sql的统计函数 sql统计函数有 count 统计条数,配合group用 sum 累加指定字段数值 但注意sum(1)就特殊 sum(1)等同于count(*) sum(1)统计个数,功能和coun ...
-
关于package,import,和“找不到可以加载的主类”报错之间的关系
正在回顾java基础 目录结构如下: 一 以下代码,进入Example所在的文件夹, javac和java都不会报错 public class Example{ public static void ...
-
Redis高并发和快速的原因
一.Redis的高并发和快速原因 1.redis是基于内存的,内存的读写速度非常快: 2.redis是单线程的,省去了很多上下文切换线程的时间: 3.redis使用多路复用技术,可以处理并发的连接 ...
-
五校联考R1 Day2T2 矩阵matrix(容斥)
题目链接 容易想到容斥,但是很恶心,因为要对行和列都容斥,然后行+列又要容斥.. 于是得到\(O(nm\log)\)的做法. 就有70分了: #include <cstdio> #incl ...
-
mysql数据库定时任务
应用系统运行中,经常需要定时执行一些任务,例如:定时更新汇总数据,定时更新状态数据等,目前 Treesoft数据库管理系统 增加[定时任务]功能,直接通过页面简单配置,即可按调度规则定时执行SQL任务 ...