web.py框架之高级应用

时间:2022-05-14 06:43:46

二、高级应用

2.1 web.ctx

获取客户端信息,比如:来源页面、客户端浏览器类型等。

web.ctx基于 threadeddict类,又被叫做 ThreadDict。这个类创建了一个类似字典(dictionary-like)的对象,对象中的值都是与线程 id 相对应的。这样做很妙,因为很多用户同时访问系统时,这个字典对象能做到仅为某一特定的 HTTP 请求提供数据(因为没有数据共享,所以对象是线程安全的)。

web.ctx保存每个HTTP请求的特定信息,比如客户端环境变量。假设,我们想知道正在访问某页面的用户从哪个网页跳转而来的:

class example:
def GET(self):
referer = web.ctx.env.get("HTTP_REFERER", "http://gogle.com")
raise web.seeother(referer)

上述代码用 web.ctx.env 获取 HTTP_REFERER 的值。如果 HTTP_REFERER 不存在,就会将 google.com 做为默认值。接下来,用户就会被重定向回到之前的来源页面。

web.ctx 另一个特性,是它可以被 loadhook 赋值。例如:当一个请求被处理时,会话(Session)就会被设置并保存在 web.ctx 中。由于 web.ctx是线程安全的,所以我们可以象使用普通的 python 对象一样,来操作会话(Session)。

ctx中的数据成员
request
environ 又被写作.evn -- 包含标准WSGI环境变量的字典
home -- 应用的http根路径(注释:可以理解为应用的起始网址,协议+站点域名+应用所在路径)例如:http://example.org/admin
homedomain -- 应用所在站点(可以理解为协议+域名)http://example.org
host -- 主机名(域名)+用户请求的端口(如果没有的话,就是默认的 80 端口),例如: example.org, example.org:8080
ip –- 用户的 IP 地址,例如: xxx.xxx.xxx.xxx
method – 所用的 HTTP 方法,例如: GET
path –- 用户请求路径,它是基于当前应用的相对路径。在子应用中,匹配外部应用的那部分网址将被去掉。例如:主应用在 code.py中,而子应用在 admin.py 中。在 code.py中, 我们将/admin 关联到admin.app。 在 admin.py 中, 将/stories 关联到 stories类。在stories 中, web.ctx.path 就是/stories, 而非/admin/stories。形如: /articles/845
protocol –- 所用协议,例如: https
query –- 跟在'?'字符后面的查询字符串。如果不存在查询参数,它就是一个空字符串。例如: ?fourlegs=good&twolegs=bad
fullpath 可以视为 path + query – 包查询参数的请求路径,但不包括'homepath'。例如:/articles/845?fourlegs=good&twolegs=bad response
status –- HTTP 状态码(默认是'200 OK') 401 Unauthorized 经授权
headers –- 包 HTTP 头信息(headers)的二元组列表。
output –- 包响应实体的字符串。

2.2 应用处理器(Application processors)

使用应用处理器加载钩子(loadhook)和卸载钩子(unloadhook)。

web.py可以在处理请求之前或之后,通过添加处理器(processor)来完成某些操作:

def my_processor(handler):
print "before handling"
result = handler()
print "after handling"
return result app.add_processor(my_processor)

web.py也可以通过加载钩子(loadhook)和卸载钩子(unloadhook)的方式来完成同样的操作,他们分别在请求开始和请求结束工作:

def my_loadhook():
print "my load hook" def my_unloadhook():
print "my unload hook" app.add_processor(web.loadhook(my_loadhook))
app.add_processor(web.unloadhook(my_unloadhook))

上边两个例子,如果加在主应用里面,则主应用和子应用的接口都会加上这个处理器;如果只在某个子应用里面加这个处理器,则只有这个子应用的接口被加了这个处理器。如果一个加在主应用,另一个加载子应用,则主应用的属于全局,不论访问主应用合适访问子应用都要走;子应用的不仅要走主应用的处理器,还要走自己的处理器。顺序如下:主befor 》子befor 》子after 》主after

2.3 web.background

web.background 和 web.backgrounder 都是 python 装饰器,它可以让某个函式在一个单独的 background 线程中运行,而主线程继续处理当前的 HTTP 请求,并在稍后报告 background 线程的状态(事实上,后台函式的标准输出(stdout)被返回给启动该线程的"backrounder")。 译注:我本来想将 background thread 翻译为后台线程,后来认为作者本意是想表达“被 background 修饰的函式所在的线程”,最后翻译采用“background 线程”。 这样,服务器就可以在处理其他 http 请求的同时,快速及时地响应当前客户端请求。同时,background 线程继续执行需要长时间运行的函式。

#!/usr/bin/env python
# -*- coding: utf-8 -*- from web import run, background, backgrounder
from datetime import datetime; now = datetime.now
from time import sleep urls = (
'/', 'index',
) class index:
@backgrounder
def GET(self):
print "Started at %s" % now()
print "hit f5 to refresh!"
longrunning() @background
def longrunning():
for i in range(10):
sleep(1)
print "%s: %s" % (i, now()) if __name__ == '__main__':
run(urls, globals())

在请求 http://localhost:8080/时,将自动重定向到类似http://localhost:8080/?_t=3080772748 的网址(t 后面的数字就是background 线程 id),接下来(在点击几次刷新之后)就会看到如下信息:

Started at 2008-06-14 15:50:26.764474
hit f5 to refresh!
0: 2008-06-14 15:50:27.763813
1: 2008-06-14 15:50:28.763861
2: 2008-06-14 15:50:29.763844
3: 2008-06-14 15:50:30.763853
4: 2008-06-14 15:50:31.764778
5: 2008-06-14 15:50:32.763852
6: 2008-06-14 15:50:33.764338
7: 2008-06-14 15:50:34.763925
8: 2008-06-14 15:50:35.763854
9: 2008-06-14 15:50:36.763789

web.py 在 background.threaddb 字典中保存线程信息。这就很容易检查线程的状态:

class threaddbviewer:
def GET(self):
for k, v in background.threaddb.items():
print "%s - %s" % ( k, v )

web.py 并不会主动去清空 threaddb 词典,这使得输出(如http://localhost:8080/?_t=3080772748)会一直执行,直到内存被用满。
通常是在 backgrounder 函式中做线程清理工作,是因为 backgrounder可以获得线程 id(通过 web.input()得到"_t"的值,就是线程 id),从而根据线程 id 来回收资源。这是因为虽然 background 能知道自己何时结束,但它无法获得自己的线程 id,所以 background 无法自己完成线程清理。
还要注意 How not to do thread local storage with Python 在 python 中如何避免多线程本地存储 - 线程 ID 有时会被重用(可能会引发错误) 。

在使用 web.background 时,还是那句话--“小心为上”!

2.4 自定义NotFound消息

import web

urls = (
...
) app = web.application(urls, globals()) def notfound():
return web.notfound("Sorry, the page you were looking for was not found!"
# return web.notfound(render.notfound())
# return web.notfound(str(render.notfound())) app.notfound = notfound

要返回自定义的NotFound消息,这么做即可:

class example:
def GET(self):
raise web.notfound()

这个返回的是 404 Not Found
也可以用同样的方法自定义500错误消息:

def internalerror():
return web.internalerror("Bad, bad server. No donut for you." app.internalerror = internalerror

2.5 使用流来传输大文件

要用流的方式传输大文件,需要添加传输译码(Transfer-Eencoding)区块头,这样才能一边下载一边显示。否则,浏览器将缓存所有数据直到下载完毕才显示。

如果这样写:直接修改基础字符串(例中就是j),然后用yield返回——是没有效果的。如果要用yield,就要向所有内容使用yield。因为这个函式此时是一个产生器。

# coding: utf-8
# 简单流式服务器演示
# 使用time.sleep模拟大文件读取 import web
import time

urls = (    
"/", "count_holder",    
"/(.*)", "count_down",    
)
app = web.application(urls, globals()) class count_down:
def GET(self, count):
# 这些头使它在浏览器中工作
web.header("Content-Type", "text/html")
web.header("Transfer-Encoding", "chunked")
yield "<h2>Prepare for Launch!</h2>"
j = "<li>Liftoff in %s...</li>"
yield "<ul>"
count = int(count)
for i in range(count, 0, -1):
out = j % i
time.sleep(1)
yield out
yield "</ul>"
time.sleep(1)
yield "<h1>Life off</h1>" class count_holder:
def GET(self):
web.header("Content-Type", "text/html")
web.header("Transfer-Encoding", "chunked")
boxes = 4
delay = 3
countdown = 10
for i in range(boxes):
output = "<iframe src='/%d' width='200' height='500'></iframe>"%(countdown - i)
yield output
time.sleep(delay) if __name__ == "__main__":
app.run()

2.6 管理自带的webserver日志

我们可以用wsgilog来操作内置的webserver的日志,并将其作为中间件加到应用中。

写一个Log类继承wsgilog.WsgiLog,在__init__中把参数传给基类。

如下:

import sys, logging
from wsgilog from WsgiLog, LogI0
import config class Log(WsgiLog):
def __init__(self, application):
WsgiLog.__init__(
self,
application,
logformat = "%(message)s",
tofile = True,
file = config.log_file,
interval = config.log_interval,
backups = config.log_backups
)
sys.stdout = LogIO(self.logger, logging.INFO)
sys.stderr = LogIO(self.logger, logging.ERROR)

接下来,当应用运行时,传递一个引用给上例中的 Log 类即可(假设上面代码是'mylog'模块的一部分,代码如下):

from mylog import Log
application = web.application(urls, globals())
application.run(Log)

2.7 用cheerypy提供SSL支持

import web
from web.wsgiserver import CherryPyWSGIServer CherryPyWSGIServer.ssl_certificate = "path/to/ssl_certificate"
CherryPyWSGIServer.ssl_private_key = "path/to/ssl_private_key" urls = ("/.*", "hello")
app = web.application(urls, globals()) class hello:
def GET(self):
return 'Hello, world!' if __name__ == "__main__":
app.run()

2.8 实时语言切换

首先你必须阅读模板语言中的i18n支持, 然后尝试下面的代码。

文件: code.py

import os
import sys
import gettext
import web # File location directory.
rootdir = os.path.abspath(os.path.dirname(__file__)) # i18n directory.
localedir = rootdir + '/i18n' # Object used to store all translations.
allTranslations = web.storage() def get_translations(lang='en_US'):
# Init translation.
if allTranslations.has_key(lang):
translation = allTranslations[lang]
elif lang is None:
translation = gettext.NullTranslations()
else:
try:
translation = gettext.translation(
'messages',
localedir,
languages=[lang],
)
except IOError:
translation = gettext.NullTranslations()
return translation def load_translations(lang):
"""Return the translations for the locale."""
lang = str(lang)
translation = allTranslations.get(lang)
if translation is None:
translation = get_translations(lang)
allTranslations[lang] = translation # Delete unused translations.
for lk in allTranslations.keys():
if lk != lang:
del allTranslations[lk]
return translation def custom_gettext(string):
"""Translate a given string to the language of the application."""
translation = load_translations(session.get('lang'))
if translation is None:
return unicode(string)
return translation.ugettext(string) urls = (
'/', 'index'
) render = web.template.render('templates/',
globals={
'_': custom_gettext,
}
) app = web.application(urls, globals()) # Init session.
session = web.session.Session(app,
web.session.DiskStore('sessions'),
initializer={
'lang': 'en_US',
}
) class index:
def GET(self):
i = web.input()
lang = i.get('lang', 'en_US') # Debug.
print >> sys.stderr, 'Language:', lang session['lang'] = lang
return render.index() if __name__ == "__main__": app.run()

模板文件: templates/index.html.

$_('Hello')

不要忘记生成必要的 po&mo 语言文件。参考: 模板语言中的i18n支持

现在运行 code.py:

$ python code.py
http://0.0.0.0:8080/

然后用你喜欢的浏览器访问下面的地址,检查语言是否改变:

http://your_server:8080/
http://your_server:8080/?lang=en_US
http://your_server:8080/?lang=zh_CN

你必须:

  • 确保语言文件(en_US、zh_CN等)可以动态改变。
  • 确保custom_gettext()调用越省资源约好。

参考: