python中multiprocessing.pool函数介绍_正在拉磨_新浪博客

时间:2023-03-08 15:44:28
python中multiprocessing.pool函数介绍_正在拉磨_新浪博客

python中multiprocessing.pool函数介绍_正在拉磨_新浪博客

    python中multiprocessing.pool函数介绍
    (2010-06-10 03:46:51)
    转载▼
    标签:
    it
    python
    pool
        分类: Python
    摘自:http://hi.baidu.com/xjtukanif/blog/item/faaa06d31df7d1d8572c84fe.html

    python自2.6开始提供了多进程模块multiprocessing,这里主要是介绍multiprocessing下的Pool的几个函数

    一 apply(func[, args[, kwds]])
       apply用于传递不定参数,同python中的apply函数一致(不过内置的apply函数从2.3以后就不建议使用了),主进程会阻塞于函数。
    for x in gen_list(l):
        result = pool.apply(pool_test, (x,))
        print 'main process'
    这个时候主进程的执行流程同单进程一致
    二 apply_async(func[, args[, kwds[, callback]]])
       与apply用法一致,但它是非阻塞的且支持结果返回后进行回调。
    for x in gen_list(l):
        result = pool.apply_async(pool_test, (x,))
        print 'main process'
       这个时候主进程循环运行过程中不等待apply_async的返回结果,在主进程结束后,即使子进程还未返回整个程序也会就退出。虽然 apply_async是非阻塞的,但其返回结果的get方法却是阻塞的,在本例中result.get()会阻塞主进程。因此可以这样来处理返回结果:
        [x.get() for x in [pool.apply_async(pool_test, (x,)) for x in gen_list(l)]]
    如果我们对返回结果不感兴趣, 那么可以在主进程中使用pool.close与pool.join来防止主进程退出。注意join方法一定要在close或terminate之后调用。
        for x in gen_list(l):
        pool.apply_async(pool_test, (x, ))
        print 'main_process'
        pool.close()
        pool.join()
    三 map(func, iterable[, chunksize])
       map方法与内置的map函数行为基本一致,在它会使进程阻塞与此直到结果返回。
       但需注意的是其第二个参数虽然描述的为iterable, 但在实际使用中发现只有在整个队列全部就绪后,程序才会运行子进程。
    四 map_async(func, iterable[, chunksize[, callback]])
       与map用法一致,但是它是非阻塞的。其有关事项见apply_async。
    五 imap(func, iterable[, chunksize])
       与map不同的是, imap的返回结果为iter,需要在主进程中主动使用next来驱动子进程的调用。即使子进程没有返回结果,主进程对于gen_list(l)的 iter还是会继续进行, 另外根据python2.6文档的描述,对于大数据量的iterable而言,将chunksize设置大一些比默认的1要好。
       for x in pool.imap(pool_test, gen_list(l)):
           pass
    六 imap_unordered(func, iterable[, chunksize])
       同imap一致,只不过其并不保证返回结果与迭代传入的顺序一致。
    七 close()
       关闭pool,使其不在接受新的任务。
    八 terminate()
       结束工作进程,不在处理未处理的任务。
    九 join()
       主进程阻塞等待子进程的退出, join方法要在close或terminate之后使用。

    l = range(10)
    def gen_list(l):
        for x in l:
            print 'yield', x
            yield x
    def pool_test(x):
        print 'f2', x
        time.sleep(1)