上下文管理器
上下文管理器
编程中的上下文也与此类似,比如进程上下文,指的是一个进程在执行的时候,CPU 的所有寄存器中的值、进程的状态以及堆栈上的内容等,当系统需要切换到其他进程时,系统会保留当前进程的上下文,也就是运行时的环境,以便再次执行该进程。迭代器有迭代器协议(Iterator Protocol),上下文管理器(Context manager)也有上下文管理协议(Context Management Protocol)。
- 上下文管理器协议,是指要实现对象的 __enter__()和__exit__()方法。
- 上下文管理器也就是支持上下文管理器协议的对象,也就是实现了 __enter__()和__exit__()方法。
这里先构造一个简单的上下文管理器的例子,以理解 __enter__() 和 __exit__() 方法。
from math import sqrt, pow
class Point(object):
    def __init__(self, x, y):
        print 'initialize x and y'
        self.x, self.y = x, y
    def __enter__(self):
        print "Entering context"
        return self
    def __exit__(self, type, value, traceback):
        print "Exiting context"
    def get_distance(self):
        distance = sqrt(pow(self.x, 2) + pow(self.y, 2))
        return distance
上面的代码定义了一个 Point 类,并实现了 __enter__() 和 __exit__() 方法,我们还定义了 get_distance 方法,用于返回点到原点的距离。
通常,我们使用 with 语句调用上下文管理器:
with Point(3, 4) as pt:
    print 'distance: ', pt.get_distance()
# output
initialize x and y   # 调用了 __init__ 方法
Entering context     # 调用了 __enter__ 方法
distance:  5.0       # 调用了 get_distance 方法
Exiting context      # 调用了 __exit__ 方法
上面的 with 语句执行过程如下:
- Point(3, 4) 生成了一个上下文管理器;
- 调用上下文管理器的 __enter__()方法,并将__enter__()方法的返回值赋给 as 字句中的变量 pt;
- 执行语句体(指 with 语句包裹起来的代码块)内容,输出 distance;
- 不管执行过程中是否发生异常,都执行上下文管理器的 __exit__()方法。__exit__()方法负责执行『清理』工作,如释放资源,关闭文件等。如果执行过程没有出现异常,或者语句体中执行了语句 break/continue/return,则以 None 作为参数调用__exit__(None, None, None);如果执行过程中出现异常,则使用sys.exc_info得到的异常信息为参数调用__exit__(exc_type, exc_value, exc_traceback);
- 出现异常时,如果 __exit__(type, value, traceback)返回 False 或 None,则会重新抛出异常,让 with 之外的语句逻辑来处理异常;如果返回 True,则忽略异常,不再对异常进行处理;
上面的 with 语句执行过程没有出现异常,我们再来看出现异常的情形:
with Point(3, 4) as pt:
    pt.get_length()        # 访问了对象不存在的方法
# output
initialize x and y
Entering context
Exiting context
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-216-ab4a0e6b6b4a> in <module>()
      1 with Point(3, 4) as pt:
----> 2     pt.get_length()
AttributeError: 'Point' object has no attribute 'get_length'
在我们的例子中,__exit__ 方法返回的是 None(如果没有 return 语句那么方法会返回 None)。因此,with 语句抛出了那个异常。我们对 __exit__ 方法做一些改动,让它返回 True。
from math import sqrt, pow
class Point(object):
    def __init__(self, x, y):
        print 'initialize x and y'
        self.x, self.y = x, y
    def __enter__(self):
        print "Entering context"
        return self
    def __exit__(self, type, value, traceback):
        print "Exception has been handled"
        print "Exiting context"
        return True
    def get_distance(self):
        distance = sqrt(pow(self.x, 2) + pow(self.y,2 ))
        return distance
with Point(3, 4) as pt:
    pt.get_length()      # 访问了对象不存在的方法
# output
initialize x and y
Entering context
Exception has been handled
Exiting context
可以看到,由于 __exit__ 方法返回了 True,因此没有异常会被 with 语句抛出。
- 上下文管理器是支持上下文管理协议的对象,也就是实现了 __enter__和__exit__方法。
- 通常,我们使用 with语句调用上下文管理器。with 语句尤其适用于对资源进行访问的场景,确保执行过程中出现异常情况时也可以对资源进行回收,比如自动关闭文件等。
- __enter__方法在 with 语句体执行前调用,with 语句将该方法的返回值赋给 as 字句中的变量,如果有 as 字句的话。
- __exit__方法在退出- 运行时上下文时被调用,它负责执行『清理』工作,比如关闭文件,释放资源等。如果退出时没有发生异常,则- __exit__的三个参数,即 type, value 和 traceback 都为 None。如果发生异常,返回 True 表示不处理异常,否则会在退出该方法后重新抛出异常以由 with 语句之外的代码逻辑进行处理。
内建对象使用 with 语句
除了自定义上下文管理器,Python 中也提供了一些内置对象,可直接用于 with 语句中,比如最常见的文件操作。
传统的文件操作经常使用 try/finally 的方式,比如:
file = open('somefile', 'r')
try:
    for line in file:
        print line
finally:
    file.close()     # 确保关闭文件
将上面的代码改用 with 语句:
with open('somefile', 'r') as file:
    for line in file:
        print line
可以看到,通过使用 with,代码变得很简洁,而且即使处理过程发生异常,with 语句也会确保我们的文件被关闭。
contextlib 模块
除了在类中定义 __enter__ 和 __exit__ 方法来实现上下文管理器,我们还可以通过生成器函数(也就是带有 yield 的函数)结合装饰器来实现上下文管理器,Python 中自带的 contextlib 模块就是做这个的。
contextlib 模块提供了三个对象:装饰器 contextmanager、函数 nested 和上下文管理器 closing。其中,contextmanager 是一个装饰器,用于装饰生成器函数,并返回一个上下文管理器。需要注意的是,被装饰的生成器函数只能产生一个值,否则会产生 RuntimeError 异常。
下面我们看一个简单的例子:
from contextlib import contextmanager
@contextmanager
def point(x, y):
    print 'before yield'
    yield x * x + y * y
    print 'after yield'
with point(3, 4) as value:
    print 'value is: %s' % value
# output
before yield
value is: 25
after yield
可以看到,yield 产生的值赋给了 as 子句中的 value 变量。
另外,需要强调的是,虽然通过使用 contextmanager 装饰器,我们可以不必再编写 __enter__ 和 __exit__ 方法,但是『获取』和『清理』资源的操作仍需要我们自己编写:『获取』资源的操作定义在 yield 语句之前,『释放』资源的操作定义在 yield 语句之后。
