前幾天又有人留言,關于其中一個閉包
和re.sub
的使用不太清楚。我在服務器之家搜索了下,發現沒有寫過閉包相關的東西,所以決定總結一下,完善Python的內容。
1. 閉包的概念
首先還得從基本概念說起,什么是閉包呢?來看下維基上的解釋:
....
上面提到了兩個關鍵的地方: 自由變量 和 函數, 這兩個關鍵稍后再說。還是得在贅述下“閉包”的意思,望文知意,可以形象的把它理解為一個封閉的包裹,這個包裹就是一個函數,當然還有函數內部對應的邏輯,包裹里面的東西就是自由變量,自由變量可以在隨著包裹到處游蕩。當然還得有個前提,這個包裹是被創建出來的。
舉個例子:
1
2
3
4
5
6
7
|
def func(name): def inner_func(age): print 'name:' , name, 'age:' , age return inner_func bb = func( 'the5fire' ) bb( 26 ) # >>> name: the5fire age: 26 |
這里面調用func的時候就產生了一個閉包——inner_func,并且該閉包持有自由變量——name,因此這也意味著,當函數func的生命周期結束之后,name這個變量依然存在,因為它被閉包引用了,所以不會被回收。
另外再說一點,閉包并不是Python中特有的概念,所有把函數做為一等公民的語言均有閉包的概念。不過像Java這樣以class為一等公民的語言中也可以使用閉包,只是它得用類或接口來實現。
更多概念上的東西可以參考最后的參考鏈接。
2. 為什么使用閉包
基于上面的介紹,不知道讀者有沒有感覺這個東西和類有點相似,相似點在于他們都提供了對數據的封裝。不同的是閉包本身就是個方法。和類一樣,我們在編程時經常會把通用的東西抽象成類,(當然,還有對現實世界——業務的建模),以復用通用的功能。閉包也是一樣,當我們需要函數粒度的抽象時,閉包就是一個很好的選擇。
在這點上閉包可以被理解為一個只讀的對象,你可以給他傳遞一個屬性,但它只能提供給你一個執行的接口。因此在程序中我們經常需要這樣的一個函數對象——閉包,來幫我們完成一個通用的功能,比如后面會提到的——裝飾器。
3. 使用閉包
第一種場景 ,在python中很重要也很常見的一個使用場景就是裝飾器,Python為裝飾器提供了一個很友好的“語法糖”——@,讓我們可以很方便的使用裝飾器,裝飾的原理不做過多闡述,簡言之你在一個函數func上加上@decorator_func, 就相當于decorator_func(func):
1
2
3
4
5
6
7
8
9
10
11
|
def decorator_func(func): def wrapper( * args, * * kwargs): return func( * args, * * kwargs) return wrapper @decorator_func def func(name): print 'my name is' , name # 等價于 decorator_func(func) |
在裝飾器的這個例子中,閉包(wrapper)持有了外部的func這個參數,并且能夠接受外部傳過來的參數,接受過來的參數在原封不動的傳給func,并返回執行結果。
這是個簡單的例子,稍微復雜點可以有多個閉包,比如經常使用的那個LRUCache的裝飾器,裝飾器上可以接受參數@lru_cache(expire=500)這樣。實現起來就是兩個閉包的嵌套:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
def lru_cache(expire = 5 ): # 默認5s超時 def func_wrapper(func): def inner( * args, * * kwargs): # cache 處理 bala bala bala return func( * args, * * kwargs) return inner return func_wrapper @lru_cache (expire = 10 * 60 ) def get(request, pk) # 省略具體代碼 return response() |
不太懂閉包的同學一定得能夠理解上述代碼,這是我們之前面試經常會問到的面試題。
第二個場景 ,就是基于閉包的一個特性——“惰性求值”。這個應用比較常見的是在數據庫訪問的時候,比如說:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
# 偽代碼示意 class QuerySet( object ): def __init__( self , sql): self .sql = sql self .db = Mysql.connect().corsor() # 偽代碼 def __call__( self ): return db.execute( self .sql) def query(sql): return QuerySet(sql) result = query( "select name from user_app" ) if time > now: print result # 這時才執行數據庫訪問 |
上面這個不太恰當的例子展示了通過閉包完成惰性求值的功能,但是上面query返回的結果并不是函數,而是具有函數功能的類。有興趣的可以去看看Django的queryset的實現,原理類似。
第三種場景 , 需要對某個函數的參數提前賦值的情況,當然在Python中已經有了很好的解決訪問 functools.parial,但是用閉包也能實現。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
def partial( * * outer_kwargs): def wrapper(func): def inner( * args, * * kwargs): for k, v in outer_kwargs.items(): kwargs[k] = v return func( * args, * * kwargs) return inner return wrapper @partial (age = 15 ) def say(name = None , age = None ): print name, age say(name = "the5fire" ) # 當然用functools比這個簡單多了 # 只需要: functools.partial(say, age=15)(name='the5fire') |
看起來這又是一個牽強的例子,不過也算是實踐了閉包的應用。
最后總結下,閉包這東西理解起來還是很容易的,在Python中的應用也很廣泛,這篇文章算是對閉包的一個總結,有任何疑問歡迎留言交流。
4. 參考資料
http://stackoverflow.com/questions/4020419/closures-in-python
http://www.shutupandship.com/2012/01/python-closures-explained.html
http://mrevelle.blogspot.com/2006/10/closure-on-closures.html