在Python中将函数作为参数传入另一个函数中
在我们的Python学习中,我们学到的众多令人瞠目结舌的事实之一是,你可以将函数传入其他函数。你可以来回传递函数,因为在Python中,函数是对象。
在使用Python的第一周,你可能不需要了解这些,但是随着你对Python的深入研究,你会发现理解如何将一个函数传入另一个函数是非常方便的。
这是我关于“函数对象”的各种属性的系列文章的第1部分。本文主要关注一个新的Python程序员应该了解和欣赏的关于Python函数的对象本质的内容。
函数可以被引用
如果你试图使用一个函数而不在它的后面加上圆括号,Python不会报错,但它也不会做任何有用的事情:
这也适用于方法(方法是存在于对象上的函数):
Python允许我们引用这些函数对象,就像我们引用一个字符串、一个数字或一个range对象一样:
由于我们可以像引用其他对象一样引用函数,所以我们可以将一个变量指向一个函数:
这个gimme变量现在指向我们的number列表上的pop方法。因此,如果我们调用gimme,它会做与调用numbers.pop相同的事情:
注意,我们并没有创建一个新函数。我们只是将gimme变量名指向了numbers.pop函数:
你甚至可以将函数存储在数据结构中,然后再引用它们:
获取一个函数并给它另一个名称或将它存储在一个数据结构中这样的操作并不常见,但是Python允许我们这样做,因为函数可以像任何其他对象一样被来回传递。
函数可以被传入其他函数中
与任何其他对象一样,函数可以被作为参数传给另外的函数。
例如,我们可以定义一个函数:
然后,我们将它传入内置的help函数来看看它的功能:
我们也可以将这个函数传入它自身(是的,这很奇怪),这里,它自身会将这个函数转换为一个字符串:
实际上Python中有相当多的内置函数是专门用来接受其他函数作为参数的。
内置的filter函数接受两个参数:一个function和一个iterable。
这个给定的iterable (列表、元组、字符串等)会被循环,而这个给定的function会在该iterable中的每个项目上被调用:每当这个function返回True(或另外的真值)时,该项目就被包含在filter输出中。
因此,如果我们给filter传入一个is_odd函数(当给定奇数时,它会返回True)和一个数字列表,我们将得到我们给它的所有数字中是奇数的数字。
从filter返回的对象是一个延迟迭代器,因此我们需要将其转换为一个list,以实际查看其输出。
由于函数可以被传入函数,这也意味着函数可以接受另一个函数作为参数。filter函数假设它的第一个参数是一个函数。你可以认为filter函数和这个函数差不多一样:
这个函数要求predicate参数是一个函数(技术上来说它可以是任何可调用对象)。当我们调用该函数(使用predicate(item))时,我们向它传递一个参数,然后检查其返回值的真假。
lambda函数就是这样一个例子
lambda表达式是Python中用于创建匿名函数的一种特殊语法。当你对一个lambda表达式进行计算时,你得到的对象被称为lambda函数。
lambda函数与普通的Python函数非常相似,但有几点需要注意。
与其他函数不同,lambda函数没有名称(它们的名称以<lambda>显示)。它们也不能有文档字符串,并且只能包含一个Python表达式。
你可以将lambda表达式看作是创建一个函数的快捷方式,该函数将对单个Python表达式进行计算并返回该表达式的结果。
因此,定义一个lambda表达式实际上并不会计算该表达式的值:它返回一个可以稍后计算该表达式的函数。
我想指出的是,以上三个lambda例子都是不好的例子。如果你想要一个变量名指向一个你可以稍后使用的函数对象,那么你应该使用def来定义一个函数:这是定义函数的通常方法。
lambda表达式是用来定义一个函数并立即将其传递给另一个函数的。
例如,这里我们使用filter来获得偶数,但我们使用了一个lambda表达式,所以我们不必在使用它之前定义一个is_even函数:
这是lambda表达式最合适的用法: 将一个函数传递给另一个函数,同时在一行代码中定义这个被传递的函数。
正如我在《过度使用lambda表达式》中所写的,我不喜欢Python的lambda表达式语法。不管你是否喜欢这种语法,你都应该知道这种语法只是创建函数的一种快捷方式。
每当你看到lambda表达式时,请记住:
lambda表达式是一种特殊的语法,用于在一行代码中创建一个函数并将其传递给另一个函数
lambda函数与所有其他函数对象一样:两者都没有比彼此特殊,都可以被来回传递
Python中的所有函数都可以作为参数传递给另一个函数(这恰好是lambda函数的唯一目的)。
一个常见的例子:键函数
除了内置的filter函数,你还在哪里可以看到一个函数被传递给另一个函数呢?可能你在Python中能看到这一点的最常见的地方就是使用key函数的地方。
接受可排序/调整顺序的可迭代对象的函数通常也接受一个名为key的命名参数,这是一个普遍的约定。这个key参数应该是一个函数或另一个可调用对象。
sorted、min和max函数都遵循这种接受一个key函数的约定:
对于给定的可迭代对象中的每个值,这个key函数都会被调用,并且其返回值会被用来对这个可迭代对象的每一个项进行order/sort。你可以认为这个键函数是用来为该可迭代对象中的每个项计算一个比较键。
在上面的例子中,我们的比较键返回了一个小写的字符串,因此每个字符串都是通过它的小写版本(这就会导致一个大小写不敏感的顺序)进行比较的。
我们使用了一个normalize_case函数来做这件事,但是我们也可以使用str.casefold来完成:
注意: 如果你不熟悉类的工作方式,那么这种str.casefold方法就会有点奇怪。类会存储未绑定的方法,这些方法在调用时将接受一个该类的实例。我们通常会输入my_string.casefold(),但是Python会将其转换为str.casefold(my_string)。这就是另一个故事了。
这里我们找到了字母最多的字符串:
如果有多个最大值或最小值,最早的一个会胜出(这就是min/max的工作方式):
这是一个函数,它将返回一个2项元组,其中包含给定字符串的长度和该字符串的大小写归一化后的版本:
我们可以将这个length_and_alphabetical函数作为key参数传递给sorted,先按照字符串的长度对它们进行排序,然后在按照它们大小写归一化后的表示形式进行排序:
这依赖于Python的排序操作符会进行深度比较这一事实。
其他将函数作为参数传递的例子
sort、min和max接受的key参数只是将函数传递给函数的一个常见示例。
另外两个接受函数的Python内置函数是map和filter。
我们已经看到了filter会根据一个给定函数的返回值来过滤列表。
map函数将在给定的可迭代对象中的每个项上调用这个给定的函数,并使用该函数调用的结果作为新的项目:
例如,这里我们把数字转换成字符串和对数字进行平方:
注意: 正如我在关于过度使用lambda的文章中所指出的,我个人更喜欢使用生成器表达式,而不是map和filter函数。
与map和filter类似,还有来自itertools模块的takewhile和dropwhile函数。第一个类似于filter,只是它在找到断言函数为假的值时会停止。第二个则相反:它只包含断言函数为假之后的值。
还有functools.reduce 和 itertools.accumulate,它们都会调用一个2参数的函数来累计值,因为它们会进行循环:
collections模块中的defaultdict类是另一个例子。defaultdict类会创建类字典对象,当一个缺失的键被访问时,这些对象将不会引发一个KeyError,而是自动向字典中添加一个新值。
这个defaultdict类接受一个可调用对象(函数或类),当一个缺失的键被访问时,它会被调用来创建一个默认值。
以上代码可以运行,因为在没有参数的情况下调用int会返回0:
这里的默认值是list,它在没有参数调用时会返回一个新列表。
functools模块中的partial函数是另一个例子。partial接受一个函数和任意数量的参数并返回一个新函数(技术上来说,它会返回一个可调用对象)。
下面是partial的一个例子,它被用来将sep关键字参数“绑定”到print函数:
现在返回的print_each函数所做的事情与使用sep='\n'调用print一样:
你还会在第三方库中发现函数接受函数的例子,比如在Django和numpy中。每当你看到一个类或一个函数的文档声明它的一个参数应该是一个可调用类型或一个可调用对象时,这意味着“你可以在这里传入一个函数”。
我要跳过的一个主题:嵌套函数
Python还支持嵌套函数(定义在其他函数内部的函数)。嵌套函数推动了Python的装饰器语法。
在本文中,我不打算讨论嵌套函数,因为嵌套函数要涉及到对Python中的非局部变量、闭包和其他奇怪的方面的探索,而当你刚开始将函数作为对象处理时,你不需要知道这些方面。
我计划写一篇关于这个主题的后续文章,稍后我会在这里添加链接。同时,如果你对Python中的嵌套函数感兴趣,搜索一下Python中的高阶函数可能会对你有帮助。
将函数视为对象是正常的
Python 具有头等函数, 这意味着:
你可以将函数赋值给变量
你可以将函数存储在列表、字典或其他数据结构
你可以将函数传入其他函数中
你可以编写返回函数的函数
将函数视为对象似乎有些奇怪,但这在Python中并不少见。据我统计,大约15%的Python内置函数都能接受函数作为参数(min、max、sorted、map、filter、iter、property、classmethod、staticmethod、callable)。
Python的头等函数最重要的用途是:
将一个key函数传递给内置的sorted、 min和 max函数
将函数传递给像filter和itertools.dropwhile这样的循环助手程序
将一个“默认值生成工厂函数”传递给defaultdict之类的类
通过将函数传递给functools.partial来对它们进行“部分计算”