答案。

问题的历史

懒惰处理（lazy evaluation）是一种编程技术，在这种技术中，计算被推迟到代码需要结果的时候。在 Python 语言中，这种范式因生成器和标准库中的特殊函数（如 itertools）而受到欢迎。这些技术最初源于函数式语言，但 Python 提供了本地和第三方工具来进行懒惰处理。

问题

传统的贪婪（eager）处理要求立即加载和计算所有数据（例如，在使用列表表达式时），这可能导致大量的内存消耗，并在处理大型或无限序列时降低性能。懒惰处理允许“按需”加载和处理元素，从而避免不必要的资源消耗。

解决方案

在 Python 中，懒惰处理不仅通过生成器（yield）实现，还通过 itertools 模块中的特殊懒惰函数、标准函数类型 map、filter 以及生成器表达式（generator expressions）类型的对象实现。例如，函数 map() 返回一个懒惰的迭代器，它只在被调用时计算值：

# 懒惰处理示例：将每个数字平方
squares = map(lambda x: x ** 2, range(10**10))  # 不消耗列表的内存
print(next(squares))  # 0
print(next(squares))  # 1

关键特点：

懒惰处理节省内存，并可以处理无限的数据流
懒惰迭代器易于组合，形成转换链
并不是所有的标准函数和结构都支持懒惰处理，有时如果需要访问所有元素，必须显式转换成列表

误导性问题。

在 Python 中，map() 函数是否总是实现懒惰处理？如何知道哪些标准函数是懒惰的？

不，从 Python 3 开始，map()、filter()、zip() 返回迭代器，即实现懒惰处理。在 Python 2 中，这些函数返回列表。要确定对象是否懒惰，可以查看其类型或查阅文档：

result = map(lambda x: x+1, range(5))
print(type(result))  # 'map' — 这是一个迭代器

在 sum() 函数内使用生成器表达式时，懒惰处理会有效吗？

函数 sum() 要求遍历整个迭代器直到结束。生成器表达式本身是懒惰的，但 sum() 最终仍然消耗整个序列：

s = sum(x**2 for x in range(1000000))  # 生成器完全被消耗

可以通过 map/lambda 对普通列表和元组应用懒惰处理吗？

是的，可以，但列表和元组仍然加载在内存中。Map 会在其上返回懒惰的迭代器，但原始数据仍然完全在内存中。为了实现完整的懒惰链，最好在每个阶段都使用生成器：

def gen():
    for i in range(1, 100):
        yield i

squares = map(lambda x: x**2, gen())  # 一切都是懒惰的

常见错误和反模式

多次迭代已经耗尽的懒惰迭代器（例如，通过 map(…)）会导致数据意外缺失
使用懒惰函数与在迭代过程中改变的可变集合
“过早”将懒惰迭代器转为列表（通过 list()），这会消耗内存

现实中的示例

负面案例

开发者为一个大日志文件编写处理程序，使用生成器表达式过滤行，但误将其立即转换为列表：

with open('biglog.txt') as f:
    important_lines = [line for line in f if 'ERROR' in line]  # 加载整个文件

优点：

实现简单
可以立即访问所有行

缺点：

在处理大文件时，内存消耗巨大，程序风险崩溃

正面案例

另一团队使用懒惰方法结合生成器表达式，按需处理行：

with open('biglog.txt') as f:
    for line in (l for l in f if 'ERROR' in l):
        process(line)