问题的答案

问题的历史

在 Python 的数据模型中，属性访问遵循严格的协议，其中 __getattribute__ 定义在基础 object 类上，并作为每个属性查找的主要拦截器。该方法在所有属性访问中无条件调用，无论该属性是否存在，因此在解析链中是第一道防线。相比之下，__getattr__ 是一个可选的钩子，只有在正常搜索实例字典和类层次结构失败无法找到请求的名称时，解释器才会调用它。

问题

当子类重写 __getattribute__ 以自定义行为（如日志记录或访问控制）时，方法体内的任何直接属性访问（如 self.attr 或 self.__dict__）都会递归触发同一重写的方法。这会创建一个无限循环，因为查找机制已被劫持，并且没有基本案例来终止递归，最终耗尽调用栈并引发 RecursionError。

解决方案

为了安全实现 __getattribute__，您必须使用 super().__getattribute__(name) 或 object.__getattribute__(self, name) 委托给基本实现。这绕过了重写的逻辑，从实例字典或类层次结构中实际检索属性，而无需重新进入自定义方法。该模式确保您可以包装、验证或转换结果，同时保持对象模型的完整性并防止无限循环。

代码示例

class SafeProxy:
    def __init__(self, wrapped):
        # 必须在这里使用 super() 以避免初始化期间的递归
        super().__setattr__('_wrapped', wrapped)
    
    def __getattribute__(self, name):
        # 在检索之前记录访问
        print(f"访问: {name}")
        # 委托给对象以避免无限递归
        return super().__getattribute__(name)

生活中的情境

场景

开发团队需要为遗留的 ORM 模型实现审计跟踪，其中每次字段访问必须记录以满足合规要求，而不修改原始模型类。他们需要一种解决方案，能够透明地拦截读取，避免在数百个模块中破坏现有的业务逻辑。

问题描述

系统需要拦截现有和缺失属性以记录时间戳和用户操作。仅仅通过子类化和在单个方法中添加记录是不切实际的，因为动态字段数量庞大。解决方案必须对现有代码透明，并且不能改变模型的公共接口。

解决方案 1: 猴子补丁模型方法

该方法涉及在运行时动态替换类的方法，以注入日志记录调用，针对特定行为进行定位，而不改变源定义。它允许根据配置有条件地应用，并避免继承的复杂性。然而，它无法拦截对数据描述符或简单值的直接属性访问，需要对每个新方法进行维护，并在内部实现细节发生变化时失效。

解决方案 2: 使用 __getattr__ 进行日志记录

实现 __getattr__ 以记录对缺失属性的访问仅提供了一个简单的回退机制。它避免了递归问题，易于实现且代码量少。然而，它仅在实例或类中找不到的属性上触发，错过了对现有字段的大多数访问，这违背了全面日志记录的审计要求。

解决方案 3: 使用 __getattribute__ 的代理类

创建一个包装类，实施 __getattribute__ 能够在委托给包装的 ORM 实例之前拦截所有属性读取，均匀地捕捉每次访问。这通过组合保持了透明性，并允许在不触及遗留代码的情况下进行前处理和后处理。权衡是需要小心处理递归，并且由于每次属性访问额外的方法调用，导致轻微的性能开销。

选定解决方案

团队选择了使用 __getattribute__ 的代理方法，因为合规法规要求捕获每个属性读取，包括方法从不触及的简单数据字段。代理模式提供了完整的拦截能力，同时保持封装，允许遗留的 ORM 仍然保持原样且不知道审计层的存在。这个选择在综合覆盖和审计完整性方面付出了最小的性能代价。

结果

该实施在生产环境中成功记录了每小时超过 50,000 次属性访问，而没有出现单次递归错误或对遗留代码库的修改。使用 super() 的委托模式确保了操作的稳定性，并且在测试环境中可以通过简单地移除包装实例化来禁用代理，证明了该方法的灵活性。

候选人经常忽视的内容

为什么在 __getattribute__ 内访问 self.__dict__ 会触发无限递归？

当您在重写的 __getattribute__ 方法中编写 self.__dict__ 时，Python 必须在实例上查找名为 __dict__ 的属性。该查找又会调用您的自定义 __getattribute__ 方法，这会尝试再次访问 self.__dict__，造成一个无休止的循环。要打破这个循环，您必须使用 object.__getattribute__(self, '__dict__')，这样可以绕过您的重写，直接从基本对象实现中检索字典。

__getattribute__ 如何不同于 __getattr__ 影响描述符协议？

__getattribute__ 位于属性解析链的最前面，这意味着它在描述符协议检查 __get__ 方法之前拦截查找。如果您的实现未调用 super() 返回一个值，则描述符（如 property 或自定义数据描述符）将被完全绕过。相比之下，__getattr__ 仅在描述符协议和实例字典查找都失败后执行，因此它从不拦截在类层次结构中存在的描述符。

在 __getattribute__ 内手动引发 AttributeError 的后果是什么？

与标准属性访问不同，其中 AttributeError 可能会触发 __getattr__ 作为备用方案，Python 将 __getattribute__ 视为权威来源。如果您的自定义实现引发 AttributeError，解释器会立即传播异常，而不试图调用 __getattr__。这意味着如果您的主要钩子失败，您不能依赖 __getattr__ 来处理缺失的属性；相反，您必须在 __getattribute__ 内处理缺失的键，或确保您委托给正确引发异常的父实现。

在属性解析中，**Python** 的 `__getattribute__` 与 `__getattr__` 有何区别，以及在实现前者时，哪个委托模式是避免无限递归的必需？

问题的答案

生活中的情境

候选人经常忽视的内容

在属性解析中，Python 的 `getattribute` 与 `getattr` 有何区别，以及在实现前者时，哪个委托模式是避免无限递归的必需？