问题的回答

历史上，加载速度问题被视为一种工程指标，但随着**核心网页生命值（Core Web Vitals）**进入搜索算法，移动流量的增长，性能显然成为了一种产品特性。经典的速度影响评估方法面临根本的内生性问题：拥有快速设备和稳定互联网的用户通常获得更好的转化率，无论网站的优化程度如何，这造成了虚假的相关性。

在使用**边缘计算（Edge Computing）**和现代CDN架构的情况下，这一问题进一步恶化，因为由于边界服务器的激进缓存，无法保证一致的流量分流。此外，还存在自我选择效应：慢速连接的用户更可能在加载之前离开网站，这扭曲了样本的分布，使得纯粹的A/B比较变得不可行。

理想的解决方案结合了回归不连续设计（Regression Discontinuity Design, RDD)，在“良好”性能阈值的边界（例如，LCP = 2.5秒）上使用工具变量（instrumental variables, IV)作为工具。作为工具变量，使用用户与最近的边缘服务器的地理距离或连接类型（3G vs 4G），这随机影响速度，但不直接与购买意图相关。对于群体分析，应用合成控制方法（synthetic control method），通过构建具有类似设备和地理位置的用户的历史数据的对照组，从而使纯优化效应与季节性和宏观趋势隔离。

生活中的案例

在一个大型电子商务项目中，前端团队进行了一场革命：将图像转换为现代格式（WebP, AVIF）并实现懒加载，优化了关键渲染路径，将良好连接下的LCP从4.2秒降低到1.8秒。产品团队在“发布后”的时间段内记录了转化率增长12%的数据，但因同时启动的季节性广告活动和产品目录更新，因果关系的怀疑油然而生。

选项1：天真的前后对比

分析师们建议将优化前一周和优化后一周的用户转化进行比较，并按地区进行分层。优点： 实现简单，无需复杂基础设施。缺点： 完全忽略了季节性（节假日前的一周）、受众组成差异（新用户来自意图不同的广告）和生存偏见（survivorship bias）——慢速用户“消失”在更新后的样本中，造成增长的错觉。

选项2：速度与转化率的相关性分析

第二种方法是建立回归分析，其中独立变量是用户的实际LCP，因变量是转化的事实。优点： 利用所有可用数据，并且粒度细化到会话。缺点： 致命的内生性：使用昂贵旗舰和快速互联网的用户通常更富有，并且有更强的购买动机，而使用3G廉价设备的用户，即使网站速度快也往往缺乏购买意图，这使得结果偏高40-60%。

选项3：带地理工具的回归不连续设计

团队选择了一种混合方法：将最近的边缘服务器（edge server）的距离作为工具变量，与速度相关但不与购买行为相关。位于覆盖区域边缘（信号“断裂”为LCP速度骤降至2.6-2.8秒）的用户形成了围绕2.5秒阈值的局部随机样本。通过在±0.3秒的窗口内应用局部平均处理效应（Local Average Treatment Effect, LATE），他们测量了速度改善的纯效应，对于因基础设施变化而改变速度的用户（compliers）。

选择的解决方案和结果

实现了RDD+IV方法，并通过分析localStorage对返回用户进行了额外的过滤，以检查缓存的资源。最终评估显示，优化的真实增量效果为新用户转化率的+8.5%和返回用户的+3.2%（新效应较小），这为投资**边缘计算（Edge Computing）**基础设施提供了340%年度投资回报率的合理依据。

候选人常常忽略的内容

为什么标准OLS回归性能与转化率的关系会导致偏差评估，且这里主导的内生性机制是什么？

答案在于双重自我选择（double selection bias）：首先，慢速设备的用户系统性地较少出现在“成功会话”样本中（他们在加载之前就离开），造成截断偏差；其次，互联网速度与社会经济状态及地理位置相关，直接影响支付能力。没有工具变量或RDD，回归将“快速互联网作为财富标志”的效应与“快速网站作为转化触发”的效应混为一谈，过高地估计了真实因果效应1.5-2倍。

客户端缓存（client-side caching）和重复访问如何扭曲纵向分析中的优化效果评估，哪种方法可以滤除“治疗污染”？

在优化前访问过该网站的回访用户，在HTTP缓存或Service Worker中有旧的重资源，因此他们的“治疗”（新快速版本）在部分或全部不适用，造成治疗与对照组之间的污染。候选人常常忘记检查If-None-Match头或带有第一次访问时间印戳的第一方cookie的分析。正确方法是进行**意图治疗（intent-to-treat, ITT）分析，将“纯新会话”（新用户+清除缓存）与“污染的回访用户”分开，或者使用差异中的差异（difference-in-differences, DiD）**带固定用户效应，以隔离用户内变化与用户间选择。

ITT分析（意图治疗）和TOT分析（治疗对接受者）在评估核心网页生命值时有什么区别，为什么在缩放计划中对于产品指标必须特别关注ITT？

ITT测量整个群体的效应，包括那些未获得速度改善的人（例如，2G用户或禁用了JavaScript的用户），而TOT（或IV上下文中的LATE）仅测量“合规者”的效应——那些真正从优化中获益的人。候选人常常错误地向企业报告TOT评估（+15%转化率，如果获得快速加载），但在对100%流量进行优化时，真实效果会更接近ITT（+6-8%），因为部分受众在技术上无法获得改善（过时设备、慢速网络）。在业务规划和收入预测中，使用保守的ITT评估至关重要，以避免错误的过度承诺。