第82章 復现包
386万+文本索引已就绪,自动翻页与阅读记录保持运行。
auto next
开启后阅读到底自动进入Next
⚡ 开启自动翻页更爽
看到章尾自动进入Next,追书不用一直点。
  江临把那张写著【下一执行目標】的audit_log关掉,新建了一个空白的python文件。
  minimal_leak_demo.py
  距离对方要求的24小时窗口期,还剩二十三个小时四十一分。
  时间够用,但他没有任何懈怠的意思。
  构造一个最小復现实验,听起来简单,做起来却是一桩挺讲究分寸的活。
  第一,不能用平台提供的那3.4gb原始数据集的任何一个字节。
  否则对方可以反咬一口,说他是利用了数据集本身的某种特殊结构在断章取义。
  第二,不能太复杂。
  如果脚本写得花里胡哨,依赖了一堆奇形怪状的库,对方的工程师在覆核时光是配环境就要折腾半天,覆核流程一拖,事情就容易被冷处理。
  第三,必须锁死隨机种子。
  任何一个浮点数的微小波动,都可能被对方技术组归因於环境差异,进而拖慢覆核流程。
  江临盯著空白的代码窗口,思考了两分钟,然后开始动手,用numpy生成了一段由两个不同分布拼接而成的隨机时间序列。
  前八十个数据点,服从均值为零、標准差为一的正態分布,用来模擬训练窗口里平稳的市场行情。
  后二十个数据点,被他人为地注入了几个三倍標准差以上的极端值,用来模擬测试窗口里突然出现的异常事件。
  整个数据构造过程,不超过十行代码。