第82章 復现包

386万+文本索引已就绪,自动翻页与阅读记录保持运行。

auto next 开启后阅读到底自动进入Next
⚡ 开启自动翻页更爽 看到章尾自动进入Next,追书不用一直点。

  江临把那张写著【下一执行目標】的audit_log关掉,新建了一个空白的python文件。

  minimal_leak_demo.py

  距离对方要求的24小时窗口期,还剩二十三个小时四十一分。

  时间够用,但他没有任何懈怠的意思。

  构造一个最小復现实验,听起来简单,做起来却是一桩挺讲究分寸的活。

  第一,不能用平台提供的那3.4gb原始数据集的任何一个字节。

  否则对方可以反咬一口,说他是利用了数据集本身的某种特殊结构在断章取义。

  第二,不能太复杂。

  如果脚本写得花里胡哨,依赖了一堆奇形怪状的库,对方的工程师在覆核时光是配环境就要折腾半天,覆核流程一拖,事情就容易被冷处理。

  第三,必须锁死隨机种子。

  任何一个浮点数的微小波动,都可能被对方技术组归因於环境差异,进而拖慢覆核流程。

  江临盯著空白的代码窗口,思考了两分钟,然后开始动手,用numpy生成了一段由两个不同分布拼接而成的隨机时间序列。

  前八十个数据点,服从均值为零、標准差为一的正態分布,用来模擬训练窗口里平稳的市场行情。

  后二十个数据点,被他人为地注入了几个三倍標准差以上的极端值,用来模擬测试窗口里突然出现的异常事件。

  整个数据构造过程,不超过十行代码。

topics玄幻都市科幻仙侠武侠游戏历史同人