2026-05-13 变更记录
摘要
1. 数据采集增强: hko_data_fetcher.py 新增 fetch_text_readings() 函数,可从 HKO text_readings_e.htm 页面解析过去24小时温差、草地温度、能见度、太阳辐射等额外数据,并写入 DuckDB;所有文件写入改为原子操作(.tmp + os.replace)。
2. 预测模型权重调优: hko_predict.py 大幅调整信号权重体系——提高预报权重(12%→18%),降低微观信号权重(天气文本8%→4%、湿度15%→6%等),并改进了峰值锁定逻辑:停滞检测现在以内陆站确认结果为准,避免午间正常波动误判为结构性分离。
3. 状态数据防污染: weather_signal.py 和 app.py 新增 stale lower_bound 守卫,当日预言日期与今天不符时自动清零 lower_bound,防止昨天观测最大值污染今天的下限计算;hko_predict.py 在 DuckDB 返回 None 时新增 text_readings 回退机制。
4. 回测验证系统上线: app.py 新增 /api/weather/hk/backtest 端点,可对比模型预测 vs Polymarket市场价 vs 实际结算温度,前端新增"回测验证"标签页展示 MAE对比图、逐日明细表和胜率统计。
5. 新增定时清理脚本: reset_lower_bound.py 用于每日23:50 HKT定时清除前一天的 lower_bound,确保日界切换后预测不被污染。
变更文件
scripts/hko_data_fetcher.py | 336 +++++++++++++++++++++++++++++++--
scripts/hko_predict.py | 240 +++++++++++++++++------
scripts/reset_lower_bound.py | 58 ++++++
src/mm/weather_signal.py | 33 +++-
src/web/app.py | 224 ++++++++++++++++++++--
src/web/templates/mm_weather_simu.html | 4 +-
src/web/templates/weather_hk.html | 196 +++++++++++++++++++
7 files changed, 1012 insertions(+), 79 deletions(-)