Strategy Leaderboard
Modelos del proyecto: producción, candidatos a deployment, alternativas validadas y direcciones cerradas. Cada uno con arquitectura, indicadores, métricas y recomendación.
🟢 En producción (deployed)
V66 entra siempre con todo el capital. Sale cuando: stop fijo 10%, trail tight (3 niveles según unrealized: 22%→18%→5%), DRSI diario > 78 (overbought), 3/5 GRUs votan danger (P(SL)>0.70 o P(TP)<exit_th), o peak_drop (caída del avg_tp_bar desde su pico). Cooldown post-loss 48 bars + post-any-exit 4 bars. Threshold por régimen (bull/lateral/bear) detectado vía slope diario.
MANTENER como sleeve principal. Hyperparams calibrados rigurosamente — cualquier modificación destruye performance (probado 13 veces en sprint R141-R158, R162, R168-R169).
🏆 Candidato a deployment (validado audit + OOT)
Aprovecha que el GRU canónico predice CAÍDAS además de subidas. V66 lo usa solo para SALIR de longs. R151-A lo usa también para ABRIR shorts durante los gaps en cash de V66. Captura alpha bear/correction que V66 deja sobre la mesa. Modesta pero REAL — sobrevive bug-fixed engine + audit + OOT 2026.
★ DEPLOYMENT LEADER (único después de R173 audit). Build R151ShortsTrader.py extender HybridV115Trader. Requires Binance perp BTCUSDT. Add funding cost overlay realista. Paper trade 60 días.
En backtest aparenta +258K compound pero el motor permitía apalancamiento sin coste (Bug #4 audit). En honest engine, cada uno de los 517 intentos de pyramid se bloquea porque V66 está always-invested (cap=0). En spot Binance no existe leverage gratis. En perp pagas funding. R163 baseline tiene exactamente el mismo problema.
NO desplegar. Pyramid se podría re-explorar con modelado realista de margin trading + funding cost overlay — pero coste-beneficio incierto.
Aprovecha que el GRU canónico predice CAÍDAS (P(SL)) además de subidas. V66 lo usa solo para SALIR de longs. R151-A lo usa también para ABRIR shorts durante los gaps en cash de V66. Captura alpha bear/correction que V66 deja sobre la mesa.
Tercera opción si quieres exposición direccional simétrica (longs + shorts). Requiere Binance perp BTCUSDT — costo de funding ~0.01%/8h. Tail risk en F2 (recovery) documentado. Half-Kelly sizing reduce varianza.
⚠️ Validadas en backtest pero NO en OOT
En backtest aparenta super-aditividad: pyramid captura F2/F3 (recovery/lateral) mientras shorts capturan F0/F1 (bear/bull). Pero en OOT 2026 los shorts triggerearon en el mismo gap window donde pyramid iba a fire → cannibalización.
NO desplegar como está. Re-explorar si pyramid y shorts pueden usar CAPITAL DIFERENTE (no compartido) o si pyramid puede operar dentro de positions existentes mientras shorts operan en sub-account.
❌ Direcciones cerradas (13 fine-tuning attempts)
| Round | Tried | Result |
|---|---|---|
R141 | Loose event filter (return_pct=80) | compound +4.6%, min α -220 |
R142 | Tight event filter (return_pct=95) | compound +38%, min α -216 |
R143 | Labeling tb3_vol_15_10 | compound +6K, min α +15 |
R144 | Bigger arch GRU 2x256 | compound -38%, min α -203 |
R146 | ATR-adaptive stops | all variants worse than canonical 10% |
R148 | R134 as veto filter | skip rate 92-97%, kills V66 |
R150 | Max-DD circuit breaker | no DD/compound tradeoff worth it |
R155/R156 | Short-specific GRU (tb3_vol_7_10) | P(SL) noisier than canonical |
R157/R158 | Short-specific GRU (tb3_vol_15_5) | catastrophic, min α -290 |
R162 | R134 as size multiplier | forces V66 to size down at wrong times |
R168/R169 | Multi-timeframe features (1H+4H) | val_loss better but backtest collapses |
Lección consolidada: 13 fine-tuning attempts vs V66 fallaron. 2 paradigmas funcionaron (R163 pyramid, R151-A shorts) — ambos AÑADEN sleeves a V66 sin modificarla. Regla de oro: ADD orthogonal sleeves, NEVER modify V66 inputs/architecture.
📊 Ranking POST-AUDIT (R173 bug-fixed engine, OOT 2026)
| Rank | Strategy | OOT 2026 α | Backtest min α | Backtest compound | Status | Recomendación |
|---|---|---|---|---|---|---|
| 1 | R151-A Shorts (honest) | +15.3% | +194 | +113,981% | CANDIDATE | ★ DEPLOY V7 |
| 2 | V66 canonical (current, honest) | +12.4% | +193 | +42,636% | PRODUCTION | Mantener V2-V6 |
| 3 | R151-A half-Kelly (honest) | +11.5% | +178 | +76,873% | VARIANT | Conservative alt |
| — | R163 Pyramid baseline | +60.3% (PHANTOM) | +373 (PHANTOM) | +199K (PHANTOM) | FAILED | NOT REAL (R173 audit) |
| — | R170-B Pyramid | +71.9% (PHANTOM) | +415 (PHANTOM) | +257K (PHANTOM) | FAILED | NOT REAL (R173 audit) |
| — | R166 COMBINED | +13.8% (artifact) | +287 (PHANTOM) | +454K (PHANTOM) | FAILED | Cannibalization + audit |
| — | R175 Transformer | — | -224 | +91.9% | FAILED | Calibration mismatch |
Note: Original "RECORD" rankings of R163/R170-B/R166 from R163-R171 were inflated 1.66-6.05× by R173 audit-discovered bugs (intra-bar lookahead + unfunded leverage). Numbers above for those rows show ORIGINAL (PHANTOM) values for reference — these strategies cannot be deployed because they rely on impossible cash mechanics.