📊 Modelos en producción (en vivo)
| Bot | Estrategia | Venue | Equity | Peak | DD | uPnL | Estado |
|---|---|---|---|---|---|---|---|
| V2 | GRU ensemble | spot | $21.42 | $23.32 | −8.1% | +0.12% | 🟢 LONG |
| V3 | hybrid_v3 | spot | $22.06 | $23.40 | −5.7% | — | 🟢 cash |
| V4 | hybrid_v5 3-regime | spot | $20.88 | $23.57 | −11.4% | — | 🟢 cash |
| V5 | V115_cmp cascade | spot | $18.89 | $20.16 | −6.3% | +0.72% | 🟢 LONG |
| V6 | V66 cascade | spot | $20.13 | $20.87 | −3.5% | +0.12% | 🟢 LONG |
| V7 | V5 + vol-Kelly | margin·LIVE | $20.50 | $22.05 | −7.0% | -0.00% | 🟢 LONG |
Equity = cash sobrante + posición BTC marcada a precio en vivo (~$63,611). Capital real total ≈ $124 en 6 bots (~$20/bot). Todos los pods RunPod cerrados; sin R&D pesado en curso.
🧠 Cómo funciona el sistema (arquitectura)
Flujo: el precio → features → un ensemble de 5 GRUs predice P(subida)/P(bajada) → la cascada decide entrar/salir según régimen → vol-Kelly dimensiona (solo V7) → ejecuta en Binance. El overlay V13 (LLM leyendo noticias) corre en sombra, sin tocar el trading.
Última actualización: 2026-06-11 · Fuente: revisión en vivo de los 6 bots + state files + overlay V13.
Resumen en una frase
6 bots long-only en producción (equity real ~$123) que ya recorrieron el ciclo completo en vivo: protegieron capital en cash durante el −8% de inicios de junio y re-entraron LONG el 08-jun (régimen bear, longs selectivos de la cascada). BTC ~$62.9k → posiciones con pérdida no realizada pequeña (−0,4% a −1,1%), equity ≈ plano. La frontera de "buscar más alpha" sigue agotada y demostrada; el trabajo ahora es convertir el edge del backtest en dólares reales fiables.
Novedades desde 2026-06-07
- Los 6 bots pasaron de cash a LONG (entradas 08-jun ~$63.5k). Equity total $123.12; uPnL −0,4%/−1,1% con BTC ~$62.9k. La cascada entró longs dentro de régimen bear (comportamiento selectivo esperado), no esperó a confirmación de bull.
- V13 (overlay LLM en sombra) está disparando activamente: 100 decisiones 03→11-jun → 53 reduce / 18 veto / 20 normal (≈71% de-risk). Cita ETF outflows, Israel-Irán, oil, proyectos de ley fiscales. Pero solo ha visto 1 evento de entrada de V7 → sigue sin haber entradas reales que validen el overlay. Confirma el reenfoque: medir AUC forward sobre los holds, no PnL de entradas. El 71% de de-risk también levanta bandera de calibración base-rate (riesgo "reloj parado").
- RunPod: todos los pods cerrados. Sin entrenamientos pesados en curso. Docker: 6 bots
Up 9 days (healthy).
Estado del R&D — la frontera de alpha está agotada
Esta es la conclusión más importante, ganada con ~25 rondas (R250-R268) en este ciclo y ~250 en total. No es pesimismo: es un resultado empírico replicado. La señal de BTC 15min está limitada por DATOS (~0.63 AUC), no por nuestro esfuerzo — confirmado interna (un RandomForest sin tunear iguala al GRU refinado) y externamente (arXiv 2511.18578: GBDT ≥ transformers gigantes pre-entrenados en dirección financiera).
Lo que se ha probado y CERRADO (no re-proponer)
| Categoría | Probado | Veredicto |
|---|---|---|
| Datos free | OHLCV, MTF, fracdiff, funding, ETH, F&G, CVD order-flow, on-chain | 🔴 Sin edge |
| Datos pago (free-probe) | SOPR / MVRV / NUPL (positioning) | 🔴 = "precio vs su media" |
| Arquitecturas | Transformer, TCN, CNN-GRU, Mamba, foundation models | 🔴 Ninguna bate al GRU |
| RL / sizing / gating | RL policy, drawdown-Kelly, equity-DD, ACI conformal, sample-weighting | 🔴 Marginal o negativo |
| Multi-activo / stat-arb | BTC-ETH cointegración, cascada ETH/SOL transfer | 🔴 Muerto por slippage (10-30bps) |
| Shorts (6 variantes) | P(SL), modelo dedicado, selectivo bear-only, GRU short 5min (GPU) | 🔴 AUC ≠ PnL; long-only es óptimo |
El cuello de botella vinculante
No es la falta de señal. Es el coste de ejecución (slippage) + la dificultad de cronometrar regímenes. Tu campeón V7 es robusto precisamente porque BTC tiene spreads finos y el long captura el sesgo secular.
Plan de acción — TOP 3 (esta semana, $0, sin banner)
- Ledger de slippage real en vivo — desbloquea todo. Unir el precio ejecutado vs el de señal en los logs de trades → distribución de bps medida. Sin esto ninguna decisión de capital es honesta. Read-only.
- Hacer V13 medible + arreglar throttle — 100 decisiones LLM (03→11-jun, 71% reduce/veto) pero solo 1 evento de entrada de V7 → casi 0 entradas que validar, y un 71% de de-risk huele a "reloj parado". Reenfoque: medir AUC forward sobre los holds (¿un de-risk predice de verdad el drawdown a 4/24h?) + calibración base-rate. Medible en ~10 días.
- Ejecución post-only/limit — A/B en SOMBRA — el único lever de alta certeza (~75%, no decae). Simular
LIMIT_MAKERen cada fill real, registrar bps ahorrados + tasa de no-ejecución. El cambio en vivo va con banner.
Próximas direcciones y tests (priorizado)
| # | Acción / test | Tipo | Coste | Banner | Primer paso |
|---|---|---|---|---|---|
| 1 | Ledger de slippage en vivo | Medición | $0 | No | Join executed vs intended price por bot/lado |
| 2 | V13 medible: AUC forward sobre holds + fix throttle | Validación | $0 | No | Log retorno fwd 4/24h en cada event-bar |
| 3 | Post-only execution — A/B sombra | Ejecución | $0 | No | Sim LIMIT_MAKER + fill-miss-rate en cada fill |
| 4 | Gate de edge en vivo pre-registrado | Decisión | $0 | No | ≥40 round-trips, WR±1SE de 54.8%, PnL/trade≥0 |
| 5 | Sonda de profundidad de order-book | Medición | $0 | No | Walk-the-book cost para $100/$2k/$10k |
| 6 | Métricas por-trade de V6/V66 | Ops | $0 | No | Instrumentar run_v66_with_shorts |
| 7 | Monitor de exposición correlada (ρ≈0.9) | Riesgo | $0 | No | Net-long agregado + alertas |
| 8 | Meta-labeling P(win) dampener | R&D | ≤$2 GPU | No | GBDT sobre trades ejecutados; gate min-α+30 |
| 9 | L2 microestructura — pre-screen FREE primero | R&D | $0→$ | No | Grabar L2 Binance 1-2 sem; nunca pagar si AUC≤0.63 |
| — | RL | R&D | GPU | — | El último — solo si 1-9 se agotan |
Qué NO hacer (cerrado — re-proponerlo desperdicia ciclos)
- Buscar señal nueva en datos free · arquitecturas nuevas · shorts (toda forma)
- Tweaks de sizing/riesgo como alpha · stat-arb / multi-activo (muerto por slippage)
- Pagar L2 antes del pre-screen free · promover V13 a vivo ahora (0 validación) · empezar RL
- La trampa nº1: confundir "plano en un bear" con "edge confirmado". El comportamiento defensivo está validado; el alpha NO (solo ~13 trades reales). No escalar capital con el número del backtest.
Bottom line honesto
El sistema es una cascada long-only defensiva y robusta que acaba de demostrar en vivo que protege capital en un bear — exactamente la prioridad declarada (robustez > retorno). El camino realista no es "encontrar más edge" sino convertir el edge del backtest en dólares reales fiables, gateado por las dos restricciones vinculantes (coste de ejecución + muestra de ~13 trades reales). El próximo trimestre es poco glamuroso y casi todo $0/sin-banner: medir slippage, registrar un gate de edge falsable, sondear profundidad, hacer V13 medible, y probar post-only en sombra. Los dos levers con upside genuino son post-only execution y una escalera de capital paciente gateada por slippage real — ambos con banner, ambos lentos por diseño.