Status Update · BTC Trading AI

STATUS UPDATE · 2026-06-11

6 bots LIVE · 6/6 en posición LONG · equity $123

Tras proteger capital en cash durante el −8% de inicios de junio, la cascada re-entró LONG el 08-jun (régimen bear, longs selectivos). BTC ~$63,446: posiciones con pérdida no realizada pequeña (−0,4% a −1,1%), equity total $123 ≈ plano vs aporte. La frontera de alpha sigue agotada; el foco es convertir el edge del backtest en dólares reales fiables (medir slippage, gate de edge falsable, V13 medible).

📊 Modelos en producción (en vivo)

Bot	Estrategia	Venue	Equity	Peak	DD	uPnL	Estado
V2	GRU ensemble	spot	$21.61	$23.32	−7.3%	+5.50%	🟢 LONG
V3	hybrid_v3	spot	$21.55	$23.40	−7.9%	+5.60%	🟢 LONG
V4	hybrid_v5 3-regime	spot	$20.27	$23.57	−14.0%	+5.55%	🟢 LONG
V5	V115_cmp cascade	spot	$18.99	$20.16	−5.8%	+5.90%	🟢 LONG
V6	V66 cascade	spot	$20.22	$21.27	−4.9%	+5.90%	🟢 LONG
V7	V5 + vol-Kelly	margin·LIVE	$20.23	$22.05	−8.3%	+5.90%	🟢 LONG

Equity = cash sobrante + posición BTC marcada a precio en vivo (~$63,446). Capital real total ≈ $123 en 6 bots (~$20/bot). Todos los pods RunPod cerrados; sin R&D pesado en curso.

CAPITAL POR BOT (USD)

🧠 Cómo funciona el sistema (arquitectura)

Flujo: el precio → features → un ensemble de 5 GRUs predice P(subida)/P(bajada) → la cascada decide entrar/salir según régimen → vol-Kelly dimensiona (solo V7) → ejecuta en Binance. El overlay V13 (LLM leyendo noticias) corre en sombra, sin tocar el trading.

Última actualización: 2026-07-03 07:00 UTC · Fuente: state files + logs docker + precio en vivo leídos EN EL MOMENTO de publicar (regla nueva tras el error del 28-jun).

⚠️ Corrección del status anterior (28-jun)

El status del 28-jun decía "6/6 en cash" — era INCORRECTO: usaba una lectura del día 26 por la mañana, y los bots entraron LONG el 26-jun 19:15 (V5/V6/V7, ~$59,9k) y el 27-jun 19:30 (V2/V3/V4, ~$60,1k). Telegram tenía razón. Proceso corregido: todo status re-lee el estado en el momento de publicar (skill live-status).

Resumen en una frase

6 bots long-only INVERTIDOS desde el 26/27-jun cerca del suelo (~$60k); con BTC a $61,8k llevan +2,7% a +3,1% de uPnL — camino de ser los primeros trades ganadores relevantes. Equity $119,69. Desde inception (18-may): fleet −8,5% vs B&H −20,2% → α +11,7 pts, casi todo por pérdida evitada estando en cash.

La verdad incómoda de los 21 round-trips cerrados

WR vivo: 1/21 (5%) vs 54,8% esperado del backtest. Suma −55 pts, media −2,62%/trade.
Patrón claro trade a trade: la cascada compra dips en tendencia bajista y los exits defensivos (danger/peak_drop/trail) los cortan con pérdida pequeña (−0,7% a −7,9%). El α (+11,7 pts) viene de estar en cash la mayor parte del tiempo, no de los trades.
Con la correlación entre bots (21 RTs ≈ 7-8 apuestas independientes), este WR en un bear persistente es compatible con el modelo pero preocupante: el gate vivo de 40 RTs está al 52% y va camino de fallar en expectancy. Decisión formal a los 40 RTs (~4-6 semanas): si falla → de-risk/consolidación, NO escalera de capital.
Las 6 posiciones abiertas (+3%) pueden mover la foto — se evalúan al cierre, no antes.

Novedades

Fee real confirmado en 19 fills: 0,0950%/lado exacto (2,4× lo asumido en 270 rondas).
LAB autónomo: ejecutadas hasta L031+ (labels distribucionales, utilidad contrafactual, vol-forecast; ~8 direcciones cerradas con registro limpio). Fase GPU (L032-L034: política continua end-to-end, arquitecturas desde cero, microestructura 1m) pendiente de presupuesto GPU explícito del usuario.
Docker: 6/6 healthy (18 días). RunPod: 0 pods. Web auto-refresh cada 6h operativo.

Estado del R&D — la frontera de alpha está agotada

Esta es la conclusión más importante, ganada con ~25 rondas (R250-R268) en este ciclo y ~250 en total. No es pesimismo: es un resultado empírico replicado. La señal de BTC 15min está limitada por DATOS (~0.63 AUC), no por nuestro esfuerzo — confirmado interna (un RandomForest sin tunear iguala al GRU refinado) y externamente (arXiv 2511.18578: GBDT ≥ transformers gigantes pre-entrenados en dirección financiera).

Lo que se ha probado y CERRADO (no re-proponer)

Categoría	Probado	Veredicto
Datos free	OHLCV, MTF, fracdiff, funding, ETH, F&G, CVD order-flow, on-chain	🔴 Sin edge
Datos pago (free-probe)	SOPR / MVRV / NUPL (positioning)	🔴 = "precio vs su media"
Arquitecturas	Transformer, TCN, CNN-GRU, Mamba, foundation models	🔴 Ninguna bate al GRU
RL / sizing / gating	RL policy, drawdown-Kelly, equity-DD, ACI conformal, sample-weighting	🔴 Marginal o negativo
Multi-activo / stat-arb	BTC-ETH cointegración, cascada ETH/SOL transfer	🔴 Muerto por slippage (10-30bps)
Shorts (6 variantes)	P(SL), modelo dedicado, selectivo bear-only, GRU short 5min (GPU)	🔴 AUC ≠ PnL; long-only es óptimo

El cuello de botella vinculante

No es la falta de señal. Es el coste de ejecución (slippage) + la dificultad de cronometrar regímenes. Tu campeón V7 es robusto precisamente porque BTC tiene spreads finos y el long captura el sesgo secular.

Ledger de slippage real en vivo — desbloquea todo. Unir el precio ejecutado vs el de señal en los logs de trades → distribución de bps medida. Sin esto ninguna decisión de capital es honesta. Read-only.
Hacer V13 medible + arreglar throttle — 100 decisiones LLM (03→11-jun, 71% reduce/veto) pero solo 1 evento de entrada de V7 → casi 0 entradas que validar, y un 71% de de-risk huele a "reloj parado". Reenfoque: medir AUC forward sobre los holds (¿un de-risk predice de verdad el drawdown a 4/24h?) + calibración base-rate. Medible en ~10 días.
Ejecución post-only/limit — A/B en SOMBRA — el único lever de alta certeza (~75%, no decae). Simular LIMIT_MAKER en cada fill real, registrar bps ahorrados + tasa de no-ejecución. El cambio en vivo va con banner.

Próximas direcciones y tests (priorizado)

#	Acción / test	Tipo	Coste	Banner	Primer paso
1	Ledger de slippage en vivo	Medición	$0	No	Join executed vs intended price por bot/lado
2	V13 medible: AUC forward sobre holds + fix throttle	Validación	$0	No	Log retorno fwd 4/24h en cada event-bar
3	Post-only execution — A/B sombra	Ejecución	$0	No	Sim LIMIT_MAKER + fill-miss-rate en cada fill
4	Gate de edge en vivo pre-registrado	Decisión	$0	No	≥40 round-trips, WR±1SE de 54.8%, PnL/trade≥0
5	Sonda de profundidad de order-book	Medición	$0	No	Walk-the-book cost para $100/$2k/$10k
6	Métricas por-trade de V6/V66	Ops	$0	No	Instrumentar `run_v66_with_shorts`
7	Monitor de exposición correlada (ρ≈0.9)	Riesgo	$0	No	Net-long agregado + alertas
8	Meta-labeling P(win) dampener	R&D	≤$2 GPU	No	GBDT sobre trades ejecutados; gate min-α+30
9	L2 microestructura — pre-screen FREE primero	R&D	$0→$	No	Grabar L2 Binance 1-2 sem; nunca pagar si AUC≤0.63
—	RL	R&D	GPU	—	El último — solo si 1-9 se agotan

Qué NO hacer (cerrado — re-proponerlo desperdicia ciclos)

Buscar señal nueva en datos free · arquitecturas nuevas · shorts (toda forma)
Tweaks de sizing/riesgo como alpha · stat-arb / multi-activo (muerto por slippage)
Pagar L2 antes del pre-screen free · promover V13 a vivo ahora (0 validación) · empezar RL
La trampa nº1: confundir "plano en un bear" con "edge confirmado". El comportamiento defensivo está validado; el alpha NO (solo ~13 trades reales). No escalar capital con el número del backtest.

Bottom line honesto

El sistema es una cascada long-only defensiva y robusta que acaba de demostrar en vivo que protege capital en un bear — exactamente la prioridad declarada (robustez > retorno). El camino realista no es "encontrar más edge" sino convertir el edge del backtest en dólares reales fiables, gateado por las dos restricciones vinculantes (coste de ejecución + muestra de ~13 trades reales). El próximo trimestre es poco glamuroso y casi todo $0/sin-banner: medir slippage, registrar un gate de edge falsable, sondear profundidad, hacer V13 medible, y probar post-only en sombra. Los dos levers con upside genuino son post-only execution y una escalera de capital paciente gateada por slippage real — ambos con banner, ambos lentos por diseño.