Tokenización en LLMs: por qué el español y el código te cuestan más dinero
Un LLM no lee texto, lee números. Cómo se hace esa conversión define tu factura, tu latencia y hasta tus bugs raros. Y el español paga un plus real.
Artículos sobre desarrollo, arquitectura, estrategia y negocios tecnológicos
4 artículos
Un LLM no lee texto, lee números. Cómo se hace esa conversión define tu factura, tu latencia y hasta tus bugs raros. Y el español paga un plus real.
Un LLM no razona ni consulta nada: calcula probabilidades y muestrea. Entender ese único bucle te da criterio de ingeniero y explica casi todo.
Medí Serena MCP y Caveman en 5 experimentos A/B reales sobre Claude Code. Resultado: cada herramienta tiene una ventana óptima estrecha — fuera de ella gasta más
Gastaba más de $300 al día en tokens. Hoy gasto menos de $80 con el mismo output. Estas son las técnicas que uso para optimizar cada sesión de desarrollo con IA.