Tokenización en LLMs: por qué el español y el código te cuestan más dinero
Un LLM no lee texto, lee números. Cómo se hace esa conversión define tu factura, tu latencia y hasta tus bugs raros. Y el español paga un plus real.
Artículos sobre desarrollo, arquitectura, estrategia y negocios tecnológicos
11 artículos
Un LLM no lee texto, lee números. Cómo se hace esa conversión define tu factura, tu latencia y hasta tus bugs raros. Y el español paga un plus real.
Un LLM no razona ni consulta nada: calcula probabilidades y muestrea. Entender ese único bucle te da criterio de ingeniero y explica casi todo.
El cuello de botella ya no es el modelo, es lo que lo rodea. Qué es el harness engineering y por qué un mismo modelo rinde 6x mejor o peor
Medí Serena MCP y Caveman en 5 experimentos A/B reales sobre Claude Code. Resultado: cada herramienta tiene una ventana óptima estrecha — fuera de ella gasta más
Gastaba más de $300 al día en tokens. Hoy gasto menos de $80 con el mismo output. Estas son las técnicas que uso para optimizar cada sesión de desarrollo con IA.
He usado ambos en producción durante meses. Esta no es una comparativa de features — es lo que pasa cuando los usas de verdad en proyectos enterprise.
No uso un agente de IA para programar. Uso nueve. Cada uno con un rol y un momento exacto. Mi pipeline completo con Claude Code.
He pasado un fin de semana probando Agent Teams en un desarrollo real. Te cuento cuándo merece la pena el coste extra y cómo montarlo.
Multiplica x3 tu productividad con Claude Code. Flujos de trabajo, gestión de contexto, ultrathink, subagentes, MCPs y más. Consejos reales de uso diario.
Arranque en 2 segundos, 45 Gbps de red y menor consumo de batería. Comparativa completa de OrbStack frente a Docker Desktop en macOS Silicon.
Aprende cómo implementar la arquitectura multi-tenant con Symfony y Doctrine. Descubre sus ventajas, la configuración de conexiones dinámicas y ejemplos prácticos para separar los datos de cada cliente de manera eficiente y segura.