Tokenización en LLMs: por qué el español y el código te cuestan más dinero
Un LLM no lee texto, lee números. Cómo se hace esa conversión define tu factura, tu latencia y hasta tus bugs raros. Y el español paga un plus real.
CTO y emprendedor con +15 años de experiencia en tecnología. Comparto mi conocimiento sobre liderazgo técnico, arquitectura de software y estrategia empresarial.
Un LLM no lee texto, lee números. Cómo se hace esa conversión define tu factura, tu latencia y hasta tus bugs raros. Y el español paga un plus real.
Un LLM no razona ni consulta nada: calcula probabilidades y muestrea. Entender ese único bucle te da criterio de ingeniero y explica casi todo.
El cuello de botella ya no es el modelo, es lo que lo rodea. Qué es el harness engineering y por qué un mismo modelo rinde 6x mejor o peor