Tokenización en LLMs: por qué el español y el código te cuestan más dinero
Un LLM no lee texto, lee números. Cómo se hace esa conversión define tu factura, tu latencia y hasta tus bugs raros. Y el español paga un plus real.
Artículos sobre desarrollo, arquitectura, estrategia y negocios tecnológicos
3 artículos
Un LLM no lee texto, lee números. Cómo se hace esa conversión define tu factura, tu latencia y hasta tus bugs raros. Y el español paga un plus real.
Un LLM no razona ni consulta nada: calcula probabilidades y muestrea. Entender ese único bucle te da criterio de ingeniero y explica casi todo.
El cuello de botella ya no es el modelo, es lo que lo rodea. Qué es el harness engineering y por qué un mismo modelo rinde 6x mejor o peor