la cámara semántica

La gente sigue preguntando si la AI puede hacer arte. Es la pregunta equivocada. Era la pregunta equivocada cuando la hicieron sobre la fotografía hace 150 años y es la pregunta equivocada ahora.
En 1983, Vilém Flusser escribió Hacia una Filosofía de la Fotografía. Propuso que la cámara no es una herramienta. Un martillo es una herramienta. Una herramienta extiende el cuerpo humano para actuar sobre el mundo. La cámara es otra cosa: un aparato, una caja negra que opera según su propio programa interno, un espacio combinatorio de outputs posibles que el operador humano (Flusser los llamaba funcionarios) puede explorar pero nunca agotar del todo. El fotógrafo no usa la cámara como un carpintero usa un martillo. El fotógrafo juega dentro del programa de la cámara.
Un LLM es una cámara. No metafóricamente. Estructuralmente. "Cámara" acá nombra una clase de aparato: una caja negra con un programa que transforma el encuadre del operador en un artefacto técnico.
La cámara toma fotones del mundo, los pasa a través de vidrio y química, y del otro lado produce una imagen técnica: la interpretación de la realidad por parte del aparato, filtrada a través de su programa. El LLM toma lenguaje de un humano que está en el mundo, lo pasa a través de miles de millones de conexiones ponderadas moldeadas por el entrenamiento, y del otro lado produce un output técnico: la interpretación de esa realidad por parte del aparato, filtrada a través de su propio programa.
Cámara: realidad → luz → óptica → imagen técnica
LLM: realidad → lenguaje → pesos → output técnico
La fotografía empieza con contacto: la luz tocando un sensor. La cámara semántica empieza una capa de abstracción más profundo, con el lenguaje ya comprimiendo la realidad antes de que el programa siquiera arranque. La caja negra tiene todavía más espacio para blanquear su output como "verdad".
En ambos casos, el humano es el que apunta el aparato hacia algo. El fotógrafo apunta la cámara a una escena callejera. El prompter apunta el modelo a un concepto, un sentimiento, una pregunta, un fragmento de experiencia vivida. El humano apunta. El aparato codifica. Y en ambos casos, lo que sale del otro lado no es la realidad. Es la realidad codificada por el programa del aparato.
Flusser insistía: la gente confunde las fotografías con ventanas al mundo, pero son productos de la caja negra. El mismo error pasa con los LLMs. La gente lee el output como si fuera "la respuesta" o "la verdad". Es la transformación programática del input por parte del modelo. Es un texto técnico. Parece lenguaje de la misma forma en que una fotografía parece realidad, pero es un producto del aparato.
Distintos modelos son distintas cámaras. Modelos de texto y modelos de imagen son distintas especies del mismo género: aparatos generativos con programas distintos. DALL·E, Midjourney, Stable Diffusion, Claude, GPT, Gemini: cada uno tiene su propia óptica, su propio programa, su propia forma de muestrear y procesar la realidad. Un retrato sacado con una Leica se ve distinto de uno sacado con una Canon, no porque la realidad cambió sino porque el aparato interpreta distinto. Una imagen de Midjourney se ve distinta de una de DALL·E, no porque el prompt cambió sino porque los pesos, la arquitectura, el corpus de entrenamiento constituyen un lente diferente.
La pregunta nunca fue "puede la cámara hacer arte". La pregunta siempre fue "qué está haciendo el humano con el aparato, y si resiste la tendencia del programa hacia la redundancia". Por redundancia me refiero a los outputs que el programa quiere producir: los defaults de alta probabilidad, los casi-duplicados, el modo automático del significado.
Misma pregunta. Nueva cámara.
Notas desde Adentro del Diluvio, 2026
Referencias:
- Flusser, Vilém. Hacia una Filosofía de la Fotografía (1983)
- Salvaggio, Eryk. Cybernetic Forests (continuación contemporánea de Flusser en el dominio de imagen AI)