Explorando el pasado de la web (II): OldWeb Today
agosto 30, 2025
Defensa de tesis Emiliano Calomarde
diciembre 4, 2025Para olvidar a Jina hicimos algo obvio. Contrastamos clasificación de humanxs vs clasificación de Jina.Ai, en su mejor versión. Las más de 12 mil fotos de Fotos de Familia servirán para tener indicios sobre cómo clasifica el modelo. Qué ve donde veo un documento o por qué no percibe una foto como parte del conjunto «rambla» y prefiere «personas». Recordemos que le paso la foto, el epígrafe, la categoría que elegí y este diccionario para ampliar un poco ese contexto:

Este es un pantallazo de los resultados

Jina se lleva fotos de categorías como «barrio» y «playa» para el lado de los acontecimientos. ¿El peso de los epígrafes? Qué cosas de una cadena de texto puede desplazar una foto de playa hacia el eterno presente del ritual o hacia un «diminuto instante» del vivir? Hice un sankey para mirar esto mismo de otro modo, como si fueran votos traccionados por otras fuerzas.

Hay que explorar esas migraciones, un poco más atentamente. Vamos dejando atrás a Jina, la reranker, pero muy lentamente porque todavía tiene mucho para decirnos de la clasificación de los «humanos» 🙂


