Este artículo se publicó originalmente en The Conversation, en abril de 2021, con el título "Así funciona el gran bazar de los microgéneros en Netflix". Lo republicó aquí con otro título y con material extra al final, con notas no usadas en la publicación original y enlaces y algunas reflexiones post-publicación. Por casualidad, existe también una versión en inglés.
![](https://csidgid.inf.um.es/wp/bigcontent/wp-content/uploads/2021/05/Theconversatino_rigor.jpg)
Otros títulos posibles que barajé para el artículo eran: "Sabías que quieres ver comedias tronchantes de inspectores de policía? El arte de poner nombre a los microgéneros en Netflix"; "Clasificar sin complejos, cuando Netflix se atreve a proponernos comedias tronchantes de inspectores de policía, pero tu librero no" (O cambiando librero por bibliotecario o Amazon) y "Festival de categorías, cuando Netflix se atreve a recomendarte comedias tronchantes de inspectores de policía" ... y casi termina saliendo con este retruécano "Macrofestival de microgéneros, cómo Netflix etiqueta sin complejos comedias tronchantes de inspectores de policía".
Tomas Saorín, Universidad de MurciaCuando al entrar en Netflix encontramos que se nos sugieren tres franjas, una para “Comedias tronchantes de inspectores de policía”, otra para “Dramas románticos británicos basados en libros” y una tercera de “Dramas sensuales de temática LGBT”, nos podemos hacer muchas preguntas, no solo sobre los algoritmos de recomendación de contenidos, sino sobre quién y cómo le pone nombre a las cosas.
Netflix no es un catálogo de películas sino, usando el término de Robert J. Glushko en su libro The discipline of organizing, un “sistema de organización”. Y la vida en sociedad está hecha justo de eso, de cosas que organizamos que forman entornos que entendemos y a los que es necesario poner nombres.
Amarrar un significado en construcción con una palabra acertada es una obra mágica, una ingeniería del lenguaje, un arte menor. Pero, volviendo a los rótulos que identifican a las líneas de películas que nos sugiere Netflix, ¿a qué se le está poniendo nombre?
Neflix está proponiendo nombres para “colecciones de recursos”, agrupaciones de contenidos que guardan una serie de afinidades temáticas, estructurales, de estilo o de producción. Lo que entendemos a simple vista como “géneros audiovisuales”.
Está, al mismo tiempo, construyendo un vocabulario controlado o una clasificación de géneros e indizando, categorizando recursos al asignarles esos géneros a unas obras. Sin embargo, la idea convencional de género o clasificación, cuando pasa por la batidora termonuclear del Big Data y el consumo digital hiperpersonalizado, se convierte en un Gremlin que ha comido después de medianoche.
Drama y acción no se llaman así en la plataforma
Los géneros como drama, acción, cine de terror, que en cualquier monografía sobre cine podemos ver extendidos y detallados, se convierten en Netflix en una montaña de hasta 79 000 pies de altura, según el instrumento de excavación y medida que usemos) que la compañía denomina microgéneros o altgenres. En una exploración podemos extraer más de 20 000 microgéneros, junto con la lista de las películas que aparecen recomendadas para un usuario concreto de la plataforma.
Sobre el sistema de recomendación de Netflix se ha escrito mucho, y es seguramente una de sus fórmulas mágicas para hacer funcionar su invento, pero vamos a plantearnos preguntas sobre el etiquetado, sobre el nombre de las cosas.
Existen muchas técnicas para hacer agrupaciones –análisis de diferentes grupos por similitud, clustering en inglés– a partir de colecciones extensas de recursos usando los datos disponibles sobre ellos: datos propios, datos de uso o sus relaciones.
La inteligencia artificial y sus decisiones
Aplicando cualquier modelo de agrupamiento podemos obtener grupos significativos que nos presentan afinidades que a simple vista no eran fáciles de prever. Pero estos conjuntos, desde el punto de vista de la comunicación cultural, adolecen del clásico problema de algunos casos de aplicación de la inteligencia artificial, es difícil explicitar la motivación de las decisiones y el por qué de su elección.
Cuando Amazon nos hace recomendaciones y nos dice que “otras personas también compraron” tal o cual cosa, no nos explica qué nos gusta y por qué. Cuando Google nos recomienda contenido al buscar, no pone en palabras lo que nos interesa, no nos etiqueta, mientras que cuando Netflix nos coloca un rótulo como “Dramas motivadores basados en libros” nos recomienda y al mismo tiempo nos explica la razón por la que nos va a gustar, pone en palabras el gusto (el género, el patrón) con el que podemos reconocernos en la propuesta, e incluso pretende explicarnos nuestro comportamiento como consumidores.
Las consecuencias de las clasificaciones
Toda clasificación tiene sus consecuencias, como explican Geoffrey Bowker y Susan Leigh Star, puesto que es una infraestructura construida socialmente: crea un espacio para lo posible y unas relaciones entre las cosas. Y Netflix lo hace sin complejos, entendiendo, con toda lógica, que para poder conectar altos volúmenes de contenido con altísimos volúmenes de usuarios poseídos de un incansable deseo de consumo, hace falta disparar muchas flechas en muchas direcciones diferentes, y que las grandes etiquetas tradicionales como drama o comedia no se pueden lanzar en una flecha, sino con una catapulta.
En la punta de la flecha solo cabe una pequeña tira de papel enrollada, un microgénero, una descripción directa para asignar sentido a una agrupación de contenido y acertar al usuario en el corazón y pasarle su veneno. El gran contenido necesita minimetadatos, muy detallados y muy granulares.
Y aquí la plataforma digital ha tomado la larga experiencia de clasificación en bibliotecas, con sus ideas de precoordinación, precisión, neutralidad y ordenación del conocimiento, y las ha llevado a otro nivel. Monumentales sistemas que listan términos apropiados para temas y subdivisiones de materias por géneros, como la Lista de Encabezamientos de Materias de la Library of Congress, han sido invadidos por cuerpos mutantes, juguetones y desvergonzados, que se atreven a llamar a ciertas películas “Lacrimógenas genuinas”.
Los algoritmos de la plataforma trazan el comportamiento de los usuarios, pero necesitan apoyarse en el trabajo de los etiquetadores que describen aspectos relevantes del contenido de las obras (sexo, guerra, crimen) y de sus efectos sobre el espectador (miedo, motivación, paz). Y, además, proponen nombres para los microgéneros, transgrediendo sin complejos toda la literatura sobre organización del conocimiento: clasificación, categorización, encabezamientos de materias, etc.
Y es aquí donde las grandes bases de datos y plataformas de contenidos han quebrado la teoría clásica sobre cómo organizar información que se ha aplicado en bibliotecas y archivos, entidades con quienes comparte el reto de dar acceso a un catálogo o un fondo amplio de recursos, cuyo valor se le supone pero ha de ser puesto en movimiento para que se haga real.
Podríamos llamar a todo esto big content, contenido no solo en grandes cantidades, sino sometido a grandes cantidades de uso. Big ya lo hemos asumido como pareja de baile del termino «datos» en la expresión Big data.
Big es masivo, más que grande, enorme, de un tamaño inabarcable. Y para que el contenido masivo sea abarcable necesita mejores metadatos, descripciones más profundas que permitan el acceso intelectual a través de una red muy densa de vías de entrada: películas ambientadas en la revolución francesa, libros en los que la esposa adúltera sea castigada por la sociedad, novelas de ciencia ficción en las que haya contacto con alienígenas, cuadros en los que aparezcan perros, películas con actrices que hayan rodado películas con James Dean…
Enriquecer, luego filtrar
A todo esto, la teoría actual sobre bibliotecas digitales lo llama “enriquecer, luego filtrar”: son necesarios muchos datos descriptivos de partida que puedan ser enriquecidos posteriormente por diversos grupos de interés para, desde ellos, producir el filtrado que necesitemos para posibilitar la experiencia de uso.
Porque la sociedad de la información ubicua y masiva tiene un problema de filtrado, presente en cada una de sus facetas: el cine, la búsqueda, la investigación, la participación ciudadana, las citas en línea… Para todo aquello que podemos tratar como un contenido, la curación o curaduría trata de intervenir en esas geometrías irregulares y fluctuantes de la recomendación, el descubrimiento y la valoración de información relevante para el individuo y para el colectivo.
Los motores de recomendación son un mecanismo tan necesario como los motores de indización. La nueva arquitectura de la realidad –los microgéneros de Netflix, las búsqueda de Google, el catálogo infinito de Amazon– convierte en arqueología a aquellos sistemas que, de buena fe, ofrecen un catálogo pequeño, sin recomendaciones, sin búsqueda inteligente, cuidado a mano como un mural escolar, con pocas etiquetas…
¿Puede un pequeño catálogo de libros electrónicos como el servicio eBiblio de las bibliotecas públicas españolas vivir alejado de sistemas de descubrimiento y recomendación de obras? ¿Puede un servicio basado en un catálogo no ser como Netflix?
La película Anna Karenina, de 2012, está asignada a 53 microgéneros en Netflix; a 2 géneros y 67 palabras clave en la web de calificación de películas IMbd; a 7 géneros o agrupaciones en Filmaffinity y solo al género “Dramas románticos cinematográficos” en el catálogo de la Biblioteca Nacional.
¿Cuántas etiquetas son suficientes? Pues se necesitan muchas sobre muchas cosas y usadas mucho y de mil maneras.
Tomas Saorín, Coordinador del grado en Gestión de información y contenidos digitales, Universidad de Murcia
Este artículo fue publicado originalmente en The Conversation. Lea el original.
Bonus track
Para la publicación de la colaboración en The Conversation quedaron fuera muchas notas y pistas. Se podría escribir un trabajo más largo, orientado a entender cómo entienden las plataformas digitales de contenido masivo la catalogación o descripción de sus recursos, y cómo eso alimenta su arquitectura de información y experiencia de usuario, para extraer lecciones útiles para replicar en otros contextos de difusión de información.
Elena Neira y su libro "Streaming Wars"
![](https://csidgid.inf.um.es/wp/bigcontent/wp-content/uploads/2021/05/portada_streaming-wars_elena-neira_202002050939.jpg)
Lamento no haber incluido referencias directas al libro de Elena Neira "Streaming wars, la nueva televisión digital", que aborda el tema de los metadatos y el etiquetado de una forma muy clara y desveladora. En conjunto es un libro muy claro sobre las industrias del entretenimiento, pero lo que me ha llamado la atención ha sido la sensibilidad para captar el valor del análisis del contenido para lubricar la circulación en el medio digital.
Voy a citar extensamente algunos párrafos de su libro, a modo de cuaderno de notas:
Streaming wars: la nueva televisión. Elena Neira. Libros La Cúpula, 2020
Content-based recommendation
En el texto me habría gustado haber mencionado claramente, y detenerme un poco, en el concepto de recomendación basada en el contenido (análisis del contenido), que se contrapone a filtrado colaborativo (dinámica usuarios), aunque actúen de forma combinada y retroalimentada en el diseño del sistema.
Los taggers que trabajan en Netflix: Words / Tags/ Collections / Ratings
Revisando las ofertas de trabajo de Netflix y la descripción de su propia organización departamental, encontramos varias figuras relacionadas con el etiquetado y la descripción, que son sugerentes porque encuadra a los catalogadores dentro de un perfil creativo editorial, de forma que podemos reconocer el trabajo documental clásico como integrado en la cadena de valor editorial, como una forma de curación de contenido que aporta valor en el medio digital de exposición pública de información para su consumo.
Encontramos información en este artículo "How Editorial Creative Sparks Joy and Discovery for Netflix Members" (Linkedin, febrero, 2020) firmado por Mary McIlwain, en su rol de Editorial Creative Curation Specialist en Netflix. Los catalogadores están encuadrados en el "Editorial Creative Team", cuyo lema es: Words / Tags/ Collections / Ratings y los perfiles que se describen se denominan: Editorial Analyst; Metadata Innovation Specialist; Curation Specialist.
En la descripción de una oferta de trabajo para este equipo, se habla de estas responsabilidades:
![](https://csidgid.inf.um.es/wp/bigcontent/wp-content/uploads/2021/05/Netflix-content-analist.png)
Esta otra oferta de trabajo para un puesto de Editorial Analyst, Originals describe el puesto así:
The ideal candidate has a deep knowledge, 5+ years experience, and education in the film and/or television industry, can write efficiently with attention to detail, is comfortable using a variety of publishing tools, and is thoughtful in the delivery of information while working on a diverse team.
Responsibilities
Qualifications
Nueva gramática y verticales
Sobre el etiquetado analítico de películas y series por su contenido, algo que encuentro relatado en bastantes publicaciones, aunque a nivel superficial, os copio cómo lo explican en una de Laura Pousa. Me gusta el término "nueva gramática". Lo que estaría bien es disponer de la guía interna de catalogación de Netflix, para entender en detalle su mágicao "Netflix Quantum Theory":
Laura Pousa, Las plataformas y la creación de contenidos mainstream: una aproximación a las nuevas ficciones convergentes / Secuencias, n. 47, 2018, DOI: http://dx.doi.org/10.15366/secuencias2018.47.004
En el análisis publicado en 2019 en Xataca los llaman "verticales", y los explica en relación a la planificación de la producción, como indicadores para decidir qué contenido se producirá.
2000 comunidades de gustos y 27000 micro-géneros, la base del sistema de recomendación de Netflix / Xataca, 2019
De este artículo luego comentaremos el concepto complementario de clusters o comunidades de gusto, las formas de promocionar y conseguir audiencia en un nuevo concepto de notoriedad más plural o "burbujeado".
¿Qué significa catálogo?
2000 comunidades de gustos y 27000 micro-géneros, la base del sistema de recomendación de Netflix / Xataca, 2019
En el ámbito GLAM (museos, archivos, bibliotecas) el concepto de catálogo es análogo al de base de datos con los registros descriptivos de unos recursos. También se usa catálogo como registro/recopilación/inventario en botánica, subastas, exposiciones, patrimonio, etc. Control de algo para conocer sus "ejemplares" y sus "propiedades". Sin embargo en el sector editorial y audiovisual "catálogo" nos remite a "propiedad acumulada" que se explota a lo largo del tiempo: es un recurso, un fondo. Y en el caso de Netflix y las plataformas audiovisuales se plantea el equilibrio entre "agregación del catálogo licenciado de otros" frente a "originales". Pero lo que me interesa aquí es el concepto de CATÁLOGO COMO MODELO DE PRESENTACIÓN DE CONTENIDOS AL USUARIO. De alguna forma, cuando una plataforma contiene un volumen contundente de recursos, el diseño de cómo se presenta el usuario siempre topa con algunos aspectos recurrentes como la búsqueda, ordenación, selección, agrupación que son propios de los sistemas de acceso a catálogos, pero que no funcionan en un contexto de consumo y entretenimiento. ¿Cómo se manejan entonces en Netflix Vuelvo a citar un trabajo de Elena Neira (y otros) donde señala al combinado de metadatos y analítica de usuarios
Impacto de los servicios over-the-top en la generación de comunidades de gustos y nichos globales: Netflix como estudio de caso / Elena Neira Borrajo, Judith Clares-Gavilán, Jordi Sánchez-Navarro / Comunicació: Revista de Recerca i d’Anàlisi [Societat Catalana de Comunicació] Vol. 37 (2) (novembre 2020), p. 93-111
Un final con cita de San Francisco de Asís
El artículo en realidad terminaba pomposamente así, forzando una cita de San Francisco de Asís que acababa de hacerme gracia mientras leí la novela de Martín Casariego "Yo fumo para olvidar que tú bebes". La editora solo conservó lo esencial:
Maqueta original del artículo para The Conversation
El libro tiene la gracia extra de que el autor ha considerado oportuno explicar algunas de las referencias, sin esperar a una improbable edición crítica de su obra. Creo que estas notas son meramente generacionales, porque piensa que su libro lo leerá alguien menor de 40 años que no reconoce las cosas de "la transi" y de los años de plomo en el País Vasco.
Martín Casariego, Yo fumo para olvidar que tú bebes
¿Cuántos microgéneros tiene Netflix?
![](https://csidgid.inf.um.es/wp/bigcontent/wp-content/uploads/2021/05/Ejemplo-Generos-principales-Netflix.png)
Los géneros principales que ofrece al usaurio Netflix son 18 (Abril 2021, en España, en mi casa. Pero está ahí sólo para cubrir las apariencias, donde se mueve el negocio de la oferta personalizada es en el terreno de los microgéneros.
En NETFOX.TV explotan los datos del catálogo de Netflix con otra lista más amplia de géneros principales, hasta 587, pero que no es ni de lejos el desparrame de los miles de microgéneros en estado salvaje.
Netflix usa la terminología altgenre o microgenre. Los números más citados con los casi 80.000 del famoso artículo de Madrigal en The Atlantic en 2014. Sin embargo, mi propio proceso de captura de los microgéneros, que incluye además la lista de películas que me recomienda a mí para ese microgénero, solo ha llegado hasta los 22.000 elementos, tras un rastreo de un puñado de miles de urls. Cada microgénero está accesible desde una url con un identificador numérico. "Thrillers británicos basados en libros" es el código 10759 y se accede desde https://www.netflix.com/browse/genre/10759 . Sin embargo el proceso de exploración secuencia de urls es algo arbirtrario, con huecos abundantes y saltos de millones de números. Donde están más concentrados los microgéneros es en las primeros 140mil, donde más o menos cada 10.000 urls secuencias se encuentran cerca de 1000 concordancias. Luego hay microgéneros encontrados en el intervelo de 1,5-3 millones,pero con menos regularidad. Finalmente se localizan unos pocos pasados los 80 millones, como "Epic worlds" en la posición 81.232.239.
Las páginas que dan acceso a la lista de los "códigos secretos" de Netflix varían en cantidad de microgéneros recogidos. Lo suelen agrupar en grandes géneros convencionales, que son:
Llermania, y Ogres-Crypt parecen usar la misma lista cruda agrupada, con unos 3.800 items. En un formato buscable, pero con la misma cantidad de items, nos lo ofrecen en el sitio web oficioso "What's on Netflix?"
![](https://csidgid.inf.um.es/wp/bigcontent/wp-content/uploads/2021/05/1557982242487.jpg)
El comparador online Finder ofrece una lista bastante amplia, con 27.000 microgéneros, que aunque no puede descargarse completa, puede buscarse filtrada por géneros principales, descripciones (Absurdo, Controversial, Cult...) y décadas. Estas cifras son las citadas por Xataca en su último análisis de 2019, anteriormente reseñado.
![](https://csidgid.inf.um.es/wp/bigcontent/wp-content/uploads/2021/05/Finder_Buscador.png)
Este buscador es una versión compacta del análisis de componentes que realiza el artículo seminal de 2014 de Madrigal, que analiza los patrones gramaticales de las etiquetas de los microgéneros, para obtener el modelo de un lenguaje precoordinado clásico:
![](https://csidgid.inf.um.es/wp/bigcontent/wp-content/uploads/2021/05/Components_Microgeners_TheAtlantic_2014-1024x484.png)
¿Dónde aparecen las etiquetas de microgéneros en Netflix?
No debemos olvidar que las etiquetas de microgéneros le sirven a Netflix sobre todo para construir nuestra página de navegación personalizada por defecto (por acierto, podríamos quizá escribir). Pero si no ha sido suficiente, si el usuario aún decide explorar o buscar por su cuenta (y esto no es lo que le gusta ni a Netflix ni al propio usuario, salvo en contadísimos casos de uso casi excepcionales), las etiquetas de microgéneros aún nos aparecerán en varios momentos (siempre que interactuemos con el sistema desde nuestro ordenador con el explorador. La app de la Smart TV o el móvil simplifican al máximo las opciones de usuario).
![](https://csidgid.inf.um.es/wp/bigcontent/wp-content/uploads/2021/05/Ejemplo_Ficha_Metadatos_Away_Serie.png)
Desde el navegador podemos explorar el etiquetado asignado a cada contenido en Netflix, donde se diferencia del microgénero en sí, las etiquetas del tipo "Pertence a", donde aparecen adjetivos como: Emotiva, emocionante, romántica...
![](https://csidgid.inf.um.es/wp/bigcontent/wp-content/uploads/2021/05/EtiquetasSugeridas.png)