Inteligencia artificial y música
Cabezas, máquinas y centralización: por qué los músicos tienen que hackear la Inteligencia Artificial

Cabezas, máquinas y centralización
Cabezas, máquinas y centralización | © Splitshire, Colourbox

En este artículo, Peter Kirn, director del CTM Hacklab, nos introduce en el tema de cómo una industria centralizada se apropia de la música y de los hábitos de escucha y califica a Muzak de precursora en el uso de Inteligencia Artificial para crear una “cultura preprogramada”. Además analiza estrategias efectivas para que todos los que prefieren la libertada de decisión y la incertidumbre puedan reaccionar e interactuar día a día con las tecnologías que cada vez tienen más presencia.

Ahora ya no existe, pero alguna vez Muzak (una empresa que producía música ambiental) estuvo en todas partes. La gerencia se encargó de que su producto musical fuera omnipresente, penetrante y a la vez estuviera orientado a influir en las conductas. Así, la palabra muzak se convirtió en sinónimo de todo lo aborrecible que pudiera haber en la industria musical.

Por más que hoy en día pueda parecer anacrónico, Muzak fue, sin embargo, un símbolo de cómo en el futuro las tecnologías de la telecomunicación marcarían el consumo cultural. Si lo más famoso de Muzak es su sonido reconocible, también es digno de notar su método de transmisión. Casi un siglo antes que Spotify, el fundador de Muzak, el general mayor George Owen Squier, tuvo la idea de difundir música a través de cables –cables telefónicos, para ser más precisos–, algo que en el fondo no es tan diferente de los métodos actuales. La patente que recibió por su “técnica de señal eléctrica” no incluía música ni contenidos sonoros. Aun así, el general mayor fue el primer empresario exitoso que demostró en la práctica que la distribución electrónica de música era el futuro, un futuro que les quitó poder a las emisoras de radio y les asignó más influencia sobre los contenidos a las empresas distribuidoras. (Squier también fue quien inventó al –ahora aborrecido– nombre de la marca, “Muzak”.)

Lo que conocemos como industria musical convencional tiene sus raícen en los rodillos de la pianola, más tarde en las rocolas y, por último, en las emisoras de radio y en medios físicos. Comparado con estos, Muzak era por completo diferente ya que dio vuelta toda la estructura: las listas de reproducción eran elaboradas y alimentadas en algún lugar por una empresa invisible, centralizada. Muzak se podía oír en los ascensores de los centros comerciales (de ahí la expresión “música de elevador”). También había parlantes escondidos en las plantas. La Casa Blanca y la NASA estuvieron abonadas por un tiempo a Muzak. El silencio se reemplazó por música preprogramada.
Elevador moderno con música Elevador moderno con música | © Colourbox La empresa aumentó su grado de conocimiento gracias a la introducción de un mecanismo promocionado bajo el nombre de Progresión de Estímulos, un producto pseudocientífico para incrementar la productividad en el trabajo. En su concepto, Progresión de Estímulos se asemeja a los loops y motivadores de conducta de los aplicativos de hoy, pensados para estimular el consumo y la actividad, o por ejemplo, para aumentar el número de clics en las publicidades y de deslizamientos en las aplicaciones.

Con todo, en algún momento, Muzak dejó de sonar, la “progresión de estímulos” también había perdido su magia. Los clientes prefirieron la música bajo licencia por sobre esa música de fondo, y nuevos competidores conquistaron el mercado.


¿Pero qué pasó con la idea de un concepto cultural homogenizado, preprogramado, transmitido por un cable y que tiene por objeto la manipulación de la conducta? Esta idea parece estar activa de nuevo.

Automatización y poder

La inteligencia “artificial” o “automática”" se concentra hoy en un campo determinado: la utilización de algoritmos dotados de autoaprendizaje para el procesamiento de grandes cantidades de datos... una necesidad de nuestra época. Esto resulta especialmente útil para algunos actores tecnológicos que tienen la capacidad de aprovisionamiento y las competencias en los campos que son de prioridad en el aprendizaje automático: muchos servidores, analistas matemáticos de primera clase y grandes cantidades de datos.

El desplazamiento se dará de modo forzoso: la radio implica un programa limitado; un programa limitado implica selectores humanos, a saber, el DJ. La naturaleza de Internet –estar abierta las culturas de cualquier clase– significa inevitablemente también un volumen enorme de datos. No habrá otra opción que incluir máquinas en el proceso de clasificación, ya que la oferta de Internet es sencillamente demasiado grande.

Este cambio entraña riesgos. En primer lugar, lleva a los usuarios a una posición de comodidad en la que se dejan dictar preferencias en lugar de elegir ellos mismos. En segundo lugar, las empresas seleccionadores siguen sus propios planes e intereses. Visto en conjunto, esto podría derivar en una normalización y homogenización más fuerte, y existe el peligro de que se margine a los que piensan distinto, a los de menor poder adquisitivo o a aquellos cuyo estilo de vida no encaje con el de las clases pudientes o dominantes.

Esta es tal vez una de las causas por las que, a Internet como utopía de una comunidad de música global parece faltarle, en la práctica, una verdadera diversidad.

Por otro lado, esto nos debería resultar conocido: la aparición de medios de grabación y de emisión trajo algo parecido, una espantosa música pop pegadiza y una evidente apropiación cultural. La diferencia es que ahora, en lugar de rankings de éxitos y directores de discográficas, tenemos algoritmos y editores de canales corporativos, pero los mismos problemas como el chantaje y la eliminación de cualquier opinión divergente.

Nuevos son, sin embargo, los loops de feedback en tiempo real entre las acciones de los usuarios y la selección programada automáticamente (y pronto tal vez el productor). La “progresión de estímulos” de Squier no podía examinar los datos que partían del oyente, pero las actuales herramientas online sí pueden. Las distorsiones existentes pueden corregirse o intensificarse muy rápidamente, o también puede darse una combinación de ambas acciones.
 

En cualquier caso, se trata de un desarrollo fundamental. En el CTM-Hacklab del 2017, Jason Rentfrow (Universidad de Cambridge) exploró hasta qué punto nuestras preferencias musicales dicen algo sobre la personalidad y el pensamiento político. La investigación se hizo en el momento justo: su presentación coincidió con la semana en Donald Trump asumía la presidencia de los Estados Unidos. El equipo de campaña de Trump había realizado diferentes análisis de redes sociales para determinar el mejor modo de apelar y manipular a los electores.

El consumo de música, igual que cualquier otro consumo de información y cultura, ya es inseparable de los datos que se generan en su curso, y también de la utilización posterior de esos datos. Es recomendable el escepticismo frente a los monopolios centralizados de datos y el uso de esa información y hay que tener consciencia de los cambios que esta clase de algoritmos implica. Ya es uno de los desafíos de esta época la lucha por la recuperación de la autodeterminación y el control.

Aunque el consumo pasivo de medios les pueda parecer valioso, las empresas podrían comprobar que ese consumo está decayendo de modo notable. Comprar en Amazon, encontrar citas en Tinder, mirar películas y series en Netflix y cada vez más también escuchar música son actividades que favorecen las recomendaciones algorítmicas. Pero si los usuarios siguen sólo esas recomendaciones automáticas, las propuestas tienden a girar cada vez más sobre sí mismas y las herramientas preprogramadas pierden su valor. Los usuarios quedan ante un creciente e invisible montón de basura, compuesto de los propios historiales y los del entorno más inmediato (cualquiera que haya abandonado las citas por Tinder o haya ido a visitar a amigos porque no podía decidirse de qué serie sería la siguiente maratón entenderá de qué hablo).

Las recomendaciones humanas, sean de expertos o de amigos, tienen evidentemente un valor social. Pero también hay un tercer camino: que las máquinas se usen para mejorar a los hombres y no para empeorarlos, que las herramientas estén abiertas a múltiples opciones de uso en lugar de servir únicamente a procesos de automatización.

El sector de la música ya aprovecha la eficacia del entrenamiento en datos. Gracias a la aplicación de aprendizaje automático para la identificación de gestos humanos, Rebecca Fiebrink desarrolló un nuevo método para hacer que las interfaces gestuales para música sean más inteligentes y accesibles. Las empresas de software de audio usan ahora el aprendizaje automático como nuevo principio para influir en el material sonoro en casos en los que las herramientas tradicionales, digitales, de procesamiento de señales encuentran un límite. Lo esencial es que esas herramientas adquieren relevancia en el diseño activo y no en el consumo pasivo.

Devolver la Inteligencia Artificial a los usuarios

Las técnicas de aprendizaje automático se expandirán como herramientas para mejorar el aprovechamiento de los recursos obtenidos por las grandes empresas que extraen datos... Desde la materia prima hasta el producto final. En última instancia se trata de cómo estas empresas ven a sus usuarios y de cómo los usuarios se ven a sí mismos.

Y es un proceso al que uno no puede rehusarse: esas herramientas marcarán el mundo con o sin la participación de los usuarios. Además, el volumen mismo de los datos existentes exige su uso. Lo que sí podemos hacer es aprender, entender mejor el modo de funcionamiento de las herramientas y así reconstruir la propia capacidad de acción.

Si se ilustrara a los hombres sobre qué son estas tecnologías y como funcionan, podrían tomar decisiones mejor fundadas para su propia vida y para la sociedad en general. Podrían hacer buen o mal uso de las herramientas en lugar de que productos mágicos de las empresas lo hagan por ellos.

Hasta el mal uso de estas herramientas tiene un valor especial. La música y el arte son campos en los que estas técnicas pueden producir nuevos conocimientos. Hay una buena razón por la que Google ha invertido precisamente en estos campos: muchas veces los artistas pueden sondear posibilidades y encontrar potencial creativo. Los artistas fijan el camino.

A su vez, el público parece tener reaccionar a los recovecos, las aristas y los errores. En los años sesenta, cuando el investigador Joseph Weizenbaum intentó con su programa ELIZA parodiar a un psicoterapeuta por medio de un tosco modelo lingüístico, se sorprendió al ver que los usuarios le revelaban sus secretos más oscuros al programa e imaginaban una empatía terapéutica que en realidad no existía en absoluto. El uso de las llamadas cadenas de Markov como herramienta textual de predicción, desarrollado en realidad para predecir series de datos por medio de su probabilidad da aparición y no para generar textos, llevó a florecimientos poéticos extremadamente curiosos. Cuando se utilizó la técnica de transferencia de estilo de Google en una base de datos de fotos de perros, los resultados grotescos, antinaturales que eran fotos de perros desfiguradas, se hicieron virales. Desde entonces Google desarrolló técnicas mucho más refinadas para aplicar efectos pictóricos realistas y... y resulta que esas nuevas técnicas despertaron muchísimo menos interés que las fotos desfiguradas de perros.
Pero quizás esté operando un elemento más fundamental. Las culturas empresariales necesitan previsibilidad y valores centrales. El artista, por su parte, actúa en sentido exactamente contrario y trabaja con sorpresas. Por eso beneficia al artista el hecho de que las tecnologías puedan ser saboteadas. Muzak representa lo que pasa con la estética cuando se imponen controles centralizados y valores empresariales... pero Muzak también es la gran indignación pública que exhorta a la prudencia. La sorpresa y el principio de poder elegir deben tener prioridad no sólo como conceptos abstractos sino también como preferencias personales.

Alguna vez tuvimos miedo de que la robótica aniquilara los puestos de trabajo; y de hecho, el sustantivo “robot” en su origen tiene el significado de esclavo (la palabra la inventó el artista Joseph Čapek, cuyo hermano, el escritor Karel Čapek, la usó en su obra de teatro R.U.R. y de allí pasó a la literatura universal). Sin embargo, al final la tecnología robótica amplió las capacidades humanas. Llevó a los hombres al espacio y a pasear por Logo (el lenguaje de programación para niños) con su gráfica de la tortuga, y mediante Code les ha enseñado a generaciones de niños matemática, geometría, lógica y pensamiento creativo.

Al parecer, el aprendizaje automático se encuentra ante una encrucijada parecida. Las direcciones de las empresas y los usuarios que consumen medios pasivamente se ven beneficiados con estos sistemas, que favorecen el consumo inercial y generan datos que se pueden usar. El mal uso de programas mediante su desmontaje intencional y su rearmado (no como herramientas universales sino como un armado de técnicas preciso para solucionar problemas específicos) abre oportunas posibilidades de uso alternativo. En el fondo, Muzak no era otra cosa sino un sueño. Lo que la gente quería era música y libertad para decidir. Pero estas decisiones no debe tomarlas una máquina. Nosotros debemos hackearlas.