La llegada de los transformers
Las siguientes conversaciones han sido completamente generadas por una inteligencia artificial a la que sólo le he suministrado las tres primeras frases en negrita:
La magia que hay detrás de este autocompletar hipervitaminado es GPT-3, un algoritmo entrenado para continuar textos de forma convincente. En algunos casos logra captar rasgos tan sutiles y humanos como el humor mientras mantiene conversaciones complejas alrededor de un tema.
GPT-3 pertenece a la familia de algoritmos conocidos como transformers, que han demostrado ser muy efectivos reconociendo patrones complejos en secuencias de elementos. Tratando el lenguaje como una secuencia de palabras se pueden entrenar para que, dado un texto de entrada (contexto), lo complete de la forma más creíble.
Gracias al Information Sciences Institute de Los Ángeles he recibido una invitación para probar esta herramienta, una de las más avanzadas en la actualidad, el Optimus Prime del lenguaje natural. Ya ha cosechado muchos éxitos resolviendo retos basados en texto como mantener conversaciones indistinguibles de las de un humano, ayudar a escribir novelas o incluso programar software a petición.
Un grado tan profundo de entendimiento del lenguaje natural puede mejorar enormemente nuestra forma de comunicarnos con interfaces conversacionales como Google Assistant o Alexa. Y como un gran poder conlleva una gran responsabilidad, la empresa que hay detrás de esta herramienta la está abriendo al público de forma gradual y con cautela. Actualmente, sólo es posible usarla por invitación o pagando una suscripción con una tarifa por número de palabras generadas.
Pero lo que está inventado ya no se puede desinventar y han surgido una infinidad de proyectos que intentan replicar los éxitos recientes de GPT-3 en abierto. De hecho, cualquier persona sin ningún conocimiento de machine learning ya se puede instalar la versión open source GPT-Neo y probarla con un solo click (y una buena tarjeta gráfica).
Estas alternativas son bastante recientes -tienen menos de 6 meses- por lo que el tsunami de bots indistinguibles de un humano aun está por llegar, aunque ya se han visto algunos casos de mal uso, principalmente destinados a manipular la opinión pública para hacer bulto en los seguidores de un partido político o alterar la valoración de criptomonedas.
Hay estudios recientes que dicen que un 15% de las cuentas de Twitter podrían ser bots, y nuestros mecanismos para detectarlos aun son bastante poco efectivos. Y al igual que las fake news, han venido para quedarse, así que habrá que ir pensando soluciones escalables para distinguir humanos y bots. Al menos hasta que tengamos un test de Voight-Kampff.
Sé el primero en comentar