Todo surgió como una prueba. Crear múltiples sitios, con contenido diverso (turismo, finanzas, economía, salud) y poner publicidad en ellos, de la red de Google, para poder ganar dinero. Pero con una diferencia: no habría ningún humano escribiendo textos. Todo lo haría la inteligencia artificial de ChatGPT, un sistema de chat basado en un modelo conversacional gestionado por Inteligencia Artificial, y desarrollado por la empresa OpenAI (en la que Microsoft acaba de anunciar una nueva inversión por 10.000 millones de dólares).

ChatGPT se ha vuelto muy popular en los últimos tiempos por su ductilidad: alcanza con darle una premisa (escribir un cuento sobre un tema en particular, argumentar sobre un tema, incluso escribir una pieza de software medianamente sencilla) para que devuelva un resultado en instantes. En febrero, una versión de ChatGPT será usada como consejera en un tribunal en Estados Unidos. Pero sobre todo lo que sorprende de ChatGPT es su capacidad para generar textos complejos, con buena argumentación y gramática correcta. De hecho, ya trae problemas a nivel educativo; es fácil pedirle que escriba una monografía sobre un tema, y difícil reconocer que no lo hizo un humano.

Así fue que la empresa Indie Build, que dirigie el argentino Lucas Lopatin, comenzó a desarrollar esta idea en octubre. Convocó a dos personas fundamentales: Agustín Marchi, desarrollador de la tecnología que crea artículos a partir de la Inteligencia artificial, y José Rivolta, que se encargó del posicionamiento de más de 12.000 artículos, de doce sitios web distintos. “Queríamos hacer un proyecto con base en IA para crear webs a escala, o sea muchas webs con mucho contenido, con el objetivo de levantar tráfico y monetizarlo con distintas redes publicitarias. Y generar ingresos con eso”, señala Rivolta, rosarino, de 28 años. Si bien no revela las direcciones web, LA NACION verificó algunos de estos sitios.

-¿En cuánto tiempo lo crearon?

-Estuvimos craneando 3, 4 semanas, pensando y armando cosas. En el momento que le dábamos el input, hasta que estaban publicados los artículos pasaban 6 horas, 8 horas. Uno de los más grandes tuvo 6000, 7000 artículos en 10 horas. Todos en inglés por una cuestión de que esos contenidos pueden generar mayores ingresos.

-¿Y los contenidos tenían sentido?

-No hicimos una web, hicimos varias webs, no las hicimos en simultáneo, íbamos cambiando procesos. La primera web tenía algunos contenidos que eran muy buenos y otros que pifiaron un poco. Redujimos el volumen, hicimos revisión manual de títulos y mejoró mucho. Pero sí, el comentario general era que tenían sentido, respondían a la necesidad, pero había cosas para mejorar.

Hace poco tiempo, BuzzFeed reveló que el sitio de noticias de tecnología CNet estaba utilizando la tecnología de ChatGPT para escribir artículos. De hecho, el mismo artículo de BuzzFeed fue escrito con esta tecnología. Pero con la aclaración de que no fue producida por un humano, sino solamente supervisado “manualmente”. CNet pausó la publicación de artículos generados automáticamente por computadora hace unos días después de encontrar errores en los textos.

Es que el uso de esta herramienta está generando polémica: en Nueva York, por ejemplo, prohibieron el acceso a la herramienta a los alumnos de escuelas secundarias tras considerar que puede generar un impacto negativo en el aprendizaje.

Todo un desafío, sobre todo porque ChatGPT es un motor entrenado con millones de textos y fuentes de contenido publicadas hasta 2021, pero que no comprende lo que escribe: simplemente recombina lo que publicaron otros sobre el tema. En muchos casos, con errores, pero escrito de una manera tan convincente que esas fallas sólo serán detectadas por quienes efectivamente conozcan del tema. A veces tiene, también, errores de lógica inesperados. Pero para cuestiones más ambiguas, o para reproducir conceptos específicos, puede ser brillante.

Esto es el principio: GPT-3 (el modelo sobre el que funciona ChatGPT) tiene 175.000 millones de parámetros de los que inspirarse para dar una respuesta, GPT-4, que saldrá en algún momento de este año, tendrá 100 billones de parámetros, es decir, unas 600 veces más que la versión anterior. Esto debería permitirle una capacidad de generación de contenido y de interactividad aún mayor.

“Nosotros íbamos mejorando los procesos, le incorporamos revisión manual, le agregamos bibliografía que, si bien todo esto era generado por IA, lo agregábamos para sumarle. Tratamos de hacer eso para simular el contenido”, agrega Rivolta. Sin embargo, todo lo que posicionaba bien en Google y crecía, de golpe empezó a caer. “Empezamos a sumar impresiones de tráfico, números sólidos, hasta que Google empezó a darse cuenta y ¡pum! Planchaba la web. Perdimos el 95 por ciento del tráfico en poco tiempo”, señala el especialista en SEO. Las que menos crecieron se vieron menos impactadas.

-O sea que Google se dio cuenta de que no fueron escritas por humanos… Pero si las humanizás… ¿evitás esa caída?

-No sé si evitás, pero sí reducís el riesgo. Ojo: hay webs que son creadas por humanos, bien hechas, que temporalmente caen, y después con el tiempo se levantan. Mirando en el largo plazo, si hacés las cosas bien vas a crecer. Google lo que busca como objetivo final es que sea contenido de calidad real. Aportar valor real, de la forma más objetiva posible. Si es de medicina, va a ser un mejor artículo si está escrito por profesionales de la medicina, a que si lo escribe un NN o un X. Pero acá hay cosas que fallaron, y mejorándolas, en algún momento tenés chances de que salgan bien. Igual Google no es que quiere que haya personas especializadas escribiendo cosas. Los sitios de e-commerce tienen varias páginas y no todo está hecho por humanos, sino que son cosas armadas de forma automatizada y eso es relevante para el buscador.

-¿Ganaron plata con el proyecto?

-No fue el objetivo a corto plazo. Esperábamos que de las webs, una, dos o tres salieran bien. No sacamos rentabilidad de esto, pero es una ventana de tiempo muy corta y se puede seguir iterando, mejorando. Estábamos probando.

