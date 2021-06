NUEVA YORK.- Hace aproximadamente un año, las secuencias genéticas de más de 200 muestras de virus de los primeros casos de Covid-19 en Wuhan, China, desaparecieron de una base de datos científica online.

Ahora, al enraizar archivos almacenados en Google Cloud, un investigador en Seattle informa que ha recuperado 13 de esas secuencias originales, una nueva información intrigante para discernir cuándo y cómo el virus pudo haberse propagado de un murciélago u otro animal a los humanos.

El nuevo análisis, publicado el martes, refuerza las sugerencias anteriores de que una variedad de coronavirus puede haber estado circulando en Wuhan antes de los brotes iniciales vinculados a los mercados de animales y mariscos en diciembre de 2019.

A medida que la administración de Joe Biden investiga los orígenes controvertidos del virus, conocido como SARS-CoV-2, el estudio no refuerza ni descarta la hipótesis de que el patógeno se filtró de un famoso laboratorio de Wuhan. Pero plantea preguntas sobre por qué se eliminaron las secuencias originales y sugiere que puede haber más revelaciones que recuperar de los rincones más lejanos de Internet.

“Este es un gran trabajo de detective sin duda, y avanza significativamente los esfuerzos para comprender el origen del SARS-CoV-2”, dijo Michael Worobey, biólogo evolutivo de la Universidad de Arizona que no participó en el estudio.

Jesse Bloom, un experto en virus del Centro de Investigación del Cáncer Fred Hutchinson que escribió el nuevo informe, calificó la eliminación de estas secuencias como sospechosa. “Parece probable que las secuencias fueran eliminadas para ocultar su existencia”, escribió en el artículo, que aún no ha sido revisado por pares ni publicado en una revista científica.

Los trabajadores médicos toman muestras de hisopos de los residentes para realizarles la prueba del coronavirus en una calle de Wuhan en la provincia central de Hubei en China Agencia AFP

Bloom y Worobey pertenecen a un grupo abierto de científicos que han pedido más investigación sobre cómo comenzó la pandemia. En una carta publicada en mayo, se quejaron de que no había suficiente información para determinar si era más probable que una fuga de laboratorio propagara el coronavirus o que saltara a los humanos por contacto con un animal infectado fuera de un laboratorio.

Las secuencias genéticas de las muestras virales contienen pistas cruciales sobre cómo el SARS-CoV-2 se trasladó a nuestra especie desde otro animal, muy probablemente un murciélago. Las más valiosas de todas son las secuencias de principios de la pandemia, porque acercan a los científicos al evento de desbordamiento original.

Hoja de cálculo

Mientras Bloom revisaba qué datos genéticos habían sido publicados por varios grupos de investigación, se encontró con un estudio de marzo de 2020 con una hoja de cálculo que incluía información sobre 241 secuencias genéticas recopiladas por científicos de la Universidad de Wuhan. La hoja de cálculo indicó que los científicos habían subido las secuencias a una base de datos en línea llamada Sequence Read Archive, administrada por la Biblioteca Nacional de Medicina del gobierno de Estados Unidos.

Pero cuando Bloom buscó las secuencias de Wuhan en la base de datos a principios de este mes, su único resultado fue “no se encontró ningún elemento”.

Desconcertado, volvió a la hoja de cálculo en busca de más pistas. Indicó que las 241 secuencias habían sido recopiladas por un científico llamado Aisi Fu en el Hospital Renmin en Wuhan. Al buscar literatura médica, Bloom finalmente encontró otro estudio publicado en línea en marzo de 2020 por Fu y sus colegas, que describe una nueva prueba experimental para el SARS-CoV-2. Los científicos chinos lo publicaron en una revista científica tres meses después.

En ese estudio, los científicos escribieron que habían examinado 45 muestras de hisopos nasales extraídos “de pacientes ambulatorios con sospecha de COVID-19 al principio de la epidemia”. Luego buscaron una parte del material genético del SARS-CoV-2 en los hisopos. Los investigadores no publicaron las secuencias reales de los genes que extrajeron de las muestras. En cambio, solo publicaron algunas mutaciones en los virus.

Pero una serie de pistas le indicaron a Bloom que las muestras eran la fuente de las 241 secuencias faltantes. Los documentos no incluían una explicación de por qué las secuencias se habían subido al Sequence Read Archive, solo para desaparecer más tarde.

Al examinar el archivo, Bloom descubrió que muchas de las secuencias estaban almacenadas como archivos en Google Cloud. Cada secuencia estaba contenida en un archivo en la nube, y los nombres de los archivos compartían el mismo formato básico, informó.

Bloom cambió el código por una secuencia faltante de Wuhan. De repente, tuvo la secuencia. En total, logró recuperar 13 secuencias de la nube de esta manera.

Vista del Instituto de Virología de Wuhan, en China

Con estos nuevos datos, Bloom miró hacia atrás una vez más a las primeras etapas de la pandemia. Combinó las 13 secuencias con otras secuencias publicadas de los primeros coronavirus, con la esperanza de avanzar en la construcción del árbol genealógico del SARS-CoV-2.

Trabajar todos los pasos por los cuales el SARS-CoV-2 evolucionó a partir de un virus de murciélago ha sido un desafío porque los científicos todavía tienen un número limitado de muestras para estudiar. Algunas de las primeras muestras provienen del mercado mayorista de mariscos de Huanan en Wuhan, donde se produjo un brote en diciembre de 2019.

Pero esos virus comerciales en realidad tienen tres mutaciones adicionales que faltan en las muestras de SARS-CoV-2 recolectadas semanas después. En otras palabras, esos virus posteriores se parecen más a los coronavirus que se encuentran en los murciélagos, lo que respalda la idea de que hubo algún linaje temprano del virus que no pasó por el mercado de mariscos.

Bloom descubrió que las secuencias eliminadas que recuperó de la nube también carecen de esas mutaciones adicionales. “Son tres pasos más similares a los coronavirus de murciélago que a los virus del mercado de pescado de Huanan”, dijo.

Esto sugiere, dijo, que cuando el SARS-CoV-2 llegó al mercado, había estado circulando por un tiempo en Wuhan o más allá. Los virus del mercado, argumentó, no son representativos de la diversidad total de coronavirus que ya se encontraban sueltos a fines de 2019.

“Tal vez nuestra imagen de lo que estaba presente al principio de Wuhan a partir de lo que se ha secuenciado podría estar algo sesgada”, dijo.

Enviadas para su publicación

No está claro por qué se perdió esta valiosa información en primer lugar. Los científicos pueden solicitar que se eliminen los archivos enviando un correo electrónico a los administradores del archivo de lectura de secuencia. La Biblioteca Nacional de Medicina, que administra el archivo, dijo que las 13 secuencias fueron eliminadas el verano pasado.

“Estas secuencias de SARS-CoV-2 se enviaron para su publicación en SRA en marzo de 2020 y posteriormente el investigador que las envió solicitó que las retirara en junio de 2020”, dijo Renata Myles, vocera de los Institutos Nacionales de Salud.

Dijo que el investigador, a quien no nombró, les dijo a los administradores del archivo que las secuencias se estaban actualizando y que se agregarían a una base de datos diferente. Pero Bloom ha buscado en todas las bases de datos que conoce y aún no las ha encontrado.

“Obviamente, no puedo descartar que las secuencias estén en alguna otra base de datos o página web en algún lugar, pero no he podido encontrarlas en ninguno de los lugares obvios que he buscado”, dijo.

Tres de los coautores del estudio de prueba de 2020 que produjo las 13 secuencias no respondieron de inmediato a los correos electrónicos que preguntaban sobre el hallazgo de Bloom. Ese estudio no proporcionó información de contacto de otro coautor, Fu, quien también fue nombrado en la hoja de cálculo del otro estudio.

Algunos científicos se muestran escépticos de que haya algo siniestro detrás de la eliminación de las secuencias. “Realmente no entiendo cómo esto apunta a un encubrimiento”, dijo Stephen Goldstein, un experto en virus de la Universidad de Utah.

Goldstein señaló que el documento de prueba enumeraba las mutaciones individuales que los investigadores de Wuhan encontraron en sus pruebas. Aunque las secuencias completas ya no están en el archivo, la información clave ha sido pública durante más de un año, dijo. Simplemente estaba escondido en un formato que es difícil de encontrar para los investigadores.

“Todos echamos de menos este documento relativamente oscuro”, dijo Goldstein.

Independientemente de lo que sucedió con estas 13 secuencias, Bloom ahora se pregunta qué otras pistas podrían descubrirse online. Para reconstruir el origen de Covid-19, todas esas pistas son potencialmente importantes.

“Idealmente, debemos tratar de encontrar tantas otras secuencias tempranas como sea posible”, dijo. “Y creo que este estudio sugiere que deberíamos buscar en todas partes”.

