El advenimiento de la inteligencia artificial nos permite realizar cosas que antes sonaban a ciencia ficción. Ahora un estudio publicado en PLOS Genetics ha utilizado aprendizaje automático para extraer biobancos existentes y generar fragmentos de genomas humanos que no pertenecen a humanos reales pero tienen todas las características para serlo.
Las bases de datos genómicas existentes son un recurso invaluable para la investigación biomédica. Sin embargo, no son de acceso público o están protegidas por largos y tediosos procedimientos de solicitud debido a válidas preocupaciones éticas.
“Esto crea una barrera científica importante para los investigadores”, dijo Burak Yelmen de la Universidad de Tartu, y primer autor del estudio. “Los genomas generados por máquinas, o genomas artificiales como los llamamos, pueden ayudarnos a superar el problema dentro de un marco ético seguro”, añade.
Genomas sintéticos
Por tal motivo, el equipo realizó múltiples análisis para evaluar la calidad de los genomas generados en comparación con los reales. Sorprendentemente, estos genomas que emergen del ruido aleatorio imitaron las complejidades observables en las poblaciones humanas reales.
“Para la mayoría de las propiedades, no son distinguibles de otros genomas del biobanco que usamos para entrenar nuestro algoritmo”, dice el Dr. Luca Pagani. “Excepto por un detalle: no pertenecen a ningún donante de genes”, añade el coautor y miembro de Mobilitas Pluss.
El estudio también evaluó qué tan similares eran los genomas artificiales a los reales para probar si se conservaba la privacidad de las muestras originales. Aunque la detección de fugas de privacidad entre miles de genomas es improbable, la combinación de múltiples medidas estadísticas permitió comprobar con mucho cuidado todos los modelos.
“Curiosamente, la exploración detallada de patrones de fugas complejos puede conducir a mejoras en la evaluación y el diseño de modelos generativos, y estimulará el campo del aprendizaje automático”, explicó la Dra. Flora Jay, investigadora del CNRS.
Utilidad
Anteriormente, los enfoques de aprendizaje automático ya habían proporcionado rostros, biografías y muchas otras características a un grupo de humanos imaginarios. Ahora pueden ayudarnos a saber más sobre su biología.
Estos humanos imaginarios con genomas realistas podrían servir como sustitutos de todos los genomas reales que no están disponibles públicamente. También podrían sustituir a aquellos que requieren largos procedimientos de aplicación o colaboraciones, eliminando así una barrera de accesibilidad importante en la investigación genómica. Esto es de particular interés para las poblaciones subrepresentadas.
En el pasado los científicos utilizaron herramientas de inteligencia artificial para cosas igual de impresionantes. Por ejemplo, en marzo del 2019, una investigación creó algoritmos de aprendizaje automático para pronosticar con precisión muertes prematuras.