Investigadores españoles han encontrado más de cuatrocientos posibles nuevos genes que aún no aparecen en los catálogos oficiales porque están construidos principalmente a partir de datos de individuos de origen europeo, lo que conduce a «injusticias biomédicas».
3 de diciembre de 2025
Los mapas genéticos humanos tienen un enorme «agujero negro» como resultado del enfoque sistemático en las poblaciones de ascendencia europea. Un equipo de investigadores españoles ha identificado más de cuatrocientos posibles genes, a partir de las moléculas de ARN que transcriben, que aún no aparecen en los catálogos oficiales y no han sido descritos por la ciencia por esta circunstancia. Y lo que ven, anuncian, es sólo la «punta del iceberg».
En el estudio, que fue publicado este miércoles en la revista Comunicaciones de la naturalezaUn equipo de investigadores del Centro de Supercomputación de Barcelona (BSC) y del Centro de Regulación Genómica (CRG) muestra que esta falta de representación global distorsiona el conocimiento existente sobre cómo los genes influyen en la salud y las enfermedades humanas en otras partes del mundo. «En otras palabras, crearíamos una interpretación sesgada que podría conducir a injusticias biomédicas», afirma el primer autor. Pau Clavell-Revellesdel BSC.
Aunque ya era conocido el sesgo de los catálogos genéticos hacia poblaciones de ascendencia europea, esta es la primera vez que se pone el foco en qué moléculas de ARN se pueden generar a partir de genes. «Esto es algo que nunca antes se había explorado», subraya Clavell-Revelles. «Todos los estudios se mantuvieron a nivel de ADN, no a nivel de ARN, porque al final es importante saber qué genes tenemos, pero también cómo se utilizan».
En la tarea, los científicos generaron más de 10 terabytes de datos y 800 millones de secuencias de ARN completas, lo que requirió herramientas avanzadas de aprendizaje automático y la capacidad de la supercomputadora MareNostrum 5 del BSC, y dieron un paso de gigante hacia la creación de «pantranscriptoma”humano, lo que nos acercará a una medicina genómica más precisa y justa.
«Los mapas genéticos se utilizan a diario en los laboratorios, pero dejamos de lado a grandes segmentos de la población mundial. Este estudio muestra por primera vez cuánto nos faltaba», afirma el primer autor. «En los catálogos de referencia que utilizamos pueden faltar genes o transcripciones que sólo existen en poblaciones no europeas», añade.Roderic Guigocoautor principal. «Si una variante genética incide en uno de estos genes faltantes, asumimos que no tiene ningún efecto biológico. En algunos casos, esa suposición podría simplemente ser errónea».
Moléculas sin catalogar
Para determinar qué genes quedaban por identificar, los autores reconstruyeron el proceso inverso que ocurre en la célula. «Leemos qué es el ARN en la célula y buscamos su origen en el genoma y así localizamos los genes», explica Clavell-Revelles. El resultado es el descubrimiento de 41.000 moléculas de ARN que no están en mapas oficiales como GENCODE (10% ya conocidos) correspondientes a 476 nuevos genes posibles.
Para el artículo, el equipo analizó las células sanguíneas de 43 personas de ocho poblaciones humanas: Yoruba (Nigeria), Luhya (Kenia), Mbuti (Congo), Han (China), indios telugu (Reino Unido), peruanos en Lima, Ashkenazi (Israel) y europeos de Utah. Estos grupos son parte de El proyecto de los 1000 genomaslo que implica que su ADN está bien caracterizado, lo que a su vez permite comparar directamente los nuevos datos de ARN.
La punta del iceberg
«Es muy importante tener en cuenta que sólo analizamos un tipo de célula», explica. Marta MeléCo-líder de estudio y líder de grupo en el BSC. «Encontramos estas 41.000 transcripciones observando un tipo de célula. Creemos que faltan muchas moléculas y que esto es la punta del iceberg». Ahora habrá que mirar otros tipos de células, informa. elDiario.esy ampliar el estudio a más poblaciones para tener un mapa completo.
«Formo parte del consorcio GENCODE y puedo decir que está analizando este y otros datos para producir una actualización del número de genes humanos», añade Guigó. «Se está trabajando en ello ahora mismo».
Relación con las enfermedades
Los resultados sugieren que parte de la razón por la que ciertas enfermedades son más comunes o se comportan de manera diferente en ciertas poblaciones puede deberse a que sus genes producen diferentes transcripciones y, potencialmente, proteínas. Estas variaciones moleculares han permanecido casi invisibles en los mapas genéticos actuales, ocultando información que podría ser crucial para comprender el riesgo de enfermedad.
En las últimas décadas, los científicos han demostrado que ignorar nuestro origen genético al recibir terapia supone un riesgo para nuestra salud. Un claro ejemplo es que los niños afroamericanos con asma no responden bien a los tratamientos broncodilatadores, y esto aumenta hasta seis veces su riesgo de morir por complicaciones de la enfermedad. O el caso de las personas de ascendencia asiática oriental que son más sensibles a los anticoagulantes para prevenir infartos, y la dosis recomendada para los europeos puede provocar hemorragias internas.
«Incluso si a uno no le importa, el hecho de que los mapas genéticos estén sesgados debería importarle a todos, porque agregar diferentes ancestros a este tipo de estudio beneficia a todos, incluidas las personas de ascendencia europea», resume Clavell-Revelles. «Y hay muchas razones. La primera es que los ancestros genéticos no existen como grupos aislados. Esto significa que incluso si eres de ascendencia europea, puedes tener partes de tu ADN, y por lo tanto de moléculas de ARN, más similares a la mayoría de los inmigrantes que a los europeos».
Ancestros ignorados
Para un genetista Lluís Montoliudel CNB-CSIC, CIBERER-ISCIII, es un artículo muy relevante que vuelve a poner de relieve la desigualdad que se produce en salud y de la que cada vez somos más conscientes. «El genoma que utilizamos es predominantemente de ascendencia europea», explica. «Los diferentes genomas de otras personas que tienen ancestros diferentes simplemente se han pasado por alto y este artículo sostiene que debemos tenerlos en cuenta y hacer todo lo posible para representar la variabilidad que tiene el genoma a lo largo de la secuencia».
«Los autores descubrieron que para cada gen podíamos producir transcripciones más diferentes de las descritas, especialmente cuando analizamos muestras de personas de ascendencia no europea», explica. Gemma MarfanyCatedrático de genética de la Universidad de Barcelona (UB). «Esto implica que cada gen puede producir más proteínas diferentes de las que pensábamos, lo que significa que hay una diversidad sutilmente mayor de proteínas entre los humanos de la que no éramos conscientes».
En opinión de Marfany, debemos complementar nuestras bases de datos con esta sutil diversidad de transcritos entre las poblaciones humanas, teniendo en cuenta también que hay tejidos y órganos que se caracterizan por la representación de muchos transcritos diferentes, como las neuronas del cerebro o la retina. «Estos resultados tendrán un impacto en el diagnóstico genético de enfermedades, ya que las variantes o mutaciones genéticas identificadas pueden afectar de manera diferencial a la producción de transcripciones y, por tanto, de proteínas, en personas de diferentes poblaciones humanas», concluye.



