DÚVIDAS

Três termos da genética e da bioinformática

Gostaria de saber como traduzir para português os seguintes termos de genética/bioinformática[*]:

– reads.

Exemplo: «In next-generation sequencing, a read refers to the DNA sequence from one fragment (a small section of DNA)» (Genomics Education Programme).

– contigs.

Exemplo: «A contig (as related to genomic studies; derived from the word “contiguous”) is a set of DNA segments or sequences that overlap in a way that provides a contiguous representation of a genomic region» (ibidem);

– assembly.

Por exemplo: «In bioinformatics, sequence assembly refers to aligning and merging fragments from a longer DNA sequence in order to reconstruct the original sequence» (retirado de "Sequence assembly", Wikipedia).

Desde já muito obrigado pela vossa ajuda.

 

[* N. E. – Traduções livres, pela mesma ordem: «Na sequnciação da geração seguinte, uma leitura refere-se à sequência de ADN proveniente de um fragmento (uma pequena porção de ADN)»; «Um contig (relacionado com estudos genómicos e formado da palavra contíguo) é um conjunto de segmentos ou sequências de ADN que se sobrepõem de tal maneira que permitem fazer uma representação contígua de uma região genómica»; «Em bioinformática, o termo «alinhamento de sequências refere-se ao alinhamento e à combinação de fragmentos a partir de uma sequência de ADN mais longa de modo a reconstruir a sequência original».]

Resposta

A pergunta incide sobre a terminologia de um domínio científico que tem abundante literatura em inglês, como a maioria das atuais publicações científicas e como, aliás, os próprios exemplos em questão evidenciam. É, portanto, habitual que, nos países de língua portuguesa (e não só), os especialistas de cada  área científica empreguem termos ingleses, sem que, entretanto, se defina no discurso em português um padrão vernáculo capaz de disponibilizar traduções consagradas. Este é um problema comentado frequentemente e que requer certamente a intervenção planificada de uma entidade com competência na fixação de terminologias científicas (ver Textos Relacionados).

Quanto a saber se existem termos vernáculos equivalentes, com uso estável, que funcionem como traduções preferenciais, a resposta não é inequívoca. Assim, é possível aceitar que reads corresponde a leituras e assembly a «alinhamento de sequências». Contudo, contigs não tem mesmo tradução, pelo que, como termo especializado, se escreve em itálico, de modo a assinalar o seu estatuto de estrangeirismo1.

Sobre o significado de cada um dos termos em causa:

assembly/«alinhamento de sequências» –também «montagem de sequências», em referência ao alinhamento e associação de múltiplos fragmentos de uma sequência de ADN muito maior para reconstruir a sequência original (ver "Sequence assembly", Wikipedia em inglês, e artigos correspondentes em espanholcatalão e francês).

contigs – «sequências maiores de DNA [ADN] que são montadas por meio de sobreposição de reads [«leituras»]» (Vivian Pereira, Montagem e análise de genomas a partir de metagenomas, Universidade de São Paulo, Escola de Artes, Ciências e Humanidades, 2014, p. i).

reads/leituras – «resultado obtido após o sequenciamento de genomas por sequenciadores de alto desempenho. Corresponde a uma pequena sequência de poucos pares de base» (ibidem).

 

1 Para o conteúdo deste parágrafo, agradeço ao Doutor José Carlos Pinto Ferreira (Hospital de Santa Maria, Centro Hospitalar Universitário Lisboa Norte – CLUNH, e Faculdade de Medicina da Universidade de Lisboa) e à Doutora Ana Cristina Duarte (Laboratório de Genética, Serviço de Genética Médica, Hospital de Santa Maria, CHULN) os esclarecimentos prestados. Qualquer erro ou imprecisão na presente resposta são da minha inteira responsabilidade.

ISCTE-Instituto Universitário de Lisboa ISCTE-Instituto Universitário de LisboaISCTE-Instituto Universitário de Lisboa ISCTE-Instituto Universitário de Lisboa