«O português é um gigante global no mundo das línguas graças ao Brasil, mas a sua influência cultural e preparação tecnológica estão muito abaixo do seu peso demográfico. Estudos científicos recentes explicam como resolver este paradoxo.»
[in semanário "Expresso" de 2 de janeiro de 2015]
A língua portuguesa tem 240 milhões de falantes em quatro continentes, é a quinta mais falada no mundo e em número de utilizadores da internet, bem como a terceira no Twitter e no Facebook, mas a sua influência global não parece ser muito grande. E está pouco preparada para a era digital.
Estudos científicos recentes constatam esta realidade de forma muito precisa, mas mostram como se podem superar estes problemas de modo a que o português se transforme numa língua verdadeiramente global. Tudo passa, antes de mais, por políticas públicas e iniciativas da sociedade civil, através do sistema de ensino, que aumentem o número de estrangeiros que falam a nossa língua e que promovam a cultura portuguesa através da tradução de obras de autores nacionais para outras línguas. E, noutra frente, por investir na tecnologia da linguagem (software) em áreas cruciais como a tradução automática, a análise de texto ou o processamento da fala.
Na primeira frente são estas as propostas de Bruno Gonçalves, um investigador português do Centro de Física Teórica da Universidade de Aix-Marseille (França), que faz parte de uma equipa multidisciplinar internacional que publicou recentemente um estudo sobre a influência global de cada língua através das suas ligações a outras línguas, com base nos dados dos utilizadores da Wikipedia e do Twitter, e das traduções de livros em todo o mundo.
Português na terceira divisão
O estudo, publicado na revista científica de referência internacional "Proceedings of the National Academy of Sciences" (PNAS), não se baseia assim na demografia, isto é, na tradicional hierarquia do número de falantes de cada língua, mas na estrutura das redes que ligam falantes de várias línguas em simultâneo e textos traduzidos. E conclui que as línguas de todo o mundo revelam uma estrutura hierárquica dominada por um "hub" central, o inglês, e uma constelação de "hubs" intermédios, que incluem outras línguas globais como o castelhano, o alemão, o francês, o italiano e o russo.
O português situa-se no nível hierárquico seguinte (o terceiro), onde figuram também o holandês, o sueco e o dinamarquês, apesar de terem muito menos falantes. Curiosamente, embora o chinês, o árabe e o hindi sejam falados por mais de 2600 milhões de pessoas, "são línguas mais periféricas na rede mundial de influência linguística", refere a investigação publicada na PNAS.
Esta forma inovadora de medir a centralidade mundial de uma língua foi validada através da demonstração de que esta tem uma forte correlação com o número de pessoas famosas nascidas nos países associados a essa língua. Ou seja, a posição de uma língua na rede mundial de ligações "contribui para a visibilidade dos seus falantes e para a popularidade global dos conteúdos culturais que eles produzem".
César Hidalgo, investigador do MIT - Massachusetts Institute of Technology (EUA), que liderou este estudo internacional, reconhece num comunicado da instituição que a Wikipedia, o Twitter e a tradução de livros "são redes representativas das elites". Mas, ao mesmo tempo, o cientista sublinha que "estas elites são os motores da transferência de informação entre culturas".
Conclusões distorcidas?
"A interpretação dos dados do estudo internacional agora publicado levanta-me várias reservas", afirma António Branco ao Expresso. O investigador do Departamento de Informática da Faculdade de Ciências da Universidade de Lisboa (FCUL) critica, por exemplo, o facto de se tirarem conclusões sobre a influência global de uma língua a partir dos dados de 17 milhões de utilizadores do Twitter, "quando a população da Terra é de 7200 milhões de habitantes".
Por isso, considera "duvidosa a posição periférica do chinês no estudo, quando este é falado por 1/5 da população mundial". E dá outros exemplos: "A França e a Alemanha são duas potências económicas monolingues e com pouca emigração, o que significa que os seus utilizadores do Twitter vão "twittar" principalmente na própria língua, isto é, não têm razão para o fazer noutras línguas".
António Branco acha que "o indicador mais interessante do estudo acaba por ser o da tradução de livros". Quanto à Wikipedia e ao Twitter, "têm informação muito enviesada". Mas pode haver outras opções de investigação: "Se conseguíssemos contar o número de contratos feitos por multinacionais e as línguas em que são escritos, por exemplo, isso dava-nos uma dimensão da influência real de uma língua na economia mundial".
O investigador da FCUL continua a preferir "as métricas mais usuais da difusão do português: a quinta língua mundial em número de falantes e utilizadores da internet", onde se regista um rápido crescimento, "em especial devido à contribuição do Brasil". António Branco sublinha ainda que o português é "a terceira língua mais usada no Twitter e no Facebook, porque somos latinos e por isso criamos mais relações sociais do que os falantes de línguas ligadas a outras culturas".
Apostar na tradução automática do português
O investigador da FCUL, que tem trabalhado na preparação do português para a era digital, está a coordenar o projeto científico europeu QTLeap de tradução automática e de desenvolvimento das tecnologias da linguagem (software), que envolve sete universidades (da Alemanha, Portugal, República Checa, Bulgária, Espanha e Holanda), uma empresa portuguesa (Higher Functions) e um orçamento de três milhões de euros.
O projeto constata que existe um paradoxo: na era digital e do mundo globalizado, a linguagem é uma das maiores barreiras comunicacionais com que nos deparamos. Por isso, o QTLeap procura soluções tecnológicas para ultrapassar esta barreira, mas sem diminuir ou destruir a diversidade linguística. "Hoje em dia a tecnologia de tradução automática baseia-se em texto corrido, mas este projeto europeu quer associar aos textos em português e em inglês, por exemplo, a sua análise sintática e semântica". Deste modo, "já não são apenas as palavras, mas também as estruturas gramaticais associadas às frases", que são objeto da investigação nesta área.
Com uma grande vantagem: "Esta nova metodologia permite maior abstração, um afastamento dos detalhes particulares de cada língua, em benefício de uma representação semântica mais universal de todas as línguas, resultando numa tradução automática de maior qualidade".
O coordenador do QTLeap integrou a equipa de investigadores que lançou em 2012 o livro branco "A Língua Portuguesa na Era Digital". O relatório constatava o baixo nível de preparação do português para a era digital em termos de tecnologia da linguagem nas áreas da tradução automática, análise de texto e recursos linguísticos e orais. O nível de preparação era considerado médio apenas no processamento da fala. O livro propunha ainda as ações necessárias para reforçar o desenvolvimento tecnológico destas áreas e consolidar o português "como língua de comunicação internacional com projeção global".
In jornal Expresso de 2 de janeiro de 2015.