Não há língua mais ou menos complexa que as outras, indica estudo

Por REINALDO JOSÉ LOPES

SÃO CARLOS, SP (FOLHAPRESS) - Uma nova análise conduzida por especialistas europeus sugere que todas as línguas do mundo são mais ou menos equivalentes quando o assunto é complexidade --no fundo, não existiriam idiomas "mais simples" e "mais complicados", como muita gente imagina.

Ainda segundo o estudo, publicado recentemente no periódico especializado Linguistics Vanguard, parte dessa equivalência parece ser produzida por uma espécie de fenômeno compensatório. Se determinado idioma tem palavras com estrutura particularmente complexa, por exemplo, a tendência é que a estrutura das frases se torne mais simples, e vice-versa.

Coordenado por Christian Bentz, do Departamento de Linguística Geral da Universidade de Tübingen, na Alemanha, o trabalho é uma meta-análise. Ou seja, trata-se de uma avaliação estatística de uma série de análises feitas por outros linguistas, a partir de um conjunto de 80 idiomas.

Embora ainda existam cerca de 6.000 línguas diferentes no planeta, a amostra é considerada "tipologicamente diversificada". Isso significa que ela abrange uma variedade relativamente grande de "estilos" de línguas, pertencentes a diversas famílias linguísticas que não possuem relação clara de parentesco entre si.

"Algumas das línguas da nossa amostra, como o mandarim, o vietnamita, o turco, o uigur e o árabe padrão, são consideradas muito diferentes entre si em termos tipológicos. Então a diversidade linguística existente foi coberta, de certa maneira", explicou Bentz à Folha. "Ainda assim, nossa amostra é bastante limitada. Pesquisas futuras precisarão incluir mais idiomas, de diferentes áreas e famílias, para verificar se essa relativa uniformidade da complexidade se mantém."

O conjunto inclui idiomas de todos os continentes, entre eles uma língua indígena do Brasil, o apurinã, falado pela etnia de mesmo nome, cujas terras tradicionais se concentram no estado do Amazonas.

O estudo de Bentz e seus colegas levou em conta dois grandes aspectos das línguas analisadas. O primeiro é a morfologia, ou seja, as características das palavras e sua formação. Fenômenos como a formação do diminutivo em português, com o acréscimo de "-inho" (carro/carrinho) no final da palavra, entram nessa categoria.

Além da morfologia, a análise levou em conta também as características da sintaxe, ou estrutura das frases. A sintaxe do português, por exemplo, privilegia a ordem SVO (sujeito, verbo e objeto) nas frases, como em "O menino viu o carro".

A meta-análise se baseou nos resultados do Workshop Interativo sobre a Medição da Complexidade Linguística, realizado em 2019 na cidade alemã de Freiberg. Nesse encontro, os pesquisadores trabalharam em dois grupos. Um deles comparou trechos de traduções da Bíblia para 49 línguas diferentes, enquanto o outro tomou como base o banco de dados Universal Dependencies, que contém informações detalhadas sobre a estrutura de 44 idiomas. (A soma das amostras chegou a apenas 80 idiomas porque há uma sobreposição de línguas entre os dois conjuntos.)

Sete grupos de pesquisadores se puseram a avaliar a complexidade das línguas de cada conjunto. Como não existe uma definição única e universalmente aceita do que constitui a complexidade linguística, eles podiam estabelecer seus próprios critérios, com a condição de que os modelos matemáticos que usaram para fazer as medições ficassem disponíveis publicamente.

A comparação entre os diferentes modelos e medições mostrou que as diferenças de complexidade entre as línguas da amostra não são estatisticamente significativas, ou seja, não é possível afirmar que uma é claramente mais complexa que a outra.

Além disso, também há indícios de que existe um equilíbrio entre complexidade na morfologia e na sintaxe --em vários casos, se uma delas cresce, a outra diminui. A comparação entre o inglês moderno e o latim ajuda a ilustrar isso.

O inglês é famoso por ter poucas modificações na forma das palavras --seus verbos, por exemplo, quase não mudam de forma. No passado, a forma "worked" significa tanto "eu trabalhei" quanto "eles trabalhavam"-- basta trocar o pronome pessoal na frente do verbo. Já o latim tem uma conjugação complexa de verbos, como a do português. E, ainda por cima, os substantivos mudam de forma dependendo de sua função na frase. Por exemplo, "poeta" é a forma da palavra quando ela é o sujeito da frase, mas ela se transforma em "poetam" quando é o objeto.

No entanto, na sintaxe, o inglês pode ser mais complicado. Pode haver, por exemplo, uma separação muito grande entre o possuidor e o objeto possuído numa frase, como em "the company's self-driven research strategy" ("a estratégia autodirecionada de pesquisa da empresa") --há três palavras de distância entre "company", o possuidor, e "strategy", a coisa possuída. Já em latim, o mais comum é possuidor e coisa possuída ficarem colados, como em "regnum caelorum", "reino dos céus", e "membrorum tuorum", "dos teus membros". Segundo esse raciocínio, as diferenças entre os dois aspectos fariam com que a complexidade total das línguas ficasse "empatada".

Um elemento importante que não foi levado em conta é a variedade de tipos de fonemas (grosso modo, sons de consoantes e vogais) presente em cada língua. Os autores do estudo reconhecem que essa é outra limitação do trabalho. "Mas não sei se a inclusão da diversidade de fonemas mudaria o resultado", diz Bentz. "Há estudos que mostram que há uma relação de perde e ganha entre o nível dos fonemas e o nível das sílabas. Assim, é possível que um inventário mais complexo de fonemas seja, mais uma vez, contrabalançado por outros níveis estruturais."