29 agosto 2007

Houaiss x Oxford

Um caro leitor deste blogue pediu a nosso ecoante doutor q desse uma resposta final e definitiva à pergunta q não quer calar no peito de tantos amantes sopeados da língua portuguesa:

Afinal, ¿o português tem mais palavras q o inglês, ou o inglês tem mais palavras q o português?

Uma empreitada dessas requer uma certa pachorra. O doutor —q tem uma edição eletrônica do Houaiss— se dispôs a contar o número de verbetes total. Não é tão difícil. O Houaiss traz um buscador onde vc pode chamar todos os verbetes q, por exemplo, começam com P e terminam com A (ou seja, p*a). O resultado mostra também o número desses verbetes —q, no caso, são 3.711. Isso não quer dizer q todos esses 3.711 verbetes sejam palavras. Temos, por exemplo:

PA: sigla do estado do Pará
Pa: símbolo de protactínio

Também há verbetes q começam ou terminam com hífen (os sufixos, prefixos e elementos de composição), além de verbetes q terminam em ponto final (as siglas como F.O.B. e abreviaturas como loc. cit.).

Pois então. Fazendo a soma de todos os verbetes q começam com A, Á, Â, B, C ... .Z e terminam com A, Á, Ã, B, C ... Z, mais todos os prefixos &c, mais todas as siglas &c, o número total de verbetes do Dicionário Houaiss da Língua Portuguesa é...

186.252

Hm. Tirando os prefixos &c, as siglas, os símbolos e as abreviaturas, o número total de palavras ou locuções é

175.705

Hm.

O prefácio do Houaiss fala em 228.500 "unidades léxicas". A discrepância talvez se explique pelo fato de q uma mesma palavra pode ter mais de um significado. Se for esse o caso, o prefácio deveria ter falado em "unidades semânticas" e não "léxicas". Houaiss indeed.

O prefácio tbm indica q no Houaiss também tão incluídas muitas palavras usadas exclusivamente em Portugal, São Tomé e Príncipe, Guiné-Bissau, Cabo Verde, Angola e Moçambique – por exemplo, as portuguesíssimas palavras djila, macuaiela, lunyaneka, e ocaviiúla.

Hm.

Mas como a pergunta q não quer calar é sobre o número de palavras e não de unidades semânticas, fiquemos com 175 mil.

Dessas, muitas são apenas variantes. Por exemplo, dentre os verbetes "p*a" temos, por exemplo:

pacata = pacatez
pachocha = pachoucho
páfia = empáfia
pagadoiro = pagadouro &c &c &c

Mas já q o Houaiss deve tbm ter "se esquecido" de muitas palavras (tipo 'bicicletaria', q não consta), digamos q o número total de palavras da língua portuguesa teja por volta de 175 mil mesmo.

Hm. Resta mais um "hm".

Agora vamos ao inglês.

O Oxford é um dicionário bastante conservador. Sua edição atual tem 20 volumes.

http://en.wikipedia.org/wiki/Oxford_English_Dictionary
http://www.oed.com/public/about

A maior parte do espaço desses 20 volumes é constituída de exemplos. O Oxford pega um pouco pesado nos exemplos (todos tirados de fontes externas), e esse é um dos motivos por quê digo q ele é conservador. Mas digamos q, tirando todos os exemplos, sobrem 5 volumes.

Hm.

A edição de 1989 define e/ou ilustra 615.100 palavras e locuções. Agora observe um fato revelador. O Oxford tem um conceito q eles chamam de "main entry" (verbete principal). Essas 615 mil palavras aparecem dentro de 301 mil main entries, assim como as 228 mil "unidades léxicas" do Houiass aparecem em suas 175 mil palavras.

Só que...

O Houaiss é feito nos moldes dos dicionários brasileiros: talvez pra inflar o tamanho (e certamente fazendo pouco caso da inteligência do usuário), cada palavra tem um verbete independente, inclusive todas as derivadas (exceto advérbios formados com -mente). Por exemplo, cada uma das palavras abaixo tem um verbete independente no Houaiss:

destrucionismo, destrucionista, destruição, destruído, destruidor, destruir, destruível, destrutibilidade, destrutível, destrutividade, destrutivismo, destrutivista, destrutivo, destrutor

Já o Oxford, utiliza a inteligência do usuário e coloca muitas dessas palavras dentro do mesmo main entry, como derivadas.

Outro exemplo. No Houaiss, temos estes 18 verbetes independentes:

fenil, fenila, fenilalanina, fenilalanínico, fenilamina, fenilanina, fenilbutazona, fenilcetonuria, fenilcetonúria, fenilcetonúrico, fenilefrina, fenilênico, fenileno, fenilenodiamina, fenilidrazina, fenil(o)-, fenilo, fenilpirúvico

HAHAHAHAHAHAHA

Já no Oxford, temos o verbete único phenyl, no qual tão incluídas as correspondentes inglesas de todas as palavras acima, mais uma caralhada de outras do mesmo grupo químico. Veja vc mesmo:

http://fds.oup.com/www.oup.co.uk/pdf/0-19-861186-2.pdf

Então é MUITO diferente o Houaiss ter 175 mil palavras e o Oxford ter 301 mil main entries, não é? O q o Houaiss faz é um tipo de ilusionismo.

Caso reste alguma dúvida sobre qual das duas línguas tem mais palavras, dê uma olhada nisto:

http://www.urbandictionary.com/

um dicionário colaborativo q, claro, não tem critérios tão rigorosos como os do Oxford. Muitos verbetes são gírias localíssimas, e muitos são apenas trocadilhos. Mas se algum ufanéscio, depois de dar uma olhada no Urban Dictionary, ainda falar da "riqueza" da língua portuguesa, vc pode levá-lo amarrado à filial mais próxima da Clínica Dr Plausível.

O português tem inúmeras qualidades. O número de palavras não é uma delas.
________________

Adendo:

No Brasil (mais: em toda a América Ibérica) todos reclamam do atraso, da ignorância, dos erros administrativos, da corrupção, da pobreza, da lentidão nos processos, da incompetência na execução, do desprimor nos resultados. Todo reclamante tá basicamente invocado com um enigma: "Entende-se o atraso na África, no Paquistão, até na China. Mas ¿por quê nós —logo nós, descendentes diretos da Europa— estamos assim?"

Todas aquelas moléstias têm múltiplas causas. Mas pro Dr Plausível, uma causa é comum a todas elas —a ferramenta-mor da sociedade: a língua.

Dizem —com razão— q o mau artesão reclama das ferramentas q tem; mas não dá pra construir um Porsche com as ferramentas e os processos q se usa pra construir um Corsa.

A América Latina é uma fábrica de Corsas q recebeu o encargo de produzir Porsches; claro, as máquinas não tão produzindo com a qualidade necessária. Numa fábrica, qdo uma máquina não funciona com precisão, pode ser pq não tá bem calibrada. Quem determina isso é o inspetor de qualidade. Chama-se então o ferramenteiro pra calibrar a máquina. Este usa instrumentos de medição, q tbm devem tar calibrados. Quem determina se eles tão calibrados é o metrologista.

Nosso excomungável doutor só (!) tá dizendo q o metrologista, o ferramenteiro, o inspetor de qualidade e o operador da máquina latino-americana atribuem a baixíssima qualidade de seus Porsches ao salário, às condições de trabalho, à incompetência da chefia, às dificuldades do projeto &c, qdo na verdade o problema é a máquina em si. Seria preciso trocar de máquina, assim como o Brasil precisaria trocar de língua —pois a língua portuguesa, left to its own devices e do jeito q é proposta pelo gramático-metrologista, jamais vai produzir o Porsche da sociedade justa, culta, complexa, competente, asseada e otimista q seus falantes almejam.

Ou então optar pelo caminho mais honrado porém mais difícil de mandar o projeto-Porsche às favas de onde veio e procurar descobrir pra quê serve afinal a língua portuguesa, qual universo cultural ela pode engendrar, qual organização social, ideológica e pragmática ela tá univocamente posicionada pra criar, desenvolver e exportar.

E contra isso tudo está a poderosa, estúpida e aviltante pressão ideológica e política exercida pelos gramáticos e lexicógrafos da NoCu.

¿A esperança do Dr Plausível? Zero.

18 comentários:

André disse...

Será que isso dá-se por causa da rigidez da Língua Portuguesa, inclusive no sentido de não permitir (ou raramente permitir) neologismos (apesar da grande abertura graças ao mundo da informática, abertura essa que só aconteceu no Brasil, pois em Portugal mouse é rato)?

Ou, vejo tbm, isso tem relação direta com alguns posts seus sobre o nosso idioma e a evolução do nosso povo. Tecnológica, inclusive.

Pracimademoá disse...

André, é só mais uma das inúmeras peças em que o reiterante Doutor Obsessível desfila o seu queixume de como a língua portuguesa é rígida, malvada e castradora. A idéia dele, como sempre, é de que não temos mais palavras porque uma meia dúzia de constipados não deixa.

Porque existe o Everest, o K-2 não passa de um morrinho. Porque o inglês tem mais de meio milhão de palavras, a língua portuguesa não é rica. Ué. Foi isso que eu entendi. E pra cima de nós tudo.

Permafrost disse...

¡Ê, peraí, eu só tava respondendo a pergunta do caro leitor...!

Veja o adendo.

Herpes da Fonseta disse...

Esse adendo está parecendo discussão sobre o sexo dos anjos.

E peralá. Se o doutor não tem esperança de que melhore, por que se preocupa? O que o português é não é exatamente o que o português é?

comentarista disse...

Caro Policarpo Quaresma,
É comovente sua vontade de mudar as coisas, mas posso lhe garantir que a pobrezinha da língua portuguesa é dos mais insignificantes motivos para o nosso atraso.
Eu já tinha escrito antes, e minha conexão caiu. Perdi o que tinha escrito... e a vontade de escrever. Mas depois do adendo não deu mais pra segurar, e vou fazer umas perguntinhas:
1) Será que Gana, Jamaica e Nigéria vão arrebentar em desenvolvimento nos anos vindouros por causa da língua que falam?
2) Será que o sueco é uma língua com tantas palavras quanto o inglês? E o japonês? Será uma língua maleável?
3) E o francês com todo seu palavrório e locuções (veja o tamanho de um texto em francês e a tradução pro português)... além de ser muito mais rígido. Tu as fait ça? Oui, je l´ai fait. Vc fez isso? Fiz.
4) Será que somos mesmo uma importação direta da Europa? E os índios e negros que estão aqui, são todos europeus?
5)Que eu saiba, o português permite construção de frases com praticamente a mesma flexibilidade das línguas sintéticas. Não vejo isso em nenhuma das outra línguas mais faladas. Nem mesmo no alemão (do pouco que eu sei) com suas declinações.

IMHO, o que falta mesmo aqui é massa crítica de gente inteligente. A solução disso é muito mais difícil.
A inteligência sempre dá a volta por cima, a burrice é que precisa muito da sorte.

nervocalm disse...

O problema é da plataforma. Ah, e do conteúdo. Ah, e do emissor. Ah, e do receptor. Ah, e da falta de massa crítica.

Da raça humana, anyone?

Nada não, só lembrei.

Permafrost disse...

Herpes, me pergunto a mesma coisa às vezes...

Comentarista, tuas perguntas vão servir pra outro artigo. Mas já adianto uma coisa. A questão é justamente q o português e o espanhol NÃO são línguas tão maleáveis como o inglês, o japonês, o sueco, o alemão e o francês. Explico melhor: o espanhol e mais ainda o português são estruturalmente mais livres e *por isso* são semanticamente mais pobres q essas outras línguas. Mas nas sociedades industrializadas, têm-se mostrado mais vantajoso q uma língua seja estruturalmente rígida, de modo a se expandir semanticamente. Não é só o número de palavras do inglês q é maior q o do português. O número de unidades semânticas também é (aritmeticamente) maior e portanto o número de coisas possíveis de ser ditas é (geometricamente) maior. (Todas esses fatos estão vinculados à fonética de cada língua e já tou achando q vou ter q encher o saco do pessoar com noções de fonética.)

O q o Brasil tem, em vez de um grande repertório de possibilidades, é um bando de gramáticos tolos brincando de déspota esclarecido. Teria sido MUUUUUITO melhor, por exemplo, se o Brasil tivesse continuado a grafar 'pharmácia' e 'óptimo'.

Nervocalm, Deus me livre da massa crítica.

comentarista disse...

Veja só nervocalm: suecos, suiços, japoneses e ganenses são todos da raça humana, assim eu entendo. A questão do nosso doutrinador é por que uns tem aproveitado melhor seu tempo por aqui, em termos do que todos desejam, e outros nem tanto. "Enquanto seres humanos", como diziam os estudantes de humanidades, ganenses e suiços parecem ter alcançado situações muito distintas... embora queixas sempre haja de ambos os lados, eu acho que tem mais ganense querendo ter a vida dos suíços do que vice-versa. Por que será? É isso que se pergunta nosso permafrost/Dr. Plausível.

Rildo Hora disse...

Cara, o Come-Come chegou chutando mesmo a porta!!! Néééésssssaaaaa!!!! Melhor decretar luto de 10 dias, ou fingir uma dor de barriga e sair de campo. Definitivamente, achei o Oráculo do raciocínio encadeado. Acho que vou comer um sanduba de mortandela...

André disse...

Bom, resumindo, deixa ver se eu entendi (do dr. e dos outros comentaristas):
No geral, todos concordam que somos um povo que NÃO é europeu, mas é descendente e se quer como se fosse, digo, tem as aspirações de ser europeu sem sê-lo de fato. Coisa que a África nem a China nunca tiveram, então aceitam que não podem produzir Porsche e, virando-se nos 30, acabam tentando criar um novo modelo de luxo com a máquina que têm, enquanto nós continuamos tentando montar o Porsche.

É isso?

F. Arranhaponte disse...

Mas o Houaiss exclui muitas palavras que as pessoas usam normalmente no dia a dia, e nem todas são exatamente gírias. Olha só, rapidinho, catei seis palavras que não constam do meu Houaiss eletrônico, e que são correntes (basta jogar no google pra ver): printar, sincericídio, ficante, petralha, zapear, privatista. É óbvio que o inglês tem trilhões de palavras a mais, mas os nossos dicionários são meio repressores. Volta e meio eu quero usar uma palavra cuja existência tem tudo a ver, e quando vou no Houaiss ou no Aurélio, neca de pitiritibis (isto está na minha memória, mas não no Google - deve ser memória inventada) - não consta

F. Arranhaponte disse...

achei! é neca de pitibiribis. E consta do Houaiss. pitibiriba, coisa alguma nada

comentarista disse...

Pra também constar no novo artigo.

1) A despeito da riqueza das línguas que tanto preza o Dr. Plausível/permafrost, Newton e que tais escreveram em latim.
2) Da época que eu era engenheiro eu lembro muito dos artigos científicos que tinha que ler: um inglês bem rasteiro, usando muito menos do que as 5 quaquilhões de palavras disponíveis. Será dessa produção cultural que o Dr/per está tratando?
3) Se for da outra, das humanidades, direito, flosofias, etc... lembro que foi inicialmentte escrita em grego, que dizem os versados ser uma língua que só ela. No entanto os gregos atuais, com sua língua que só ela, não estão muito melhores que os portugueses. Acho que a diferença, se houver, deve-se ao recebimento de maior número de turistas no caso Portugal/Grécia. Ademais, a Espanha está ganhando com boa dianteira da Grécia.

http://www.finfacts.com/biz10/globalworldincomepercapita.htm

http://en.wikipedia.org/wiki/List_of_countries_by_GDP_(PPP)_per_capita

comentarista disse...

Pra também constar no novo artigo.

1) A despeito da riqueza das línguas que tanto preza o Dr. Plausível/permafrost, Newton e que tais escreveram em latim.
2) Da época que eu era engenheiro eu lembro muito dos artigos científicos que tinha que ler: um inglês bem rasteiro, usando muito menos do que as 5 quaquilhões de palavras disponíveis. Será dessa produção cultural que o Dr/per está tratando?
3) Se for da outra, das humanidades, direito, flosofias, etc... lembro que foi inicialmentte escrita em grego, que dizem os versados ser uma língua que só ela. No entanto os gregos atuais, com sua língua que só ela, não estão muito melhores que os portugueses. Acho que a diferença, se houver, deve-se ao recebimento de maior número de turistas no caso Portugal/Grécia. Ademais, a Espanha está ganhando com boa dianteira da Grécia.

http://www.finfacts.com/biz10/globalworldincomepercapita.htm

http://en.wikipedia.org/wiki/List_of_countries_by_GDP_(PPP)_per_capita

Permafrost disse...

Comentarista, putz, catso, sorry, desculpaí, mas esta janela de comentários é uma bosta no q diz respeito a linques dentro do comentário. Vc deve ter escrito coisas aí q sumiram.

E ¡olha q é pago, hem!

Estou mudando pro Haloscan aos poucos.

O grego é "uma lingua q só ela" quanto aos tempos verbais e quanto à estrutura. Nada a ver com vocabulário.

Estou escrevendo o próximo artigo sobre o assunto, mas ainda vai demorar um pouco.

André, ainda vai ficar mais claro.

Arranhaponte, dei o desconto pràs palavras q o Houaiss "esqueceu-se" de incluir. Há q lembrar q não se deve escusar o Oxford a priori de ter feito a mesma coisa, já q é um dicionário bem conservador.

Neanderthal disse...

Hmm. Novo design.

Na verdade, o Inglês tem mais palavras porque para cada palavra de origem anglo-saxônica existe uma contrapartida de origem latina. Por que? Porque a lingua da elite inglesa já foi o francês! Sem que isso tenha apagado o inglês-do-povo. Alguns brasileiros se surpreendem que as vezes uma tradução literal faz sentido em inglês, com um ar meio formal, antiquado. É porque a palavra existe, procedente do francês. Exemplo: mandate (term), incommode (bother), etc.........

Neanderthal disse...

PS: não me venha com chorumelas.

Permafrost disse...

Derthal, esse é um dos motivos, decerto. A questão principal, pra mim, não é só q o inglês tem mais palavras (lexemas), mas q tem mais semantemas (unidades semânticas) e um sistema gramático e fonético q acomoda mais cognemas. Pra mim é irônico q se cobre mais pra traduzir de Port pra Ing do q de Ing pra Port. O primeiro é muito mais fácil, já q a quantidade de coisas possíveis de expressar naturalmente em português é menor.

O difícil da tradução Port>Ing deve ser as barbaridades SEMÂNTICAS q se costuma escrever em brasilês. Vou falar sobre isso no Origens lingüísticas do atraso brasileiro, parte 4.

Postar um comentário

consulte o doutor