Como obter uma lista de palavras a partir de um dicionário Aspell

Há algum tempo eu estava precisando de uma grande lista de palavras em português (do Brasil) para fazer um teste sobre encoding e collations no PostgreSQL. A solução que eu encontrei foi fazer um dump de um dicionário pt_BR do Aspell.

Para extrair um dump no formato de uma palavra por linha, utilize o seguinte comando:

aspell -l pt_BR dump master | aspell -l pt_BR expand | tr ' ' '\n' > palavras.txt

O comando acima extrairá todas as palavras (inclusive as variações) do dicionário pt_BR do Aspell e salvará a lista no arquivo “palavras.txt”.

A partir desse arquivo você pode carregar as palavras (na versão do Aspell que estou usando – a versão 0.60.6.1 – a lista contém 9.533.294 palavras) para bancos de dados ou planilhas.

7 thoughts on “Como obter uma lista de palavras a partir de um dicionário Aspell”

  1. Pingback: Online cialis
  2. Pingback: Cialis vs viagra
  3. Pingback: Viagra vs cialis
  4. Pingback: Cialis generika
  5. Pingback: Cialis canada
  6. Pingback: Viagra daily

Comments are closed.