| Jfreq. uma ferramenta para contar palavras, rapidamente |
Baixe Agora |
Jfreq. Classificação e resumo
- Nome do editor:
- Viral Bioinformatics
- Sistemas operacionais:
- Windows All
Jfreq. Tag
Jfreq. Descrição
O JFREQ é uma ferramenta que leva documentos de texto simples e os transforma em uma matriz de frequência de palavras. JFREQ tenta ser rápido e não demorar para muita memória. Pode ser melhor em ambos, mas é bem utilizável. Os arquivos de texto simples podem ser adicionados diretamente ou pela carga da pasta. Se as pastas forem oferecidas, a JFREQ só procura um nível para documentos e pressupõe que tudo que ele encontra é um arquivo de texto simples. É útil garantir que isso seja verdade. Durante o processo de contagem, a JFREQ pode, opcionalmente: · Minúsculas tudo · Remova os símbolos de moeda · Remover dígitos · Remover palavras de parada com uma lista que você fornece · Aplique um stemmer para um dos 12 idiomas europeus · Execute uma análise de conteúdo com um dicionário que você fornece A saída JFREQ é uma pasta que contém sua matriz de freqüência de nova palavra (ou categoria) em uma escolha de formatos, opcionalmente gzipped para economizar espaço no disco. Os formatos são: · LDA-C: Formato de matriz esparso de Blei usado para montagem de modelos de tópicos, mas geralmente é útil para dados de frequência de palavras. · MTX: O formato de matriz esparso do mercado matricial usado em análise numérica, no formato "inteiro de coordenadas". · CSV: a primeira escolha de formato de saída de todos. Não é bem adequado para dados de frequência de palavras em grande escala, mas razoável para pequenas coleções de documentos e para análises de conteúdo
Jfreq. Software Relacionado