| Estatísticas :: Calinskiharabasz. Estatísticas :: Calinskiharabasz é uma extensão Perl para a regra de parada do cluster proposta por Calinski e Harabasz (CH). |
Baixe Agora |
Estatísticas :: Calinskiharabasz. Classificação e resumo
- Licença:
- Perl Artistic License
- Nome do editor:
- Anagha Kulkarni
- Site do editor:
- http://search.cpan.org/~anaghakk/Statistics-CalinskiHarabasz-0.01/lib/Statistics/CalinskiHarabasz.pm
Estatísticas :: Calinskiharabasz. Tag
Estatísticas :: Calinskiharabasz. Descrição
Estatísticas :: Calinskiharabasz é uma extensão Perl para a regra de parada do cluster proposta por Calinski e Harabasz (CH). Estatísticas :: Calinskiharabasz é uma extensão de perl para a regra de parada do cluster proposta por Calinski e Harabasz (CH) .Synopsis Use estatísticas :: Calinskiharabasz; CH (InputFile, "agglo", 10); O arquivo de entrada é esperado no formato "denso" - arquivo de entrada de amostra: 65 11 00 11 00 00 11 00 11 10 01 10 01 11 00 1 CH Use o Critério de taxa de variância que é análogo às estatísticas F para estimar o número de clusters que um dado dados naturalmente cai. Eles minimizam dentro do cluster / grupo sombra de quadrados (WGSS) e maximizam entre o cluster / grupo de quadrados de quadrados (BGSS) Exportação "CH" por padrão.InputInputFilethe DataSet de entrada é esperado no formato "denso" da matriz. A matriz densa de entrada é esperada em um arquivo de texto simples, onde a primeira linha no arquivo fornece as dimensões do conjunto de dados e, em seguida, o conjunto de dados em um formato de matriz deve seguir. Os contextos / observações devem ser ao longo das linhas e os recursos devem estar ao longo da coluna. Por exemplo: 65 11 00 11 00 00 11 00 11 10 01 10 00 11 10 01 A primeira linha (65) dá o número de linhas (observações) e O número de colunas (recursos) presentes na seguinte matriz. Seguir cada linha registra a frequência de ocorrência do recurso na coluna na observação dada. Assim, o recurso1 (1ª coluna) ocorre uma vez na observação1 e de infacto uma vez em todas as outras observações também, enquanto o recurso3 não ocorre na observação1.ClusteringMethod As medidas de cluster que podem ser usadas são: 1. RB - BISEÇÕES REPLAS 2. RBR - BISEÇÕES REPETIÇÕES POR POR REQUERIMENTO K-Way 3. Direto - Cluster direto do K-Way 4. Agglo - aglomerado aglomerativo 5. Gráfico - Gráfico de agrupamento baseado em particionamento 6. BagGlo - Partional tendencioso aglomerativo clusteringk Valuethis é um limite superior aproximado para o número de clusters que podem estar presentes no conjunto de dados. Assim, para um conjunto de dados que você espera ser separado em 3 clusters, este valor deve ser definido algum valor inteiro maior que 3.Outputa número inteiro único que é a estimativa do número de clusters presentes no conjunto de dados de entrada. Requisitos: · Perl. · Este módulo usa o conjunto de programas C chamados Clutão para fins de cluster. Assim, o cluto precisa ser instalado para este módulo ser funcional.
Estatísticas :: Calinskiharabasz. Software Relacionado