| Vetores semânticos. Pacote para criar e pesquisar índices semânticos do vetor por encaixar o Apache Lucene |
Baixe Agora |
Vetores semânticos. Classificação e resumo
- Nome do editor:
- Dominic Widdows
- Site do editor:
- http://code.google.com/p/semanticvectors/wiki/InstallationInstructions
- Sistemas operacionais:
- Mac OS X
- Tamanho do arquivo:
- 46 KB
Vetores semânticos. Tag
Vetores semânticos. Descrição
Pacote para criar e pesquisar índices de vetores semânticos por apache lucene Os índices semânticos do vetor foram criados aplicando um algoritmo de projeção aleatório para matrizes de documentos a prazo. O pacote foi criado como parte de um projeto pela Gerenciamento de Tecnologia da Universidade de Pittsburgh, para explorar o potencial para correspondência automaticamente conceitos relacionados no domínio de gerenciamento de tecnologia, por exemplo, mapeando novas tecnologias para licenciadores de potencialmente interessados. O projeto de vetores semânticos pode ser encontrado em http: //real.hsls.pitt.edu.O pacote cria um modelo de prata, do tipo desenvolvido pelo Projeto Infomap da Universidade de Stanford e outros pesquisadores durante a década de 1990 e início dos anos 2000. Esses modelos são projetados para representar palavras e documentos em termos de conceitos subjacentes e, como tal, podem ser usados para muitas tarefas correspondentes semânticas (conceituais-conscientes), como a geração automática de thesaurus, a representação do conhecimento e a correspondência do conceito. O pacote de vetores semânticos usa um Algoritmo de projeção aleatória, uma forma de análise semântica automática, semelhante à análise semântica latente (LSA) e suas variantes como análise semântica latente probabilística (PLSA). No entanto, ao contrário de outros métodos, a projeção aleatória não depende do uso de algoritmos de decomposição de matriz intensivos computacional, como a decomposição do valor singular (SVD). Isso faz projeção aleatória uma técnica muito mais escalável na prática. Nossa aplicação de projeção aleatória para o processamento de linguagem natural (PNL) é descendente do trabalho de Pentti Kanerva em memória distribuída esparsa, que em análise semântica e mineração de texto, este método também foi chamado de indexação aleatória. Um número crescente de pesquisadores aplicaram projeção aleatória às tarefas de PNL, demonstrando: · Desempenho semântico comparável a outras formas de análise semântica latente. · Vantagens significativas de desempenho computacional na criação e manutenção de modelos. Requisitos: · Java.
Vetores semânticos. Software Relacionado