Ncbix :: bigfetch

Robustly recuperar conjuntos de resultados de sequência NCBI muito grande com base em pesquisas de palavras-chave usando NCBI EUTILS
Baixe Agora

Ncbix :: bigfetch Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • Perl Artistic License
  • Preço:
  • FREE
  • Nome do editor:
  • Roger A Hall
  • Site do editor:
  • http://search.cpan.org/~rogerhall/

Ncbix :: bigfetch Tag


Ncbix :: bigfetch Descrição

Robustly recuperar conjuntos de resultados de sequência NCBI muito grandes com base em pesquisas de palavras-chave usando eutils NCBI Ncbix :: bigfetch é um módulo Perl útil para baixar conjuntos de resultados muito grandes de seqüências de NCBi dada uma consulta de texto. Seu primeiro uso teve mais de 11.000.000 sequências como resultado de uma única pesquisa de palavras-chave. Ele usa o YAML para criar um arquivo de configuração para manter o estado do projeto no caso de rede ou problemas do servidor interrompe a execução, caso em que ele pode ser facilmente reiniciado após os últimos dados do Batch.Downloaded são organizados por "ID do projeto" e "diretório base" e salvos em arquivos de texto. Cada arquivo inclui o ID do projeto em seu nome. As teclas Project_ID e Base_Dir são as únicas chaves necessárias, embora você obtenha a mesma busca por "apoptose" toda vez que você também definir a tecla "consulta". Em qualquer caso, uma vez iniciado um projeto, ele só precisa que os dois parâmetros sejam recarregados.Besides os arquivos de dados, dois outros arquivos são salvos: 1) O resultado da pesquisa inicial, que inclui a tecla webenv e 2) um arquivo de configuração , que salva os dados analisados e é usado para capturar o download e recuperar lotes ou seqüências ausentes.Results são recuperados em lotes, dependendo da tecla "return_max". Por padrão, o "índice" começa em 1 e os downloads continuam até que o índice exceda "contagem" ..Casionalmente Erros acontecendo e os lotes inteiros não são baixados. Nesse caso, o "índice" é adicionado à lista "ausente". Esta lista é salva no arquivo de configuração. Os lotes que faltam devem ser baixados todos os dias e não salvo até que o final dos scripts completos de execução. Estado incluídos no diretório de script: fetch-all.pp fetch-bushing.pp buscar-indisponível.pphe o fluxo de trabalho recomendado é: 1. Copie os scripts e edite-os para um projeto específico. Use um novo número como o ID do projeto. 2. Comece a download executando o Fetch-All.pp, que primeiro enviará uma consulta e salvar a tecla WebEnv resultante em um arquivo de configuração específico do projeto (usando YAML). 3. Na manhã seguinte, mate o processo Fetch-All.pp e execute Fetch-Missing.pp até que seja concluído. 4. Reinicie o Fetch-All.pp. Se você deseja re-download de sequências "não disponíveis", você pode executar buscar-indisponível.pp. No entanto, eles serão baixados no final do Fetch-All.pp se ele for concluído normalmente.Se seu conjunto de resultados da consulta é tão grande que o seu webenv times fora, basta iniciar um novo projeto com esse último índice do projeto anterior, e vai pegar o resultado definido a partir daí (com um novo webenv). (A atualização planejada iniciará automaticamente outra pesquisa.) Aviso: Você pode perder uma (muito) algumas seqüências se o seu download se estender em vários projetos. No entanto, nosso teste mostra que os lotes gerados com a mesma consulta dentro de alguns dias são em grande parte idênticos.Synopsis Use Ncbix :: Bigfetch; # Parâmetros my $ params = {project_id => "1", base_dir => "/ home / user / data", db => "proteína", consulta => "apoptosis", return_max => "500"}; # Iniciar projeto Meu $ Project = Ncbix :: Bigfetch-> Novo ($ params); # Ame o que você está com impressão "Autores:". $ Project-> Autores (). "\ n"; # Tente todos os lotes de sequências enquanto ($ project-> resultados_waiting ()) {$ project-> get_next_batch (); } # Obtenha lotes ausentes enquanto ($ project-> Missing_batches ()) {$ project-> get_missing_batch (); } # Encontrar IDs indisponíveis Meus $ IDS = $ Project-> indisponível_ids (); # Recuperar IDs indisponíveis foreach My $ ID (@ $ IDS) {$ Project-> get_sequence ($ ID); } Requisitos: · Perl.


Ncbix :: bigfetch Software Relacionado

Scriptutil.

classe orientada para o objeto para tornar os scripts de linha de comando típicos mais fáceis de escrever ...

135

Download