| Lanl-trace. lanl-trace é um mecanismo de rastreamento que se integra ao MPI e usa strace ou ltrace para capturar a E / S de um aplicativo paralelo |
Baixe Agora |
Lanl-trace. Classificação e resumo
- Nome do editor:
- James Nunez
- Site do editor:
- http://institutes.lanl.gov/data/software/
Lanl-trace. Tag
Lanl-trace. Descrição
Lanl-Trace é um mecanismo de rastreamento que se integra ao MPI e usa Strace ou Ltrace para capturar a E / S de um aplicativo paralelo O LANL-Trace é um mecanismo de rastreamento que se integra ao MPI e usa Strace ou Ltrace para capturar a E / S de uma aplicação paralela. Além disso, a LANL-traçar executa um programa MPI simples antes e após o programa rastreado, a fim de fornecer informações sobre o possível deslizamento e desvio dos relógios distribuídos para permitir que os pesquisadores interpretem significativamente os timestamps em cada um dos arquivos de registro de Qual deles é produzido por cada processo na aplicação paralela.Enstalação e execução O código deve basicamente quase funcionar sem uma grande quantidade de modificação. Tudo é acionado por scripts / MPIRUN. Você pode usar módulos / Mpitrace para colocar scripts / mpirun em seu caminho. Então, uma vez que os scripts / MPIRUN estiver em seu caminho, você apenas executa seu comando normal comando e o rastreamento de MPIRUN deve ser produzido.No entanto, o código de rastreio tenta construir um executável para medir o horário inclinado e a hora de funcionamento antes e depois de execução seu programa MPI. Às vezes esta compilação falha. Se isso acontecer, tente ver o comando que falhou e executá-lo à mão. Em seguida, quando você tentar novamente o executável que você acabou de construir e não tentará novamente para reconstruir.Also, você precisará alterar os caminhos em scripts / módulos e módulos / mpitrace. Há vários outros arquivos neste diretório . Apenas ignore-os. Eles são deixados com tentativas abortadas. Este mecanismo acima deve funcionar com o Open-Mpi.for Mpich, é basicamente o mesmo, exceto que você vai querer usar o método MPIH DBG = FOO e copiar o arquivo MPIRUN_DBG.LTRACE para o seu Mpich Bin.Output e AnalysisPhen O mecanismo de rastreamento é executado , produz um número justo de arquivos. Existe um arquivo de tempo que tenta capturar o desvio e inclinação dos relógios distribuídos, conforme descrito acima. Há um arquivo dirinfo que mede o espaço livre do sistema de armazenamento antes e depois do traço, bem como tentando consultar vários outros aspectos do sistema de armazenamento. Há um arquivo de resumo que apenas mostra o comando executado junto com seus argumentos.Então para cada processo Existem três arquivos produzidos. machinename.pid.trace contém os dados de rastreio bruto, Machinename.pid.out contém a saída padrão desse processo, machinename.pid.summary contém algumas informações simples de resumo e perfilamento. Grande parte dessa informação está disponível nos dados de rastreamento bruto, mas algumas delas não são. Este arquivo de resumo também contém dados resumidos para chamadas do sistema que não foram capturadas. A ideia é que essa ferramenta é apenas para E / S, então tentamos construir uma regex de filtragem para capturar apenas as chamadas de E / S. As chamadas de listagem de arquivos de resumo que foram capturadas pelo mecanismo de strace subjacente, mas que não foram registradas pelo LANL-Trace. No caso de você estar interessado em qualquer um deles, você pode editar o Regex de filtro de acordo.
Lanl-trace. Software Relacionado