Planeamento e Administração de
Clusters António Pina |
Semana: 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15| 16
Ultima
Modificação:
29 Out 2012
departamento de informática |
|
AVISO
-------------------
O objectivo geral deste módulo é o estudo, o planeamento e a administração de
recursos computacionais em ambiente de computação distribuída corporativa
(cluster).
A expectativa é que daquele conhecimento possa resultar a possibilidade de, em
cada momento, em presença de uma determinada à capacidade física instalada
sermos capazes de compreender os limites de utilização do sistema, no seu todo,
e de cada um dos subsistemas que o compõem.
Em termos operacionais, pretende-se estudar as condições de optimização da
utilização dos recurso que garantam o máximo desempenho e escalabilidade, de uma
determinada carga computacional.
Linhas de Orientação
o identificar os diferentes tipos de arquitecturas de cluster e grids e discutir as respectivas vantagens e limitações
o analisar e avaliar os requisitos de hardware e software com vista ao planeamento e instalação do equipamento
o identificar os requisitos dos utilizadores necessários para seleccionar o software a instalar e a manter
o identificar e caracterizar políticas de gestão e escalonamento de trabalhos e avaliar os resultados da sua aplicação
o discutir e avaliar o desempenho efectivo de programas paralelos em clusters e grids
18-set-12 (9h-11h)
Atividades de receção e apresentação do curso (parte 1).
25-set-12 (9h-11h)
???
(2-Out-12)
Apresentação da UCE e todos os seus módulos conforme o terceiro sumário de SCD.
PAC no contexto da UCE30
• Caracterização do módulo PAC
• Competências e expectativas de formação dos discentes.
• Discussão geral de temas e problemas a abordar ao longo do semestre.
Introdução à HPC e à Grid
• Introdução à e-science ?
• High Performance Computing:
◦ Iintrodução/ conceitos/definições
◦ Computadores Paralelos
◦ Clusters (Agregados)
• Grids
• Estudo das tendências (5 últimos anos)
◦ Análise de desempenho
◦ Famílias de processadores
◦ Tipos de máquinas
◦ Sistemas de interconexão
material de apoio
• introdução à HPC/GRID
TPC1: Top 500
◦ Visita do sítio www.top500.org
◦ Desenvolvimento dos temas tendências em sistemas, processadores e interligação
(09-10-12)
Apresentação pelos estudantes do TPC
Arquitecturas Modernas para HPC
• Classificação das várias partes do computador tomando como base a hierarquia de desempenho baseado em tempo de resposta dos dispositivos físicos de um sistema de computação.
• Relacionar as limitações físicas do hardware para os desempenhos diferentes de um tipo de operação computacional.
• pontar possíveis gargalos nos cálculos podem ocorrer e como isso pode ser evitado.
Computação Corporativa DI
• Visita Guiada às instalações do cluster Search no DI: http://search.di.uminho.pt
• On the Search for an advanced multi-purpose computing infrastructure
• Vista Geral do Cluster
◦ Missão
◦ Tecnologias
◦ Arquitectura Física
◦ Evolução da Arquitectura Lógica
material de apoio
• Modern architectures for HPC
• 2-Parallel Computer Architecture
(16-10-12)
Palestra: Luís Alves
“Terão os nubentes FEA e HPC uma vida longa e feliz (na UM)?"
Ambiente programação paralela
•
Introdução MPI
o Primitivas básicas
• Introdução ao Modules
o Um
ambiente flexível para utilizadores
Processamento de tarefas em lotes
• OpenPBS/Torque visão do Utilizador
◦ Características
◦ Componentes
◦ Submissão de trabalhos
◦ Recursos
◦ Trabalhos Interactivos
◦ Estudo de Casos
◦ Determinar estado de trabalhos/sistema
◦ Execução Trabalhos paralelos
TPC2:
. NAS Parallel Benchmarks:
http://www.nas.nasa.gov/publications/npb.html
o Exercícios de instalação e execução em ambiente de cluster
o Exercícios com o utilitário module
material de apoio
• PBS
◦ Comandos
• Modules
◦ Exemplos : mpich2-intel, mvpich2
material de apoio (complementar)
• Bash
(23-10-12)
Ambiente programação paralela (continuação)
• Introdução ao PBS (continuação)
o Visão do Sistema
o PBS_server: configuração, nós, comandos, filas
o MOM: Configuração
Sessão Laboratorial
o NAS Parallel Benchmark:
techreports
o Submissão de trabalhos ao cluster
sequencial/paralelos (MPI)
o System Monitoring
top-linux-monitoring-tools
material de apoio
◦ BCC
(30-10-12)
Sessão Laboratorial (continuação)
o Submissão
de trabalhos ao cluster
TPC3:
• Análise de desempenho e representação gráficas
◦ Utilização da ferramenta <gnuplot>