Mudanças entre as edições de "Minicluster"

De WikiLICC
Ir para: navegação, pesquisa
m (Boot nos nós)
m
 
(76 revisões intermediárias pelo mesmo usuário não estão sendo mostradas)
Linha 1: Linha 1:
== Documentos ==
+
* [[Projeto Minicluster]] LICC enviado a CAPES.
* Dados do [[Projeto Minicluster]] LICC.
+
* [[Minicluster:Hardware]], detalhes das máquinas HP.
 +
* [[Minicluster:HardwareTemp]], detalhes das máquinas Dell (projeto temporário).
 +
* [[Minicluster:Linux]], instalação do Linux Fedora.
 +
* [[Minicluster:Rede]], configuracão da Rede.
 +
* [[Minicluster:Firewall]], (off no momento)
 +
* [[Minicluster:NFS]]
 +
* [[Minicluster:NIS]]
 +
* [[Minicluster:DRBL]]
 +
* [[Minicluster:PXE]]
  
* Resultados do edital [http://www.ufrgs.br/propg/interno/noticias8.html Pro-Equipamentos 2009 PROPG]  
+
* [[Minicluster:Ssh]], ssh ou rsh sem senha.
** [http://www.ufrgs.br/propg/interno/Projetos%20aprovados%20Capes.pdf Planilha] de projetos aprovados UFRGS.
+
* [[Minicluster:Mpich]], configuração do Mpich, testes iniciais.
** [http://www.cpd.ufrgs.br/servicos/Registros%20de%20Precos%202009-1.pdf Registros de Preços UFRGS]
+
* [[Minicluster:Torque]], instalação e configuração do scheduler e do queue.
 +
* [[Minicluster:Mpich com torque]]
 +
* [[Minicluster:Compilando MPI]], criando, compilando e rodando MPI.
 +
* [[Minicluster:Fortran]], rodando.
  
* [http://www.seprolstore.com.br Seprol Store]
 
** São José - SC (matriz), R: Bento Águido Vieira,1152 - Bela Vista, CEP 88110-130, Tel.: (48) 3271-7100
 
** Blumenau - SC (loja), R: Joinville,190 - lj 03 - Vila Nova, CEP 89035-200, Tel.: (47) 3221-7100
 
** '''Porto Alegre''', R: Vitor Hugo,37 - 503 - Petrópolis, CEP 90630-070, Tel.: (51) 3330-7847
 
  
==Hardware==
+
* [[Minicluster:Resultados]], futuros, obviamente.
* 16 máquinas escravo
+
* [[Minicluster:Gerenciamento]]
* 2 máquinas mestre
+
* [[Minicluster:Testes]]: Funcionamento dos arquivos de testes.
* 1 switch
+
* [[Minicluster:Desabilitando IPV6]]:
  
O projeto consiste na substituição do cluster existente por um cluster constituído por 18 máquinas, um “switch” e um “no break”.
+
* [[Minicluster:Usuários]]: Dicas e testes.
  
* Máquina do projeto: [[Escravo Dell]]
+
==Veja também==
* Máquinas da HP: [[Escravo HP]]
 
 
 
===Máquina escravo===
 
 
 
Descrição de uma máquina-escravo (de um total de 16 máquinas):
 
  
MICRO COMPUTADOR HP DC 5800 MT- AJ409AV#261 [http://www.seprolstore.com.br/index.php?center=descricao&id=020!0067]
+
===Filesystem===
*HP COMPAQ DC5800 Microtorre: [http://bizsupport1.austin.hp.com/bc/docs/support/SupportManual/c01363847/c01363847.pdf Manual DC8500]
 
*Processador Intel Core 2 Duo E7500
 
*2GB de memória RAM, PC2-6400, DDR2 800
 
*250GB de HD 3.5Ghz
 
*DVD-RW SATA SuperMulti LightScribe
 
*Conexão Rede Gigabit Intel® 82566DM Integrada
 
*Dez (10) portas USB 2.0 (duas frontais, seis traseiras, dois internos two internal USB header) uma porta VGA, saída DVI (disponível via cartão ADD2 opcional), uma serial com a segunda opcional, duas portas PS/2 (mouse e teclado), tomada frontais para altofalantes e microfone, porta RJ-45, porta paralela opcional
 
*Microsoft Office Ready 2007
 
*Windows Vista Business com downgrade para XP Pro personalizado instalado (Português)
 
*Garantia de 3 anos onsite
 
<!-- * Valor estimado : R$ 1.350,00 x 16 = R$ 21.600,00 -->
 
 
 
===Máquina mestre===
 
 
 
Descrição de uma máquina mestre (de um total de 2 máquinas):
 
A mesma + monitores.
 
<!-- Valor estimado : R$ 2.477,00 x 2 = R$ 4.954,00 -->
 
 
 
===Processadores===
 
* [http://ark.intel.com/Product.aspx?id=36503 Intel Core 2 Duo 7500] ou [http://processorfinder.intel.com/Details.aspx?sSpec=SLB9Z], 3M Cache, 2.93 GHz, 1066 MHz FSB
 
 
 
===Descrição do “Switch”===
 
 
 
O switch deve comportar todos os nós e ter espaço para possíveis expansões na quantidade de nós do cluster. Um switch que comportaria nossas necessidades seria Switch Gigabit-Ethernet Gerenciável com 24 portas, que possui como características principais:
 
* Modelo: 3COM® 4200G 3CR17661-91
 
* Empresa: Philips Business Communication
 
* 24 saídas 10/100/1000 Mbit/s. Isso possibilita uma futura expansão do cluster até 24 nós.
 
* 2 saídas 10Gbit/s, uma poderá ser usada para acesso a um servidor para futura expansão de estrutura mestre-escravo e outra poderá ser usada para acesso a outro switch no futuro.
 
* Todas as saídas têm auto-negociação. As placas de rede do servidor e dos nós devem ser configuradas também para auto-negociação, caso contrário a conexão será half-duplex em vez de full-duplex.
 
<!-- * Valor estimado : R$ 3.600,00 -->
 
 
 
Outro item que deve ser observado na compra de um switch é a taxa de encaminhamento, ou seja, um switch de baixa qualidade pode ter a mesma largura de banda em cada porta do switch que escolhemos e mesmo assim não conseguir a velocidade máxima anunciada quando várias portas são utilizadas.
 
 
 
Um switch que permite o uso simultâneo de todas as portas na velocidade máxima é chamado de non-blocking. O switch escolhido ainda conta com recursos que podem ser gerenciados através de uma interface web apontada para o servidor web do switch. Os recursos incluem a possibilidade de replicar todo o tráfego para uma determinada porta, estatísticas de uso, etc.
 
 
 
===No break (item não aprovado)===
 
 
 
O propósito do no break é evitar a perda de dados ou corrupção do sistema de arquivos em uma eventual queda de energia elétrica. Apenas as máquinas mestre serão conectadas ao no break.
 
 
 
Quando está funcionando em sua capacidade plena, o modelo sugerido é capaz de suportar a falta de alimentação por um intervalo de tempo de aproximadamente 30 minutos. Além disso, como possui interface para comunicação com as máquinas, ele é capaz de avisá-las quando sua carga está por terminar, o que permite o desligamento correto das máquinas antes da interrupção total da alimentação.
 
 
 
* Modelo: APC® BR-1500 120V - BR1500.
 
* Fabricante: APC.
 
<!-- * Valor estimado: R$ 900,00.-->
 
 
 
== Montagem Física ==
 
 
 
== Rede Elétrica e Arrefecimento ==
 
[http://www.tudosobreimoveis.com.br/conteudo.asp?t=1&id=497 Rede Elétrica]
 
 
 
==Software==
 
 
 
===Linux (arquitetura x86-64)===
 
Olhando na [http://www.mcs.anl.gov/research/projects/mpich2/downloads/index.php?s=downloads página do MPICH2] aparecem pacotes para:
 
* Debian 1.2.1
 
** Ubuntu 1.2 (based on Debian)
 
* Fedora/RHEL/CentOS 1.2.1
 
* Gentoo
 
* FreeBSD 1.2.1
 
 
 
Uma opinião do controle de Tsunamis
 
* [http://www.pcworld.idg.com.au/article/208829/debian_linux_cluster_beats_supercomputer_tsunami_warnings?pp=1] ''We tried several Linux flavours, including Red Hat, Mandrake, Fedora etc,...'''Debian''' as the most stable in servers, especially when things are being done pretty much in automatic mode. In our workstations the preference among programmers is Ubuntu, which is basically Debian-based...''
 
 
 
====Boot nos nós====
 
* [http://en.wikipedia.org/wiki/Preboot_Execution_Environment PXE], possui PXE, conforme [http://h18000.www1.hp.com/products/quickspecs/12863_ca/12863_ca.pdf manual]
 
* [http://en.wikipedia.org/wiki/Diskless_node diskless node]
 
* [http://web.mst.edu/~vojtat/pegasus/administration.htm How to setup a Diskless cluster]
 
* [http://www.kegel.com/linux/pxe.html]
 
* [http://ftp.us.dell.com/app/4q01-Lin.pdf Artigo] da dell: explica 3 modos de ter o cluster.
 
* ...os nós bootam seus sistemas a partir do servidor através da rede, usando DHCP e TFTP, e o software [http://en.wikipedia.org/wiki/Network_booting Etherboot] de boot remoto através da rede.
 
 
 
====Filesystem====
 
 
* [http://en.wikipedia.org/wiki/Global_File_System Global File System]
 
* [http://en.wikipedia.org/wiki/Global_File_System Global File System]
 
* [http://www.communigate.com/notes/SFS.html Sistema de arquivos]
 
* [http://www.communigate.com/notes/SFS.html Sistema de arquivos]
Linha 109: Linha 39:
 
* Menor Latency (Software, Configuração, Rede...)
 
* Menor Latency (Software, Configuração, Rede...)
  
==Veja também==
+
==Referências==
* [[Minicluster: Resultados]]
 
* http://www.ibm.com/developerworks/linux/library/l-11sysadtips/index.html
 
  
 +
Cluster
 +
* http://debianclusters.org/index.php/Main_Page
 +
* http://bccd.net/ Bootable Cluster
 +
* http://www.linux.org/docs/ldp/howto/Beowulf-HOWTO/index.html, Simples Beowulf
 +
* http://www.phy.duke.edu/~rgb/brahma//beowulf_book/node68.html Beowulf book
 
* http://www.ibiblio.org/pub/Linux/docs/HOWTO/Beowulf-HOWTO
 
* http://www.ibiblio.org/pub/Linux/docs/HOWTO/Beowulf-HOWTO
 
* http://www.ibiblio.org/pub/Linux/docs/HOWTO/Parallel-Processing-HOWTO
 
* http://www.ibiblio.org/pub/Linux/docs/HOWTO/Parallel-Processing-HOWTO
 
* http://www.ibiblio.org/pub/Linux/docs/HOWTO/SMP-HOWTO
 
* http://www.ibiblio.org/pub/Linux/docs/HOWTO/SMP-HOWTO
* http://www.dataplow.com/
+
* http://www.mcsr.olemiss.edu/bookshelf/articles/how_to_build_a_cluster.html book
 +
 
 +
Rede
 +
* http://www.yolinux.com/TUTORIALS/LinuxTutorialNetworking.html e vários outros tutoriais
 +
* http://home.comcast.net/~lafeyette_management/KludgeKollection/rsh-rlogin_enable-LINUX.HOWTO rsh e ssh
 +
 
 +
Gerenciamento
 +
* http://www.ibm.com/developerworks/linux/library/l-11sysadtips/index.html Dicas gerenciamento
 +
* http://www.dataplow.com/ Software gerenciamento arquivos
 +
* http://www.perceus.org/portal/documentation, Manutenção e administração.
  
 
==Outros Projetos==
 
==Outros Projetos==
Linha 127: Linha 69:
 
* [http://abax.if.usp.br/drupal5/files/manual_abax.pdf Manual ABAX]
 
* [http://abax.if.usp.br/drupal5/files/manual_abax.pdf Manual ABAX]
 
* [http://abax.if.usp.br/drupal5/files/abax_for_dummies.pdf ABAX for dummies]
 
* [http://abax.if.usp.br/drupal5/files/abax_for_dummies.pdf ABAX for dummies]
 +
 +
==Programacão==
 +
* http://software.intel.com/en-us/articles/superscalar-programming-101-matrix-multiply-part-1/
 +
[[Categoria:Minicluster]]

Edição atual tal como às 15h25min de 26 de julho de 2017


Veja também

Filesystem

Outros

  • MPI e MPE
  • Jumpshot: Ferramenta gráfica para visualização de comunicações.

Dúvidas

  • Menor Latency (Software, Configuração, Rede...)

Referências

Cluster

Rede

Gerenciamento

Outros Projetos

Programacão