Supercomputador da Meta: diretor da Nvidia explica o projeto de IA
Tecmundo
Com a promessa de ser a máquina mais rápida do mundo, a Meta (ex-Facebook) anunciou em 24 de janeiro deste ano o AI Research SuperCluster (RSC). O supercomputador — que funciona como uma espécie de data center inteiro — de Inteligência Artificial (IA) terá a capacidade de realizar quintilhões (um quintilhão é o número 1 acompanhado de 18 zeros) de operações por segundo.
Para entender um pouco mais sobre o projeto, o TecMundo conversou com Marcio Aguiar, diretor da divisão Enterprise da Nvidia para a América Latina. A marca, que é conhecida por muita gente pelas GPUs, tem a divisão Enterprise que trabalha com setores como IA, robótica, carros autônomos, data centers, supercomputadores e será a responsável pelo projeto RSC.
Marcio explica que o supercomputador, que está sendo construído, terá 760 componentes Nvidia DGX A100 (que é o sistema universal para todas as cargas de trabalho de IA) como seus nós de computação. Eles incluem um total de 6.080 GPUs Nvidia A100 conectadas em uma rede Nvidia Quantum 200Gb/s InfiniBand para fornecer 1.895 petaflops de desempenho TF32.
A título de comparação, o representante da Nvidia lembra do SiDi, instituto privado de ciência e tecnologia que se uniu com a Samsung para trazer um supercomputador ao Brasil em 2021, o primeiro focado em IA do país. O SiDi terá “apenas” 25 sistemas Nvidia DGX A100 e processamento de 125 petaflops, para se ter uma ideia, e mesmo assim já é considerado a maior estrutura do tipo na América Latina.
No caso do RSC, o poder dele equivale ao processamento e velocidade de cerca de 100 mil computadores comuns juntos. Do início da ideia, passando pelo planejamento e o começo dos trabalhos, o projeto levou apenas 18 meses.
“A Nvidia já tinha desenhado supercomputadores do tipo em 2016, só que o RSC é o projeto com a maior instalação de DGX do mercado. Quase toda a nossa linha de produção da DGX foi alocada nesse projeto, o que mostra o tamanho e importância que esse supercomputador terá para a indústria”, argumenta Aguiar.
Para que vai servir o RSC?
O executivo da Nvidia lembra que um dos objetivos da supermáquina da Meta é desenvolver novas soluções para o metaverso. O conceito virou central para o negócio da empresa, tanto que se transportou para o novo nome da holding.
De acordo com a companhia comandada por Mark Zuckerberg, com o RSC será possível treinar mais rapidamente modelos que usam sinais multimodais para determinar se uma ação, som ou imagem é nociva ou benigna para a comunidade que está utilizando os ambientes virtuais.
Além de ajudar na formalização do tão falado metaverso, o equipamento da Meta irá utilizar todo o seu poder de processamento para revolucionar o chamado “processamento de linguagem natural”, que é uma área que estuda os problemas da geração e compreensão automática de línguas humanas.
“Nós estamos interagindo com dispositivos, redes sociais e plataformas de forma cada vez mais natural, então é preciso treinar os frameworks [linguagens de programação] para que seja cada vez mais fácil que os equipamentos consigam entender não somente a nossa voz, mas imagens, textos e vídeos”, pontua Aguiar.
Quanto vai custar o RSC?
O diretor da Nvidia não revela o custo do RSC, pois esse é um detalhe que está mantido sob sigilo pela Meta. Contudo, ele conta que é possível fazer uma conta para se ter uma ideia da operação total da empreitada.
Ele explica que cada sistema Nvidia DGX A100 custa próximo de US$ 300 mil dólares (cerca de R$ 1,5 milhão na cotação atual). Ou seja, se for multiplicado por 760, o valor é de cerca de US$ 228 bilhões (R$ 1,2 trilhão).
“E o valor será um pouco maior do que esse porque também há custos envolvidos em storage, network, além de outras GPUs avulsas que irão compor o projeto. É uma iniciativa muito cara que só uma companhia do porte da Meta consegue fazer mesmo”, brinca Aguiar.
O RSC está previsto para começar a operar ainda no segundo semestre de 2022. O diretor da Nvidia também comenta sobre os problemas da cadeia de suprimentos e o quanto a falta principalmente de microchips pode atrasar o projeto.
“A Nvidia não tem fábricas, então nós compramos os componentes e nós mesmo montamos. E em virtude dessas questões de mercado nós com certeza fomos afetados. Contudo, devido a uma boa gestão, estamos conseguindo atender as demandas de todos os projetos, que estão demorando um pouco mais do que o normal para serem entregues, mas estão sendo finalizados”, disse.