Imagem: Divulgação

O avanço da inteligência artificial generativa elevou e muito a pressão sobre a infraestrutura que sustenta modelos de larga escala, como os utilizados pelo ChatGPT. Com milhares de GPUs operando de forma sincronizada em ambientes distribuídos, a eficiência das redes passou a ser um fator crítico para o desempenho de sistemas de IA avançada.

Foi nesse cenário que a AMD anunciou a contribuição do protocolo Multipath Reliable Connection (MRC) ao Open Compute Project (OCP), iniciativa desenvolvida em colaboração com OpenAI, Microsoft e outras empresas do setor. A proposta é ampliar o acesso da indústria a uma nova arquitetura de rede voltada para operações de IA em escala massiva.

Latência e falhas entram no foco da infraestrutura

O MRC foi projetado para ambientes de treinamento de modelos avançados, nos quais interrupções mínimas podem comprometer a produtividade de clusters inteiros. Diferentemente dos modelos tradicionais de rede, que utilizam um único caminho para transmissão de dados, o protocolo distribui os pacotes simultaneamente por múltiplas rotas. A abordagem reduz congestionamentos, diminui variações de latência e acelera a recuperação em caso de falhas.

Na prática, a tecnologia busca manter GPUs sincronizadas durante cargas intensivas de processamento. A estabilidade operacional se tornou prioridade para empresas que desenvolvem grandes modelos de linguagem, já que perdas de eficiência em redes podem limitar diretamente o aproveitamento da capacidade computacional instalada.

Segundo a AMD, o protocolo já foi implementado em ambientes de testes de larga escala com um grande provedor global de nuvem. A empresa afirma ter participado da definição técnica do padrão e do desenvolvimento de mecanismos avançados de controle de congestionamento voltados para workloads de IA.

IA acelera corrida por redes de alto desempenho

A companhia também destacou o uso das placas de rede AMD Pensando Pollara 400 AI NIC na validação inicial da tecnologia e a compatibilidade futura com a nova geração AMD Pensando Vulcano 800G AI NIC. O objetivo é permitir maior programabilidade de hardware e software em redes voltadas para supercomputação e inteligência artificial.

O crescimento de modelos generativos, agentes autônomos e sistemas multimodais aumentou a demanda por data centers capazes de operar com centenas de milhares de aceleradores simultaneamente. Nesse ambiente, a rede deixa de ser apenas um componente de conectividade e passa a atuar como elemento central para eficiência, estabilidade e escalabilidade operacional.

Além da AMD, OpenAI, Microsoft, Broadcom e Intel participaram da construção do MRC. A expectativa do grupo é transformar o protocolo em uma base aberta e padronizada para redes Ethernet voltadas à próxima geração de infraestrutura de IA.

Sem comentários registrados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *