Era uma vez, o mercado das unidades gráficas? Não exatamente! Mas…

… no que depender da Nvidia, a sua participação nele irá mudar! Ao menos, no que concerne em relação ao foco dos seus negócios: de fabricante de GPUs para jogos eletrônicos (e outras aplicações neste segmento), a uma empresa de Inteligência Artificial. Por enquanto, este mercado está “bombando” (mesmo apesar que muitos ainda acreditarem que estamos vivendo em uma nova bolha), em vista dos grandes investimentos que as empresas vêm fazendo para consolidar as suas posições, como fornecedoras dos mais variados serviços que fazem o uso de IA…

“Nvidia is poised to move beyond the graphics processors that powered its rise to dominance. Nvidia GTC kicks off this week – now branded more explicitly as an “AI conference” – where chief executive Jensen Huang is expected to introduce a new processor designed specifically for inference, according to people familiar with the company’s plans. The shift would mark a rare departure from the philosophy that has guided Nvidia for most of its 33-year history…”
— by TechSpot.

A Nvidia está prestes a realizar uma mudança histórica em sua estratégia de hardware, distanciando-se da dependência exclusiva das unidades de processamento gráfico (GPUs), que a tornaram líder do mercado de entretenimento! Durante o evento GTC, a empresa deve apresentar um novo processador projetado especificamente para “inferência”, a etapa em que os modelos de IA já treinados, respondem as consultas dos usuários. Esta transição marca o fim de uma filosofia de 33 anos, na qual a Nvidia defendia que uma única arquitetura de GPU poderia lidar com todas as fases da computação de IA.

O novo chip é fruto da aquisição da startup Groq, realizada pela Nvidia no final do ano passado por aproximadamente US$ 20 bilhões. A Groq é conhecida por desenvolver as unidades de processamento de linguagem (LPUs), hardwares que priorizam a velocidade de raciocínio e a geração de texto com latência extremamente baixa. Ao incorporar essa tecnologia e a equipe de engenharia da Groq, liderada por um ex-projetista de chips do Google, a Nvidia busca oferecer uma performance superior em tarefas de resposta em tempo real.

Nessas horas, pergunto: estas funções não poderiam ser integradas às NPUs?

Essa nova unidade de processamento será projetada para trabalhar em conjunto com a sua próxima geração de GPUs, baseada na arquitetura “Vera Rubin”. Enquanto a GPU continua sendo a ferramenta ideal para o treinamento massivo de modelos complexos, o novo chip focado em inferência assumirá as tarefas de execução cotidiana. Juntos, eles formarão uma plataforma híbrida capaz de gerenciar a crescente diversidade de cargas de trabalho nos modernos centros de dados de IA.

A decisão de diversificar o portfólio ocorre em um momento de pressão competitiva crescente. Rivais tradicionais (como a AMD e a Intel) estão lançando soluções mais eficientes, enquanto gigantes da tecnologia que são grandes clientes da Nvidia (como o Google, a Amazon e a Microsoft) estão desenvolvendo seus próprios chips personalizados. Ao oferecer um hardware especializado em inferência, a Nvidia tenta evitar que esses clientes busquem alternativas de terceiros para rodar seus chatbots e aplicativos de IA.

Em última análise, isto sinaliza que a Nvidia não se vê mais apenas como uma fabricante de placas de vídeo adaptadas, mas como uma empresa que fornece soluções para todo o ecossistema de silício para IA. A integração da tecnologia da Groq permite que a companhia entregue resultados até cinco vezes mais potentes do que os modelos anteriores. Essa evolução é vista como um passo essencial para sustentar a dominância da marca em um mercado, que exige cada vez mais rapidez e eficiência energética no processamento de dados.

E o que será dos GPUs para jogos? Pois até agora, ninguém fala nada… &;-D

Leave a Comment Cancel reply