AMD lança pequeno modelo de linguagem focado em otimizar tarefas via IA

Tecmundo

30/09/2024 21h19

https://timnews.com.br/system/images/photos/16361210/original/open-uri20240930-18-1tio8b0?1727731267

©AMD

Por muito tempo focada no mercado de hardware, a AMD vem mudando seus rumos e anunciou seu primeiro pequeno modelo de linguagem (SLM). Chamado de AMD-135M, a tecnologia foi criada para o corpo empresarial com o intuito de otimizar tarefas específicas.

Para realizar a otimização de tarefas, o AMD-135M utiliza uma técnica chamada de decodificação especulativa. Essa técnica realiza palpites sobre solicitações de tokens futuros enquanto gera os tokens atuais na linha de processamento, tornando todo o processo mais lógico.

Segundo a companhia, o 135M foi treinado do zero com 670 bilhões de tokens de dados. Esse processo levou cerca de seis dias utilizando quatro aceleradores de IA Instinct MI250, e a AMD ainda refinou o modelo com 20 bilhões de tokens focados em codificação.

Mudança de postura

Vale reiterar que a primeira SLM da AMD possui variantes: a AMD-Llama-135M e a AMD-Llama-135M-Code. Como o nome sugere, esses modelos de linguagem são baseados na família Llama e foram criados para atender as necessidades dos clientes da companhia que precisavam de novos modelos pré-treinados.

O lançamento do modelo também mostra a mudança completa de postura da AMD. Recentemente, a companhia liderada por Lisa Su confirmou que centrará seus esforços no desenvolvimento de soluções para inteligência artificial, e dará menos foco para as placas de vídeo gamer.

Isso não significa que o time vermelho acabará com a fabricação de GPUs, mas a tendência é que a AMD rivalize ainda mais com a Nvidia no que diz respeito a softwares e outras tecnologias.

Esse texto não reflete, necessariamente, a opinião do TIM NEWS, da TIM ou de suas afiliadas.