AMD lança pequeno modelo de linguagem focado em otimizar tarefas via IA
Tecmundo
Por muito tempo focada no mercado de hardware, a AMD vem mudando seus rumos e anunciou seu primeiro pequeno modelo de linguagem (SLM). Chamado de AMD-135M, a tecnologia foi criada para o corpo empresarial com o intuito de otimizar tarefas específicas.
Para realizar a otimização de tarefas, o AMD-135M utiliza uma técnica chamada de decodificação especulativa. Essa técnica realiza palpites sobre solicitações de tokens futuros enquanto gera os tokens atuais na linha de processamento, tornando todo o processo mais lógico.
Segundo a companhia, o 135M foi treinado do zero com 670 bilhões de tokens de dados. Esse processo levou cerca de seis dias utilizando quatro aceleradores de IA Instinct MI250, e a AMD ainda refinou o modelo com 20 bilhões de tokens focados em codificação.
Mudança de postura
Vale reiterar que a primeira SLM da AMD possui variantes: a AMD-Llama-135M e a AMD-Llama-135M-Code. Como o nome sugere, esses modelos de linguagem são baseados na família Llama e foram criados para atender as necessidades dos clientes da companhia que precisavam de novos modelos pré-treinados.
O lançamento do modelo também mostra a mudança completa de postura da AMD. Recentemente, a companhia liderada por Lisa Su confirmou que centrará seus esforços no desenvolvimento de soluções para inteligência artificial, e dará menos foco para as placas de vídeo gamer.
Isso não significa que o time vermelho acabará com a fabricação de GPUs, mas a tendência é que a AMD rivalize ainda mais com a Nvidia no que diz respeito a softwares e outras tecnologias.