Google prepara IA capaz de entender sua vida pelo Google Fotos
Tecmundo
O Google prepara uma inteligência artificial (IA) capaz de entender o contexto de registros salvos no Google Fotos, reportou o jornal CNBC. Batizado como "Project Ellman", o modelo seria capaz de compreender o conteúdo de uma imagem com base nos rostos e nas pessoas contidas nas capturas.
O modelo seria capaz de puxar o contexto usando biografias, registros mais antigos ou mais novos, para entender o que se passa em cada uma das fotos e descrever o cenário.
A nova IA do Google seria capaz de compreender o contexto de várias fotos em conjunto e traçar uma linha do tempo dos acontecimentos.
Na prática, o Project Ellman poderia dizer quando uma foto é uma reunião de antigos colegas de faculdade, um encontro romântico, a idade dos envolvidos e deduzir as histórias por trás de uma captura. Até mesmo prints da tela poderiam ser avaliados pela IA, que tentaria entender o motivo por trás do registro.
Segundo a fonte do CNBC, o Google teria entendido que modelos multimodais são ideais para esse tipo de ferramenta. A empresa apresentaria a novidade como um chatbot que sabe tudo sobre sua vida, como um verdadeiro assistente virtual pessoal.
Em um dos slides apresentados, o chatbot conseguiu identificar as preferências alimentares, viagens marcadas e interesses do usuário com base nas mídias salvas no celular. O chatbot poderia identificar até sites, aplicativos e redes sociais favoritas por meio de prints.
Por enquanto, o Project Ellman estaria passando por testes internos pelo time do Google Fotos.
"O Google Fotos sempre usou IA para ajudar as pessoas a pesquisar suas fotos e vídeos, e estamos entusiasmados com o potencial dos LLMs para desbloquear experiências ainda mais úteis. Esta foi uma exploração interna inicial e, como sempre, se decidirmos lançar novos recursos, dedicaremos o tempo necessário para garantir que sejam úteis para as pessoas e projetados para proteger a privacidade e a segurança dos usuários como nossa principal prioridade", disse um porta-voz ao site.
Considerando que o Google adota um ritmo mais lento para o lançamento de ferramentas com IA, é possível que o desenvolvimento do "Project Ellman" ainda demore para ser concluído. De qualquer forma, a revelação mostra um potencial interessantíssimo para modelos multimodais.