Notícias | 19 de julho de 2024 | Fonte: CQCS l Itana Oliveira

H2O.ai lança novo modelo de linguagem eficiente

A H2O.ai, empresa global de Inteligência Artificial (IA) e Machine Learning automatizado (AutoML) que oferece soluções únicas para o mercado de seguros, acaba de anunciar o lançamento de seu mais recente modelo de linguagem de peso reduzido, o H2O-Danube3, sob a licença Apache v2.0. Este avanço é um marco significativo no campo do processamento de linguagem natural (NLP), especialmente em um momento em que modelos menores estão ganhando destaque por sua eficiência em hardware de consumo e dispositivos de borda.

Com o crescimento das aplicações offline e a necessidade de modelos de linguagem acessíveis, a H2O.ai apresenta o H2O-Danube3 como uma solução inovadora. Os novos modelos, H2O-Danube3-4B e H2O-Danube3-500M, são projetados para oferecer desempenho robusto enquanto exigem menos recursos computacionais do que modelos tradicionais, como BERT e GPT-3, que demandam alta capacidade de processamento e memória.

O H2O-Danube3-4B, com aproximadamente 3,96 bilhões de parâmetros, e o H2O-Danube3-500M, com 500 milhões de parâmetros, foram treinados em grandes conjuntos de dados, com 6 trilhões e 4 trilhões de tokens, respectivamente. Ambos os modelos são ajustados para diversas aplicações, como classificação de sequências, resposta a perguntas e outras tarefas especializadas, oferecendo uma alternativa viável para dispositivos com capacidade limitada.

Os modelos utilizam uma arquitetura somente de decodificador inspirada no modelo Llama, com um processo de treinamento dividido em três estágios. Este método melhora a qualidade dos modelos ao aumentar a proporção de dados de alta qualidade, incluindo textos acadêmicos e instrucionais, enquanto reduz a quantidade de dados da web ao longo dos estágios de treinamento.

O desempenho do H2O-Danube3 é notável em várias métricas. O H2O-Danube3-4B obteve uma precisão de 50,14% no benchmark GSM8K, que testa o raciocínio matemático, e mais de 80% no benchmark hellaswag com 10 exemplos, próximo ao desempenho de modelos muito maiores. O H2O-Danube3-500M também se destaca, alcançando a maior pontuação em oito de doze benchmarks acadêmicos comparados a modelos de tamanho semelhante.

Esses resultados demonstram que os modelos H2O-Danube3 não apenas atendem à demanda por eficiência e desempenho, mas também abrem novas possibilidades para aplicações em dispositivos móveis, chatbots e outros usos que requerem processamento de linguagem natural avançado em hardware limitado. A H2O.ai, com esta inovação, reafirma a importância de equilibrar eficiência e desempenho no desenvolvimento de modelos de linguagem.

O lançamento do H2O-Danube3 marca um passo importante para a democratização das tecnologias de NLP, permitindo que um público mais amplo aproveite as capacidades avançadas dessas ferramentas, mesmo em dispositivos com restrições de recursos.

FAÇA UM COMENTÁRIO

Esta é uma área exclusiva para membros da comunidade

Faça login para interagir ou crie agora sua conta e faça parte.

FAÇA PARTE AGORA FAZER LOGIN