IBM anuncia disponibilidade do modelo da Mistral AI de código aberto no watsonx

Acrescenta-se ao crescente catálogo da IBM, modelos de terceiros e de código aberto para dar aos clientes escolha e flexibilidade.

A IBM anuncia a disponibilidade do LLM Mixtral-8x7B de código aberto, desenvolvido pela Mistral AI, em sua plataforma de dados e IA watsonx, à medida que continua a expandir os recursos para ajudar os clientes a inovar com os próprios modelos de base da IBM e aqueles de uma variedade de provedores de código aberto.

A IBM oferece uma versão otimizada do Mixtral-8x7b que, em testes internos, “foi capaz de aumentar a taxa de transferência em 50% quando comparado ao modelo normal, ou seja, aumentou a quantidade de dados que podem ser processados em um determinado período”.

Isso poderia potencialmente reduzir a latência em 35-75%, dependendo do tamanho do lote – acelerando o tempo para insights.

Isso é possível por meio de um processo chamado quantização, que reduz o tamanho do modelo e os requisitos de memória para LLMs e, por sua vez, pode acelerar o processamento para ajudar a reduzir os custos e o consumo de energia.

A adição do Mixtral-8x7B expande a estratégia aberta e multimodelo da IBM para atender aos clientes onde eles estão “e dar-lhes escolha e flexibilidade para escalar soluções de IA corporativa em seus negócios”.

Ao longo de décadas de pesquisa e desenvolvimento de IA, colaboração aberta com a Meta e a Hugging Face e parcerias com líderes de modelos, a IBM está expandindo seu catálogo de modelos watsonx܂ai e trazendo novos recursos, linguagens e modalidades.

As escolhas de modelo básico pronto para empresas da IBM e sua plataforma de IA e dados watsonx pode capacitar clientes a usar IA generativa para obter novos insights e eficiência, e criar novos modelos de negócios baseados em princípios de confiança.