IBM e NASA criam modelo fundacional de IA geoespacial em código aberto

O modelo fundacional geoespacial watsonx, desenvolvido a partir de dados de satélites da NASA, será agora disponível em código aberto no Hugging Face.

O acesso aos dados sempre atualizados continua a ser um desafio significativo na ciência climática, onde as condições ambientais mudam quase diariamente.

Com as crescentes quantidades de informações,  segundo a NASA , estima-se que até 2024 os cientistas terão 250 mil terabytes de dados de sobre novas missões – e junto de pesquisadores, ainda enfrentam obstáculos na análise desses grandes conjunto de dados.

Como parte de um Acordo de Lei do Espaço com a NASA, a IBM estabeleceu no início deste ano a construção de um modelo fundacional de IA para dados geoespaciais.

É por isso que a IBM e a plataforma de IA de código aberto, Hugging Face, anunciaram que o modelo fundacional geoespacial watsonx da IBM, desenvolvido a partir de dados de satélites da NASA, será agora  disponível em código aberto no Hugging Face.

Será o maior modelo fundacional geoespacial no Hugging Face e o primeiro modelo fundacional de IA de código aberto construído em colaboração com a NASA, diz a Big Blue.

Esse esforço “será um avanço para a democratização do acesso e aplicação da IA para gerar novas possibilidades com o monitoramento do clima e na ciência da Terra”.

O modelo, treinado em conjunto por  IBM e NASA  ao longo de um ano com dados do satélite Harmonized Landsat Sentinel-2 (HLS)  em todo o território continental dos Estados Unidos, e aperfeiçoado com dados mapeados de enchentes e áreas de incêndios ambientais, demonstrou até hoje “uma melhora de 15% sobre as técnicas de última geração, usando a metade dos dados mapeados”.

Com ajustes adicionais aperfeiçoados, o modelo base pode ser utilizado para tarefas como acompanhar o desmatamento, prever a produtividade das lavouras ou detectar e monitorar gases de efeito estufa.

Pesquisadores da IBM e da NASA também estão trabalhando com a Clark University para adaptar o modelo para aplicações como segmentação de séries temporais e pesquisa por similaridade.