Os cientistas ambientais estão cada vez mais usando enormes modelos de inteligência synthetic para fazer previsões sobre mudanças no clima e no clima, mas um novo estudo de pesquisadores do MIT mostra que os modelos maiores nem sempre são melhores.
A equipe demonstra que, em certos cenários climáticos, modelos baseados em física muito mais simples podem gerar previsões mais precisas do que os modelos de aprendizado profundo de ponta.
Sua análise também revela que uma técnica de benchmarking comumente usada para avaliar técnicas de aprendizado de máquina para previsões climáticas pode ser distorcida por variações naturais nos dados, como flutuações nos padrões climáticos. Isso pode levar alguém a acreditar que um modelo de aprendizado profundo faz previsões mais precisas quando esse não é o caso.
Os pesquisadores desenvolveram uma maneira mais robusta de avaliar essas técnicas, que mostram que, embora modelos simples sejam mais precisos ao estimar as temperaturas regionais da superfície, as abordagens de aprendizado profundo podem ser a melhor escolha para estimar as chuvas locais.
Eles usaram esses resultados para aprimorar uma ferramenta de simulação conhecida como um Emulador climáticoque pode simular rapidamente o efeito das atividades humanas em um clima futuro.
Os pesquisadores veem seu trabalho como um “conto de advertência” sobre o risco de implantar grandes modelos de IA para ciência climática. Embora os modelos de aprendizado profundo tenham demonstrado sucesso incrível em domínios como a linguagem pure, a ciência climática contém um conjunto comprovado de leis e aproximações físicas, e o desafio se torna como incorporar esses modelos de IA.
“We are attempting to develop fashions which can be going to be helpful and related for the sorts of issues that decision-makers want going ahead when making local weather coverage selections. Whereas it is perhaps engaging to make use of the most recent, big-picture machine-learning mannequin on a local weather drawback, what this research exhibits is that stepping again and actually interested by the issue fundamentals is necessary and helpful,” says research senior writer Noelle Selin, a professor within the MIT Institute for Knowledge, Programs, and Society (IDSS) and O Departamento da Terra, Ciências Atmosféricas e Planetárias (EAPs) e Diretor do Centro de Ciência e Estratégia de Sustentabilidade.
Os co-autores de Selin são o principal autor Björn Lütjens, um ex-pós-doutorado da EAPS que agora é cientista de pesquisa da IBM Analysis; Autor sênior Raffaele Ferrari, professor de Oceanografia Cecil e Ida Inexperienced em EAPs e co-diretor do Lorenz Heart; e Duncan Watson-Parris, professor assistente da Universidade da Califórnia em San Diego. Selin e Ferrari também são investigadores co-princípios do Trazendo computação ao desafio climático Projeto, do qual surgiu esta pesquisa. O papel aparece hoje no Journal of Advances in Modelaing Earth Programs.
Comparando emuladores
Como o clima da Terra é tão complexo, a execução de um modelo climático de ponta para prever como os níveis de poluição afetarão fatores ambientais como a temperatura pode levar semanas aos supercomputadores mais poderosos do mundo.
Os cientistas costumam criar emuladores climáticos, aproximações mais simples de um modelo de clima de última geração, que é mais rápido e mais acessível. Uma formadora de políticas poderia usar um emulador climático para ver como as suposições alternativas nas emissões de gases de efeito estufa afetariam as temperaturas futuras, ajudando -as a desenvolver regulamentos.
Mas um emulador não é muito útil se fizer previsões imprecisas sobre os impactos locais das mudanças climáticas. Embora o aprendizado profundo tenha se twister cada vez mais well-liked para a emulação, poucos estudos exploraram se esses modelos têm um desempenho melhor do que as abordagens testadas e comprovadas.
Os pesquisadores do MIT realizaram esse estudo. Eles compararam uma técnica tradicional chamada escala de padrão linear (LPS) com um modelo de aprendizado profundo usando um conjunto de dados de referência comum para avaliar os emuladores climáticos.
Seus resultados mostraram que os LPs superaram os modelos de aprendizado profundo na previsão de quase todos os parâmetros que testaram, incluindo temperatura e precipitação.
“Os grandes métodos de IA são muito atraentes para os cientistas, mas raramente resolvem um problema completamente novo, portanto, é necessário implementar uma solução existente primeiro para descobrir se a complexa abordagem de aprendizado de máquina realmente melhora”, diz Lütjens.
Alguns resultados iniciais pareciam voar diante do conhecimento do domínio dos pesquisadores. O poderoso modelo de aprendizado profundo deveria ter sido mais preciso ao fazer previsões sobre precipitação, pois esses dados não seguem um padrão linear.
Eles descobriram que a alta quantidade de variabilidade pure nas execuções do modelo climático pode fazer com que o modelo de aprendizado profundo tenha um desempenho ruim em oscilações imprevisíveis de longo prazo, como El Niño/La Niña. Isso distorce as pontuações de benchmarking a favor do LPS, o que calcula a média dessas oscilações.
Construindo uma nova avaliação
A partir daí, os pesquisadores construíram uma nova avaliação com mais dados que abordam a variabilidade climática pure. Com essa nova avaliação, o modelo de aprendizado profundo teve um desempenho um pouco melhor que o LPS para precipitação native, mas o LPS ainda period mais preciso para as previsões de temperatura.
“É importante usar a ferramenta de modelagem certa para o problema, mas para fazer isso, você também precisa configurar o problema da maneira certa em primeiro lugar”, diz Selin.
Com base nesses resultados, os pesquisadores incorporaram LPs em uma plataforma de emulação climática para prever mudanças de temperatura native em diferentes cenários de emissão.
“Não estamos defendendo que o LPS sempre deve ser o objetivo. Ele ainda tem limitações. Por exemplo, o LPS não prevê variabilidade ou eventos climáticos extremos”, acrescenta Ferrari.
Em vez disso, eles esperam que seus resultados enfatizem a necessidade de desenvolver melhores técnicas de benchmarking, o que poderia fornecer uma imagem mais completa da qual a técnica de emulação climática é mais adequada para uma situação específica.
“Com uma referência aprimorada de emulação climática, poderíamos usar métodos de aprendizado de máquina mais complexos para explorar problemas que atualmente são muito difíceis de abordar, como os impactos dos aerossóis ou estimativas de precipitação extrema”, diz Lütjens.
Por fim, técnicas de benchmarking mais precisas ajudarão a garantir que os formuladores de políticas estejam tomando decisões com base nas melhores informações disponíveis.
Os pesquisadores esperam que outros desenvolvam sua análise, talvez estudando melhorias adicionais nos métodos e referências de emulação climática. Essa pesquisa pode explorar métricas orientadas para o impacto, como indicadores de seca e riscos de incêndios florestais, ou novas variáveis como a velocidade regional do vento.
Esta pesquisa é financiada, em parte, pela Schmidt Sciences, LLC, e faz parte da equipe do MIT Local weather Grand Challenges por “trazer computação ao desafio climático”.