Weblog Posit AI: tocha 0.10.0

setembro 8, 2024

Estamos felizes em anunciar que o torch v0.10.0 agora está no CRAN. Nesta postagem do weblog, destacamos algumas das mudanças que foram introduzidas nesta versão. Você pode verificar o changelog completo aqui.

Precisão mista automática

Precisão Mista Automática (AMP) é uma técnica que permite um treinamento mais rápido de modelos de aprendizado profundo, mantendo a precisão do modelo usando uma combinação de formatos de ponto flutuante de precisão simples (FP32) e meia precisão (FP16).

Para usar a precisão mista automática com tocha, você precisará usar o with_autocast
alternador de contexto para permitir que o torch use diferentes implementações de operações que podem ser executadas com meia precisão. Em geral, também é recomendado dimensionar a função de perda para preservar pequenos gradientes, à medida que eles se aproximam de zero na meia precisão.

Aqui está um exemplo mínimo, omitindo o processo de geração de dados. Você pode encontrar mais informações no artigo amp.

...
loss_fn <- nn_mse_loss()$cuda()
web <- make_model(in_size, out_size, num_layers)
decide <- optim_sgd(web$parameters, lr=0.1)
scaler <- cuda_amp_grad_scaler()

for (epoch in seq_len(epochs)) {
  for (i in seq_along(information)) {
    with_autocast(device_type = "cuda", {
      output <- web(information((i)))
      loss <- loss_fn(output, targets((i)))  
    })
    
    scaler$scale(loss)$backward()
    scaler$step(decide)
    scaler$replace()
    decide$zero_grad()
  }
}

Neste exemplo, usar precisão mista levou a uma aceleração de cerca de 40%. Essa aceleração é ainda maior se você estiver apenas executando inferência, ou seja, não precisa dimensionar a perda.

Binários pré-construídos

Com binários pré-construídos, instalar o torch fica muito mais fácil e rápido, especialmente se você estiver no Linux e usar as compilações habilitadas para CUDA. Os binários pré-construídos incluem LibLantern e LibTorch, ambas dependências externas necessárias para executar o torch. Além disso, se você instalar as compilações habilitadas para CUDA, as bibliotecas CUDA e cuDNN já estarão incluídas.

Para instalar os binários pré-compilados, você pode usar:

choices(timeout = 600) # rising timeout is advisable since we will probably be downloading a 2GB file.
variety <- "cu117" # "cpu", "cu117" are the one presently supported.
model <- "0.10.0"
choices(repos = c(
  torch = sprintf("https://storage.googleapis.com/torch-lantern-builds/packages/%s/%s/", variety, model),
  CRAN = "https://cloud.r-project.org" # or another from which you wish to set up the opposite R dependencies.
))
set up.packages("torch")

Weblog Posit AI: tocha 0.10.0 — Tocha de corrida colaborativa

emitir aberto por @egillaxpoderíamos encontrar e consertar um bug que fazia com que as funções do torch retornando uma lista de tensores fossem muito lentas. A função no caso period torch_split().

Esse problema foi corrigido na v0.10.0, e confiar nesse comportamento deve ser muito mais rápido agora. Aqui está um benchmark mínimo comparando a v0.9.1 com a v0.10.0:

bench::mark(
  torch::torch_split(1:100000, split_size = 10)
)

# A tibble: 1 × 13
  expression      min  median `itr/sec` mem_alloc `gc/sec` n_itr  n_gc total_time
                   
1 x             322ms   350ms      2.85     397MB     24.3     2    17      701ms
# ℹ 4 extra variables: end result , reminiscence , time , gc

# A tibble: 1 × 13
  expression      min  median `itr/sec` mem_alloc `gc/sec` n_itr  n_gc total_time
                   
1 x              12ms  12.8ms      65.7     120MB     8.96    22     3      335ms
# ℹ 4 extra variables: end result , reminiscence , time , gc

A partir de agora, a construção do LibLantern faz parte do fluxo de trabalho de construção de pacotes R e pode ser habilitada definindo o BUILD_LANTERN=1 variável de ambiente. Não é habilitado por padrão, porque a construção do Lantern requer cmake e outras ferramentas (especialmente se estiver construindo com suporte de GPU), e usar os binários pré-construídos é preferível nesses casos. Com essa variável de ambiente definida, os usuários podem executar devtools::load_all() para construir e testar a tocha localmente.

anunciado recentemente livro ‘Aprendizagem Profunda e Computação Científica com R torch‘.

Se você quiser começar a contribuir para o torch, sinta-se à vontade para entrar em contato no GitHub e ver nosso guia de contribuição.

O changelog completo para esta versão pode ser encontrado aqui.

Weblog Posit AI: tocha 0.10.0

Precisão mista automática

Binários pré-construídos

Deixe um comentário Cancelar resposta

Qual drone Micro FPV de 3 polegadas com DJI O4 devo comprar? Comparação de especificações e guia do comprador

Drone integrado Orkid 260VTOL – DRONELIFE

Propriedades antibacterianas e mecanismos subjacentes de MXenes Mo2TiC2Tx e Mo2Ti2C3Tx direcionados a Escherichia coli (bactéria Gram-negativa)

Um cristal anisotrópico van der Waals recorde? – Mundo da Física

Estágio Linear de Precisão com Resolução de Encoder de 1 nm

Testamos se um pó magnético especializado poderia remover microplásticos da água potável: a resposta é sim

Google investirá US$ 10 bilhões em Andhra Pradesh; TCS planeja US$ 6 a 7 bilhões para infraestrutura de IA

“Totalmente conectado” – BMW abre fábrica de carros com IA “mais inovadora” na Hungria

Anunciamos o Amazon Fast Suite: seu companheiro de equipe agente para responder perguntas e tomar medidas

Google se expande na Bélgica e enfrenta escrutínio antitruste de IA dos EUA

Google investirá US$ 10 bilhões em Andhra Pradesh; TCS planeja US$ 6 a 7 bilhões para infraestrutura de IA

Anunciamos o Amazon Fast Suite: seu companheiro de equipe agente para responder perguntas e tomar medidas