A queda de preço da Open Open muda tudo para codificadores de vibração



A queda de preço da Open Open muda tudo para codificadores de vibração

Em 10 de junho, o OpenAI reduziu o preço de tabela de seu principal modelo de raciocínio, O3, em aproximadamente 80%, de US $ 10 por milhão de tokens de entrada e tokens de produção de US $ 40 por milhão para US $ 2 e US $ 8, respectivamente. Os revendedores da API reagiram imediatamente: Cursor agora conta um pedido de O3 da mesma forma que uma chamada GPT-4O, e Windsurf Abaixou o nível “O3-Runiening” para um único crédito também. Para os usuários do cursor, esse é um corte de dez vezes durante a noite.

A latência melhorou em paralelo. O OpenAI não publicou novas métricas de latência; Os painéis de terceiros ainda veem tempo para o primeiro token (TTFT) na faixa de 15 a 20s para avisos longos. Graças a aglomerados NVIDIA GB200 frescos e um agendador renovado que encharques longos avisos de mais GPUs, a O3 se sente mais rápida em uso actual. O3 ainda é mais lento que os modelos leves, mas não é mais lento.

Claude 4 é rápido, mas desleixado

Grande parte do oxigênio da comunidade foi para Claude 4. É inegavelmente rápido e sua janela de contexto de 200 mil é luxuosa. No entanto, na codificação do dia-a-dia, eu, juntamente com muitos pôsteres do Reddit e Discord, continuo tropeçando no viés de ação de Claude: inventa felizmente as funções manchadas em vez de implementações reais, testes de unidade falsificados ou reescrever zombares que foram instruídas a deixar em paz. A velocidade é ótima; O acompanhamento geralmente não é.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *