Anthropic anunciou na última segunda-feira Claude 3.7 Sonnet, que apresenta como seu "modelo mais inteligente até hoje e o primeiro modelo de raciocínio híbrido no mercado", assim como Claude Code, uma ferramenta de codificação agentica que permite aos desenvolvedores automatizar tarefas complexas diretamente do seu terminal. 

Claude 3.7 Sonnet: melhorias significativas na codificação e desenvolvimento web front-end

Anthropic adota uma abordagem unificada do raciocínio ao combinar velocidade e profundidade de análise. Ao contrário de outros modelos que desenvolvem soluções distintas para o raciocínio instantâneo e reflexão profunda, Claude 3.7 Sonnet integra essas duas capacidades em um único sistema.

O modelo oferece dois modos de funcionamento:

  • Padrão, que melhora o desempenho do Claude 3.5 Sonnet com respostas mais precisas e naturais.

  • Reflexão estendida, etapa por etapa, visível pelo usuário onde a IA leva tempo para analisar um problema antes de formular uma resposta, melhorando assim seu desempenho em matemática, codificação e seguimento de instruções complexas.

 

Uma das inovações chave do Claude 3.7 Sonnet é a possibilidade, para os usuários da API da Anthropic, de definir um orçamento de reflexão em número de tokens. Este controle granular permite encontrar um equilíbrio entre a qualidade das respostas e os custos operacionais.

 

Um posicionamento estratégico entre performance e segurança

Anthropic destaca a segurança e a confiabilidade de seus modelos. Testes aprofundados e colaborações com especialistas externos foram realizados para garantir que o modelo distingue efetivamente pedidos nocivos e benignos, reduzindo assim em 45% as recusas injustificadas em relação ao seu predecessor. A empresa publicou um cartão de sistema detalhado de seus métodos de avaliação, cobrindo principalmente os riscos de ataques por injeção rápida e as estratégias implementadas para resistir a eles.

Claude Code: em direção à automação avançada do desenvolvimento de software

Com Claude Code, Anthropic ambiciona transformar as práticas de desenvolvimento, oferecendo um assistente IA capaz de pesquisar e modificar código, executar testes e até mesmo enviar modificações no GitHub.

Os primeiros testes mostram uma redução significativa do tempo necessário para a realização de certas tarefas, às vezes em mais de 45 minutos. Esta melhoria pode mudar profundamente o cotidiano dos desenvolvedores, especialmente em áreas como depuração, refatoração em grande escala e desenvolvimento orientado a testes.

Disponibilidade 

Claude 3.7 Sonnet está disponível em todos os planos Claude, incluindo Free, Pro, Team e Enterprise, assim como via API Anthropic, Amazon Bedrock e Vertex AI do Google Cloud. No entanto, o modo de reflexão estendida é reservado para os usuários dos planos pagos. As tarifas permanecem idênticas às das versões anteriores: 3 $ por milhão de tokens de entrada e 15 $ por milhão de tokens de saída, incluindo os tokens usados para a reflexão.

Por outro lado, Claude Code está atualmente disponível como uma prévia de pesquisa limitada. Dependendo do feedback recebido, Anthropic melhorará "a confiabilidade das chamadas de ferramentas, adição de suporte para comandos de longa duração, melhoria da renderização no aplicativo e ampliação da compreensão de Claude de suas capacidades."