A DeepSeek, empresa chinesa de inteligência artificial, planeja lançar um novo modelo, o DeepSeek V4, em fevereiro, conforme relatado pelo site The Information. O lançamento, ainda sem data definida, pode ocorrer em 17 de fevereiro, coincidindo com o Ano Novo Chinês.
Novo Modelo e Expectativas
O DeepSeek V4 surge como a tentativa mais ambiciosa da startup, com foco em capacidades avançadas de codificação. Testes internos indicam que o novo modelo pode superar concorrentes como a série GPT, da OpenAI, e o Claude, da Anthropic, principalmente em atividades ligadas à programação.
Foco em Eficiência e Tecnologia mHC
A DeepSeek está investindo em um novo método para o treinamento de LLMs, chamado de “Manifold-Constrained Hyper-Connections” (mHC). A técnica, descrita em um white paper recente, promete tornar os modelos mais escaláveis e eficientes, reduzindo o consumo de energia e a demanda computacional. A expectativa é que o V4 incorpore o mHC.
Contexto de Mercado e Estratégia
Em janeiro de 2025, a DeepSeek provocou uma queda nas ações de gigantes da tecnologia. O modelo R1 chamou atenção ao ser treinado por aproximadamente US$ 294 mil, um valor menor que o de rivais americanos. A empresa busca repetir o sucesso anterior por meio da eficiência de custos e da nova tecnologia mHC.
Quer receber mais notícias? Acesse nosso canal no WhatsApp.
Entrar no canal do WhatsApp