DeepSeek lança IA V4 Pro e Flash: Desafio direto a OpenAI e Anthropic?

DeepSeek lança IA de ponta! Conheça V4 Flash e V4 Pro, modelos open source que desafiam OpenAI e Anthropic. Saiba mais!

24/04/2026 11:40

4 min de leitura

(Imagem de reprodução da internet).

DeepSeek Lança Nova Geração de IA e Desafia Gigantes Globais

Um ano após causar impacto no Vale do Silício com sua tecnologia, a chinesa DeepSeek lançou versões de prévia de seu novo modelo de inteligência artificial, apontado como seu principal produto. A empresa o posiciona como “a plataforma open source mais potente do mercado”, enviando uma mensagem clara aos concorrentes como OpenAI e Anthropic.

Apresentação das Séries V4 Flash e V4 Pro

A startup revelou as séries V4 Flash e V4 Pro, afirmando que esses modelos apresentam desempenho de ponta em testes de programação. Além disso, trouxeram avanços significativos em raciocínio e na execução de tarefas por agentes autônomos.

Segundo a DeepSeek, as melhorias incluem mudanças na arquitetura e otimizações, detalhadas em uma publicação no Hugging Face. Um destaque é a técnica chamada Hybrid Attention Architecture, que, segundo a companhia, aprimora a memória do modelo em conversas longas.

Capacidade de Contexto Ampliada

A janela de contexto foi expandida para impressionantes 1 milhão de tokens. Isso possibilita que os usuários insiram bases de código inteiras ou documentos extremamente extensos em um único comando.

Contexto Competitivo e Mercado Chinês

O lançamento do V4 ocorre mais de um ano depois de a DeepSeek, sediada em Hangzhou, disparar a venda de ações, apagando mais de US$ 1 trilhão em valor de mercado com o lançamento do R1. Este modelo aberto simulava o raciocínio humano e rivalizava com sistemas de ponta de empresas como a OpenAI, mas com um custo muito menor que os concorrentes americanos.

Leia também:

Nesta sexta-feira, as ações de fabricantes locais de chips na bolsa chinesa subiram, pois investidores apostam que o novo modelo sustentará a demanda por semicondutores produzidos no país. A DeepSeek reconheceu, em uma postagem no WeChat, que a capacidade de serviço da linha V4 Pro ainda é “extremamente limitada” devido à infraestrutura computacional.

Perspectivas de Infraestrutura e Custos

A expectativa da empresa é que o custo de uso dos modelos caia consideravelmente após a operação de clusters equipados com chips Ascend 950, da Huawei Technologies Co., previstos para o segundo semestre. A DeepSeek também está negociando com Tencent e Alibaba sua primeira rodada de captação com investidores externos.

Eficiência e Confronto de Custos com Rivais Internacionais

A nova família de modelos representa um salto em escala e eficiência, aumentando a pressão competitiva sobre os rivais. O sistema de 1 trilhão de parâmetros da DeepSeek utiliza a técnica Mixture-of-Experts (mistura de especialistas), ativando apenas uma parte dos “experts” por tarefa, no máximo 37 bilhões de parâmetros por requisição.

Isso mantém o custo de inferência bem abaixo de outros modelos de ponta com escala similar. A DeepSeek-V4 Pro custa uma fração do que cobram os principais laboratórios dos EUA. Os tokens de entrada custam US$ 1,74 por milhão, e os de saída, US$ 3,48 por milhão, comparado ao Claude Sonnet 4 da Anthropic, que cobra US$ 3 por milhão de entrada e US$ 15 por milhão de saída.

Desempenho e Estratégia de Mercado

A combinação de arquitetura e técnicas coloca a DeepSeek em confronto direto com os modelos mais recentes de OpenAI, Google e Anthropic. A startup afirmou superar sistemas como o GPT-5.2 da OpenAI em benchmarks, mas admitiu que o V4 ainda está um pouco atrás dos modelos mais avançados do mercado.

Apesar disso, a empresa foca na redução de custos, desenhando o V4 para rodar em infraestrutura mais acessível. Analistas apontam que a diferença de desempenho entre modelos pode se tornar imperceptível para a maioria dos usuários, favorecendo quem foca em custo-benefício.

Escândalos e Suspeitas de Treinamento

O avanço da DeepSeek no ano passado desencadeou uma corrida por IA na China, com grandes empresas lançando serviços acessíveis. Contudo, o sucesso veio acompanhado de escrutínio. Líderes de tecnologia e autoridades dos EUA acusam a DeepSeek de usar técnicas e hardwares restritos para treinar seus sistemas.

OpenAI e Anthropic já alegaram que a DeepSeek utilizou “destilação”, processo que usa a saída de outros modelos para treinar um sistema similar. Há também suspeitas de que a DeepSeek tenha usado processadores Blackwell da Nvidia, que estão vetados para o mercado chinês, em um data center na Mongólia Interior.

Autor(a):

Responsável pela produção, revisão e publicação de matérias jornalísticas no portal, com foco em qualidade editorial, veracidade das informações e atualizações em tempo real.