A DeepSeek V4 marca um novo capítulo na corrida global à inteligência artificial. A empresa chinesa prepara-se para lançar o seu mais recente modelo de linguagem de grande dimensão na próxima semana, mais de um ano após o último grande lançamento.
Segundo o Financial Times, o laboratório sediado em Hangzhou vai apresentar o V4 como um modelo “multimodal”. Ou seja, terá capacidade para gerar texto, imagem e vídeo.
DeepSeek V4 reforça estratégia chinesa
De acordo com o FT, a DeepSeek trabalhou com a Huawei e a Cambricon para optimizar o V4 para os seus chips mais recentes. Assim, a empresa procura reduzir a dependência da Nvidia, cujos chips estão sujeitos a restrições de exportação impostas por Washington.
Além disso, a Reuters avançou que a DeepSeek não colaborou com a Nvidia na optimização deste novo modelo. Ainda assim, a Nvidia continua a dominar o mercado de chips para treino intensivo, sobretudo na fase de pré-treino.
Veja também: Congressistas americanos avançam com proibição da DeepSeek
Lançamento antes das “Duas Sessões”
O lançamento da DeepSeek V4 surge antes das reuniões parlamentares anuais conhecidas como “Duas Sessões”, que começam a 4 de Março. Esse calendário pode reforçar o estatuto da empresa como campeã nacional de IA.
Este será o primeiro grande lançamento desde Janeiro de 2025, quando a DeepSeek apresentou o modelo de raciocínio R1. Na altura, a empresa afirmou ter criado um sistema comparável aos líderes de Silicon Valley usando apenas uma fracção do poder computacional. Alguns analistas classificaram o momento como um “Sputnik” da IA chinesa.
Pressão sobre rivais globais
Desde o R1, a DeepSeek tem feito actualizações incrementais. Entretanto, rivais domésticos como a Alibaba e a Moonshot AI aproveitaram para ganhar espaço no segmento de modelos chineses de código aberto e baixo custo.
Espera-se que a optimização do V4 para chips chineses acelere a transição na fase de inferência, ou seja, na geração de respostas a partir de modelos já treinados. Contudo, o FT revelou que tentativas anteriores de treino em hardware da Huawei enfrentaram dificuldades técnicas.
No início da semana, a Anthropic acusou a DeepSeek e outros laboratórios chineses de “ataques de destilação”. A prática consiste em treinar modelos menores com base nas respostas de sistemas mais avançados.
Até ao momento, Huawei, DeepSeek e Cambricon não responderam aos pedidos de comentário.

