DeepSeek lança V4 e desafia gigantes dos EUA

A DeepSeek V4 marca um novo capítulo na corrida global à inteligência artificial. A empresa chinesa prepara-se para lançar o seu mais recente modelo de linguagem de grande dimensão na próxima semana, mais de um ano após o último grande lançamento.

Segundo o Financial Times, o laboratório sediado em Hangzhou vai apresentar o V4 como um modelo “multimodal”. Ou seja, terá capacidade para gerar texto, imagem e vídeo.

DeepSeek V4 reforça estratégia chinesa

De acordo com o FT, a DeepSeek trabalhou com a Huawei e a Cambricon para optimizar o V4 para os seus chips mais recentes. Assim, a empresa procura reduzir a dependência da Nvidia, cujos chips estão sujeitos a restrições de exportação impostas por Washington.

Além disso, a Reuters avançou que a DeepSeek não colaborou com a Nvidia na optimização deste novo modelo. Ainda assim, a Nvidia continua a dominar o mercado de chips para treino intensivo, sobretudo na fase de pré-treino.

Veja também: Congressistas americanos avançam com proibição da DeepSeek

Lançamento antes das “Duas Sessões”

O lançamento da DeepSeek V4 surge antes das reuniões parlamentares anuais conhecidas como “Duas Sessões”, que começam a 4 de Março. Esse calendário pode reforçar o estatuto da empresa como campeã nacional de IA.

Este será o primeiro grande lançamento desde Janeiro de 2025, quando a DeepSeek apresentou o modelo de raciocínio R1. Na altura, a empresa afirmou ter criado um sistema comparável aos líderes de Silicon Valley usando apenas uma fracção do poder computacional. Alguns analistas classificaram o momento como um “Sputnik” da IA chinesa.

Pressão sobre rivais globais

Desde o R1, a DeepSeek tem feito actualizações incrementais. Entretanto, rivais domésticos como a Alibaba e a Moonshot AI aproveitaram para ganhar espaço no segmento de modelos chineses de código aberto e baixo custo.

Espera-se que a optimização do V4 para chips chineses acelere a transição na fase de inferência, ou seja, na geração de respostas a partir de modelos já treinados. Contudo, o FT revelou que tentativas anteriores de treino em hardware da Huawei enfrentaram dificuldades técnicas.

No início da semana, a Anthropic acusou a DeepSeek e outros laboratórios chineses de “ataques de destilação”. A prática consiste em treinar modelos menores com base nas respostas de sistemas mais avançados.

Até ao momento, Huawei, DeepSeek e Cambricon não responderam aos pedidos de comentário.

Últimas publicações

DeepSeek lança V4 e desafia gigantes dos EUA

Apple lança iPhone 17e: mais desempenho, mesmo preço base

OpenAI revê acordo com Pentágono após polémica

DeepSeek lança V4 e desafia gigantes dos EUA

Apple lança iPhone 17e: mais desempenho, mesmo preço base

OpenAI revê acordo com Pentágono após polémica

IA e despedimentos: novo risco laboral nas big tech

ETF drenam 3 mil milhões do Bitcoin em 3 meses

OpenAI bloqueia uso político indevido da IA

Inteligência Artificial

Pagamentos digitais: evolução e impacto

Yann LeCun: Modelos atuais não alcançarão Inteligência Artificial Geral

Criptomoedas: Origem e Impacto Global

Fintechs: Revolução no Sistema Financeiro

DeepSeek lança V4 e desafia gigantes dos EUA

IA e despedimentos: novo risco laboral nas big tech

OpenAI bloqueia uso político indevido da IA

Apple Pay prepara entrada na Índia em 2026

IA impulsiona margens do Nubank no Brasil

CEO da Coinbase acusa Reino Unido de travar cripto

Revolut testa stablecoin em libras na sandbox da FCA

Últimas publicações

DeepSeek lança V4 e desafia gigantes dos EUA

DeepSeek V4 reforça estratégia chinesa

Lançamento antes das “Duas Sessões”

Pressão sobre rivais globais

NEWSLETTER