Close Menu
FintechAOFintechAO
  • HOME
  • NOTÍCIAS
  • ENTREVISTAS
  • ESPAÇO TECH
  • OPINIÃO
  • EDUTECH
  • ANÁLISES & REVIEWS
  • CONTATO
Últimas publicações

Klarna estreia stablecoin KlarnaUSD e reforça aposta cripto

26 de Novembro de 2025 NOTÍCIAS 2 Mins Read

Pagamentos cripto passam a operar no ecossistema Pix com KuCoin Pay

24 de Novembro de 2025 NOTÍCIAS 3 Mins Read

Investigação do ICIJ expõe redes de branqueamento envolvendo criptomoedas

18 de Novembro de 2025 NOTÍCIAS 2 Mins Read
Facebook X (Twitter) LinkedIn WhatsApp
  • HOME
  • NOTÍCIAS
  • ENTREVISTAS
  • ESPAÇO TECH
  • OPINIÃO
  • EDUTECH
  • ANÁLISES & REVIEWS
  • CONTATO
Facebook X (Twitter) LinkedIn WhatsApp
FintechAOFintechAO
Publicidade
FintechAOFintechAO
Home»NOTÍCIAS»OpenAI admite aumento de erros nos seus novos modelos

OpenAI admite aumento de erros nos seus novos modelos

Modelos o3 e o4-mini demonstram mais falhas factuais do que os seus antecessores, contrariando expectativas de melhoria na precisão da inteligência artificial.
22 de Abril de 20252 Mins Read NOTÍCIAS
openai
Foto de Growtika
Facebook Twitter LinkedIn Telegram WhatsApp Reddit Email Copy Link

A OpenAI, uma das líderes mundiais em inteligência artificial, revelou, segundo o TechCrunch, que os seus mais recentes modelos de raciocínio, o3 e o4-mini, apresentam taxas mais elevadas de alucinação do que modelos anteriores. A empresa admite que não sabe ao certo por que motivo isso acontece, embora acredite que o tipo de treino possa estar a influenciar os resultados.

Modelos alucinam mais do que os anteriores

Segundo testes internos da OpenAI, o modelo o3 apresentou 33% de respostas alucinadas em perguntas do benchmark PersonQA, focado no conhecimento sobre pessoas. Para comparação, os modelos anteriores o1 e o3-mini registaram 16% e 14,8%, respetivamente. Já o o4-mini teve um desempenho ainda pior: alucinou 48% das vezes.

Estes modelos são chamados de “raciocínio” por apresentarem melhorias em tarefas como programação e matemática. No entanto, o relatório técnico da OpenAI revela que, ao fazerem mais afirmações no geral, acabam por gerar tanto respostas mais precisas quanto mais incorretas.

Problema também identificado por terceiros

A organização sem fins lucrativos Transluce confirmou a tendência. Em testes, observou que o o3 chegou a inventar que executou código num MacBook Pro fora do ambiente ChatGPT. Na realidade, tal ação não é possível para o modelo.

Neil Chowdhury, investigador da Transluce e ex-funcionário da OpenAI, sugeriu que o tipo de aprendizagem por reforço adotado pode estar a agravar este problema.

Impacto na utilização prática

A crescente taxa de alucinação levanta preocupações, especialmente em setores onde a precisão é crítica, como o jurídico ou financeiro. Empresas podem hesitar em adotar modelos que geram erros factuais em contextos sensíveis.

Apesar disso, modelos como o o3 continuam a ser testados por startups como a Workera, que destaca a sua utilidade na programação. Contudo, também relatou problemas com links quebrados gerados pelo modelo.

Caminho para a melhoria pode passar pela pesquisa na web

Uma possível solução seria a integração de pesquisa na web. O modelo GPT-4o, com essa funcionalidade, atingiu 90% de precisão no benchmark SimpleQA. A OpenAI afirma estar a trabalhar constantemente para melhorar a fiabilidade e exatidão dos seus modelos.

Fonte: TechCrunch

Veja também:

  • Bolt lança SuperApp com cripto e pagamentos num clique
  • Restrição a chips H20 custa US$5,5 bi à Nvidia
  • OpenAI e Microsoft respondem a ações de direitos autorais em Nova York

Alucinações Big Tech GPT-4o inteligência artificial Modelos o3 o4-mini openai PersonQA Precisão em IA Raciocínio Computacional TechCrunch Transluce
Publicidade
Publicidade FinanceAds
  • Recentes
  • Mais lidas
  • Destaques

Klarna estreia stablecoin KlarnaUSD e reforça aposta cripto

26 de Novembro de 2025 NOTÍCIAS 2 Mins Read

Pagamentos cripto passam a operar no ecossistema Pix com KuCoin Pay

24 de Novembro de 2025 NOTÍCIAS 3 Mins Read

Investigação do ICIJ expõe redes de branqueamento envolvendo criptomoedas

18 de Novembro de 2025 NOTÍCIAS 2 Mins Read

Discovery Bank lança primeira App bancária com cripto na África do Sul

14 de Novembro de 2025 NOTÍCIAS 2 Mins Read

Reino Unido abranda restrições e reabre porta às Stablecoins

13 de Novembro de 2025 NOTÍCIAS 2 Mins Read

Bruxelas volta a investigar Google por regras do DMA

13 de Novembro de 2025 NOTÍCIAS 2 Mins Read

Inteligência Artificial

13 de Janeiro de 2025 EDUTECH 3 Mins Read

Pagamentos digitais: evolução e impacto

13 de Janeiro de 2025 EDUTECH 3 Mins Read

Yann LeCun: Modelos atuais não alcançarão Inteligência Artificial Geral

9 de Janeiro de 2025 NOTÍCIAS 4 Mins Read

Criptomoedas: Origem e Impacto Global

13 de Janeiro de 2025 EDUTECH 3 Mins Read

Fintechs: Revolução no Sistema Financeiro

13 de Janeiro de 2025 EDUTECH 3 Mins Read

Klarna estreia stablecoin KlarnaUSD e reforça aposta cripto

26 de Novembro de 2025 NOTÍCIAS 2 Mins Read

Investigação do ICIJ expõe redes de branqueamento envolvendo criptomoedas

18 de Novembro de 2025 NOTÍCIAS 2 Mins Read

Euro Digital pode ser lançado já em 2029, diz BCE

1 de Novembro de 2025 NOTÍCIAS 3 Mins Read

Coinbase desafia bancos: “Stablecoins não ameaçam depósitos”

31 de Outubro de 2025 NOTÍCIAS 2 Mins Read

Nova Lei pode travar negociações P2P de Bitcoin no Brasil

31 de Outubro de 2025 NOTÍCIAS 2 Mins Read

Blockchain do JPMorgan revoluciona fundos privados

31 de Outubro de 2025 NOTÍCIAS 2 Mins Read

Boom da IA leva Nvidia a recorde histórico de valor de mercado

30 de Outubro de 2025 NOTÍCIAS 2 Mins Read

Liga-te ao presente e futuro das Fintech recebendo diariamente os principais destaques e insights sobre o universo das Fintechs, Insurtechs, Regtechs, Paytechs, Startups, Inteligência Artificial, Cybersecurity, Digital Banking, Gadgets, Criptomoedas, Open Finance e muito mais, porque conosco: CADA TECH, UMA NOTÍCIA!

Conecte-se conosco:

Facebook X (Twitter) LinkedIn WhatsApp

NEWSLETTER

Receba diariamente os principais destaques do ecossistema das Fintech no seu e-mail.

Copyright © 2024. Todos os direitos reservados por FintechAO
  • HOME
  • POLÍTICA DE PRIVACIDADE
  • TERMOS DE UTILIZAÇÃO
  • CONTATO

Type above and press Enter to search. Press Esc to cancel.

Bloqueador de Anúncios Ativo!
Bloqueador de Anúncios Ativo!
O nosso site é possível graças à exibição de anúncios online para os nossos visitantes. Por favor, apoie-nos desativando o seu bloqueador de anúncios..