Close Menu
FintechAOFintechAO
  • HOME
  • NOTÍCIAS
  • ENTREVISTAS
  • ESPAÇO TECH
  • OPINIÃO
  • EDUTECH
  • ANÁLISES & REVIEWS
  • CONTATO
Últimas publicações

Regulador australiano questiona controlos AML da Binance

22 de Agosto de 2025 NOTÍCIAS 2 Mins Read

Stablecoins podem acelerar compra de dívida dos EUA

22 de Agosto de 2025 NOTÍCIAS 2 Mins Read

Bruxelas quer euro digital para conter domínio do dólar

22 de Agosto de 2025 NOTÍCIAS 2 Mins Read
Facebook X (Twitter) LinkedIn WhatsApp
  • HOME
  • NOTÍCIAS
  • ENTREVISTAS
  • ESPAÇO TECH
  • OPINIÃO
  • EDUTECH
  • ANÁLISES & REVIEWS
  • CONTATO
Facebook X (Twitter) LinkedIn WhatsApp
FintechAOFintechAO
Publicidade
FintechAOFintechAO
Home»NOTÍCIAS»OpenAI admite aumento de erros nos seus novos modelos

OpenAI admite aumento de erros nos seus novos modelos

Modelos o3 e o4-mini demonstram mais falhas factuais do que os seus antecessores, contrariando expectativas de melhoria na precisão da inteligência artificial.
22 de Abril de 20252 Mins Read NOTÍCIAS
openai
Foto de Growtika
Facebook Twitter LinkedIn Telegram WhatsApp Reddit Email Copy Link

A OpenAI, uma das líderes mundiais em inteligência artificial, revelou, segundo o TechCrunch, que os seus mais recentes modelos de raciocínio, o3 e o4-mini, apresentam taxas mais elevadas de alucinação do que modelos anteriores. A empresa admite que não sabe ao certo por que motivo isso acontece, embora acredite que o tipo de treino possa estar a influenciar os resultados.

Modelos alucinam mais do que os anteriores

Segundo testes internos da OpenAI, o modelo o3 apresentou 33% de respostas alucinadas em perguntas do benchmark PersonQA, focado no conhecimento sobre pessoas. Para comparação, os modelos anteriores o1 e o3-mini registaram 16% e 14,8%, respetivamente. Já o o4-mini teve um desempenho ainda pior: alucinou 48% das vezes.

Estes modelos são chamados de “raciocínio” por apresentarem melhorias em tarefas como programação e matemática. No entanto, o relatório técnico da OpenAI revela que, ao fazerem mais afirmações no geral, acabam por gerar tanto respostas mais precisas quanto mais incorretas.

Problema também identificado por terceiros

A organização sem fins lucrativos Transluce confirmou a tendência. Em testes, observou que o o3 chegou a inventar que executou código num MacBook Pro fora do ambiente ChatGPT. Na realidade, tal ação não é possível para o modelo.

Neil Chowdhury, investigador da Transluce e ex-funcionário da OpenAI, sugeriu que o tipo de aprendizagem por reforço adotado pode estar a agravar este problema.

Impacto na utilização prática

A crescente taxa de alucinação levanta preocupações, especialmente em setores onde a precisão é crítica, como o jurídico ou financeiro. Empresas podem hesitar em adotar modelos que geram erros factuais em contextos sensíveis.

Apesar disso, modelos como o o3 continuam a ser testados por startups como a Workera, que destaca a sua utilidade na programação. Contudo, também relatou problemas com links quebrados gerados pelo modelo.

Caminho para a melhoria pode passar pela pesquisa na web

Uma possível solução seria a integração de pesquisa na web. O modelo GPT-4o, com essa funcionalidade, atingiu 90% de precisão no benchmark SimpleQA. A OpenAI afirma estar a trabalhar constantemente para melhorar a fiabilidade e exatidão dos seus modelos.

Fonte: TechCrunch

Veja também:

  • Bolt lança SuperApp com cripto e pagamentos num clique
  • Restrição a chips H20 custa US$5,5 bi à Nvidia
  • OpenAI e Microsoft respondem a ações de direitos autorais em Nova York

Alucinações Big Tech GPT-4o inteligência artificial Modelos o3 o4-mini openai PersonQA Precisão em IA Raciocínio Computacional TechCrunch Transluce
Publicidade
Publicidade FinanceAds
  • Recentes
  • Mais lidas
  • Destaques

Regulador australiano questiona controlos AML da Binance

22 de Agosto de 2025 NOTÍCIAS 2 Mins Read

Stablecoins podem acelerar compra de dívida dos EUA

22 de Agosto de 2025 NOTÍCIAS 2 Mins Read

Bruxelas quer euro digital para conter domínio do dólar

22 de Agosto de 2025 NOTÍCIAS 2 Mins Read

Sam Altman e MIT lançam dúvidas sobre boom da IA

21 de Agosto de 2025 NOTÍCIAS 2 Mins Read

Regras de cripto do Basileia penalizam bancos

21 de Agosto de 2025 NOTÍCIAS 2 Mins Read

DeepSeek lança V3.1 e reforça capacidades de IA

20 de Agosto de 2025 NOTÍCIAS 2 Mins Read

Inteligência Artificial

13 de Janeiro de 2025 EDUTECH 3 Mins Read

Pagamentos digitais: evolução e impacto

13 de Janeiro de 2025 EDUTECH 3 Mins Read

Yann LeCun: Modelos atuais não alcançarão Inteligência Artificial Geral

9 de Janeiro de 2025 NOTÍCIAS 4 Mins Read

Fintechs: Revolução no Sistema Financeiro

13 de Janeiro de 2025 EDUTECH 3 Mins Read

Criptomoedas: Origem e Impacto Global

13 de Janeiro de 2025 EDUTECH 3 Mins Read

Regulador australiano questiona controlos AML da Binance

22 de Agosto de 2025 NOTÍCIAS 2 Mins Read

Stablecoins podem acelerar compra de dívida dos EUA

22 de Agosto de 2025 NOTÍCIAS 2 Mins Read

Sam Altman e MIT lançam dúvidas sobre boom da IA

21 de Agosto de 2025 NOTÍCIAS 2 Mins Read

Regras de cripto do Basileia penalizam bancos

21 de Agosto de 2025 NOTÍCIAS 2 Mins Read

DeepSeek lança V3.1 e reforça capacidades de IA

20 de Agosto de 2025 NOTÍCIAS 2 Mins Read

N26: Valentin Stalf, co-fundador, deixa cargo de CEO

19 de Agosto de 2025 NOTÍCIAS 2 Mins Read

N26 pode trocar liderança após pressão de investidores

13 de Agosto de 2025 NOTÍCIAS 2 Mins Read

Liga-te ao presente e futuro das Fintech recebendo diariamente os principais destaques e insights sobre o universo das Fintechs, Insurtechs, Regtechs, Paytechs, Startups, Inteligência Artificial, Cybersecurity, Digital Banking, Gadgets, Criptomoedas, Open Finance e muito mais, porque conosco: CADA TECH, UMA NOTÍCIA!

Conecte-se conosco:

Facebook X (Twitter) LinkedIn WhatsApp

NEWSLETTER

Receba diariamente os principais destaques do ecossistema das Fintech no seu e-mail.

Copyright © 2024. Todos os direitos reservados por FintechAO
  • HOME
  • POLÍTICA DE PRIVACIDADE
  • TERMOS DE UTILIZAÇÃO
  • CONTATO

Type above and press Enter to search. Press Esc to cancel.

Bloqueador de Anúncios Ativo!
Bloqueador de Anúncios Ativo!
O nosso site é possível graças à exibição de anúncios online para os nossos visitantes. Por favor, apoie-nos desativando o seu bloqueador de anúncios..