
Human Taste vs Algorithmic Taste
Apr 2, 2026 - 01:05:45
Radio and PodcastLive Radio & PodcastsFetching episode details...
Radio and PodcastLive Radio & Podcasts
Hoje vamos explorar um tema essencial na atualidade da inteligência artificial: como avaliar e medir o desempenho dos grandes modelos de linguagem, os chamados Large Language Models (LLMs). Com o crescimento exponencial...
Avaliação de LLMs is an episode from Building The Future - AI Portugal Podcast by Building The Future. Hoje vamos explorar um tema essencial na atualidade da inteligência artificial: como avaliar e medir o desempenho dos grandes modelos de...
This episode belongs to Building The Future - AI Portugal Podcast.
Use the player on this page to stream the episode online.
Published Jul 24, 2025, 00:55:36 long, audio available.
Hoje vamos explorar um tema essencial na atualidade da inteligência artificial: como avaliar e medir o desempenho dos grandes modelos de linguagem, os chamados Large Language Models (LLMs). Com o crescimento exponencial de ferramentas como o ChatGPT, GPT-4 ou Bard, surge a questão fundamental: Como sabemos se um modelo realmente compreende o que diz, ou se está apenas a reproduzir padrões previamente decorados? Para responder a isto, vamos analisar a importância dos benchmarks—testes padronizados que avaliam diferentes capacidades dos modelos, desde conhecimentos gerais até ao raciocínio lógico, passando pela capacidade de tomar decisões autónomas e executar tarefas práticas. Ao longo do episódio, vamos ainda descobrir as métricas-chave que determinam a qualidade destes modelos, perceber porque é que algumas das ferramentas mais avançadas falham quando confrontadas com problemas ligeiramente diferentes dos habituais, e examinar estudos recentes—como o da Apple, que questiona seriamente se osmodelos realmente “pensam” ou se apenas simulam essa capacidade. Vamos também discutir as forças e limitações dos atuais métodos de avaliação, abordando as diferenças entre modelos de código aberto e fechado, e apresentar sugestões para melhorar a forma como medimos o verdadeiro potencial da IA. AI News: Microsoft’sAI Is Better Than Doctors at Diagnosing Disease | TIME Email us at podcast@buildingthefuture.pt Produção: Beatriz Herrera González - Hosts: Marco António Silva: José António Silva: Vitor Santos:
You can listen to Avaliação de LLMs online on Radio and Podcast. Open the player on this page to stream the available audio.
Avaliação de LLMs is an episode from Building The Future - AI Portugal Podcast by Building The Future.
This episode is 00:55:36 long.
This episode was published on Jul 24, 2025.
Yes. Use the heart button on the episode page to add it to your favorite episodes list.
Yes. This page shows related episodes from Building The Future - AI Portugal Podcast when more episodes are available from the podcast feed.
You can listen to Avaliação de LLMs on this page when the episode audio is available from the podcast feed.
Avaliação de LLMs is from Building The Future - AI Portugal Podcast by Building The Future.
Published Jul 24, 2025 and 00:55:36 long