Radio and PodcastRadio and PodcastLive Radio & Podcasts
Episode 226 : Starlake.AI avec Hayssam Saleh artwork
Technology

Episode 226 : Starlake.AI avec Hayssam Saleh

Bigdata Hebdo by Vincent Heuschling

Feb 20, 202655:40Technology

Vincent Heuschling reçoit Hayssam Saleh, créateur de **Starlake**, une plateforme data open source française née de la factorisation de projets clients depuis 2017-2018. L'épisode intervient dans un contexte de consolida...

About This Episode

Episode 226 : Starlake.AI avec Hayssam Saleh is an episode from Bigdata Hebdo by Vincent Heuschling. Vincent Heuschling reçoit Hayssam Saleh, créateur de **Starlake**, une plateforme data open source française née de la factorisation de pro...

Podcast

This episode belongs to Bigdata Hebdo.

Listen Online

Use the player on this page to stream the episode online.

Episode Details

Published Feb 20, 2026, 55:40 long, audio available.

Questions About This Episode

What is Episode 226 : Starlake.AI avec Hayssam Saleh about?

Vincent Heuschling reçoit Hayssam Saleh, créateur de **Starlake**, une plateforme data open source française née de la factorisation de projets clients depuis 2017-2018. L'épisode intervient dans un contexte de consolidation du marché (rachat de DBT et de SQLMesh par Fivetran), qui invite à challenger les solutions établies. Starlake se distingue par une approche **entièrement déclarative** (YAML + SQL natif, sans Jinja) couvrant toute la chaîne data engineering : ingestion, transformation, orchestration et qualité des données. L'outil s'appuie sur les moteurs sous-jacents des plateformes cibles (Snowflake, BigQuery, Spark) et génère automatiquement les DAGs pour les orchestrateurs du marché (Airflow, Dagster, Snowflake Tasks). Parmi les fonctionnalités marquantes : le **data branching** (branches de données à la manière de Git), l'inférence automatique de schémas YAML à partir de fichiers sources, un **transpiler SQL** multi-plateformes, et l'extraction du lineage depuis du SQL brut sans annotation. L'intégration récente de **DuckLake** ouvre la voie à des architectures on-premise souveraines à coût maîtrisé (sous 300 €/mois sur OVH, Scaleway, Clever Cloud). Le modèle économique repose sur le support, la formation, et le consulting : Starlake s'installe dans le cloud du client, avec mise à jour automatique gérée par l'équipe, sans accès aux données. **Chapitres** **00:00:27** – Introduction : consolidation du marché data (rachat de DBT et SQLMesh par Fivetran) et présentation de l'épisode **00:03:13** – Hayssam et la genèse de Starlake : parcours Spark/Scala, POC à 4 000 formats de fichiers (2017-2018) **00:09:51** – Architecture et philosophie : load, transform, orchestration unifiés en déclaratif (YAML + SQL natif, pas de Jinja) **00:00:18:18** – Starlake vs DBT : différences philosophiques, composabilité, fonctionnalités 100 % open source **00:00:22:20** – Data branching, Starlake Labs (pipe syntax, transpiler SQL, lineage) et expérience développeur (DuckDB local, UI point-and-click) **00:36:35** – Modèle open source et économique : licence Apache, support, formation, marketplace cloud souveraine **00:43:42** – DuckLake : alternative on-premise/cloud souverain (OVH, Scaleway, Clever Cloud) et comment contribuer / démarrer **Le BigdataHebdo** Le BigdataHebdo est le podcast Francophone de la Data et de l'IA. Retrouvez plus de 200 épisodes Rejoignez la communauté sur le Slack

Where can I listen to Episode 226 : Starlake.AI avec Hayssam Saleh?

You can listen to Episode 226 : Starlake.AI avec Hayssam Saleh online on Radio and Podcast. Open the player on this page to stream the available audio.

Which podcast is Episode 226 : Starlake.AI avec Hayssam Saleh from?

Episode 226 : Starlake.AI avec Hayssam Saleh is an episode from Bigdata Hebdo by Vincent Heuschling.

How long is this episode?

This episode is 55:40 long.

When was this episode published?

This episode was published on Feb 20, 2026.

Can I save Episode 226 : Starlake.AI avec Hayssam Saleh for later?

Yes. Use the heart button on the episode page to add it to your favorite episodes list.

Are there related episodes from Bigdata Hebdo?

Yes. This page shows related episodes from Bigdata Hebdo when more episodes are available from the podcast feed.

Quick Answers About This Episode

Where can I listen to Episode 226 : Starlake.AI avec Hayssam Saleh?

You can listen to Episode 226 : Starlake.AI avec Hayssam Saleh on this page when the episode audio is available from the podcast feed.

Which podcast is this episode from?

Episode 226 : Starlake.AI avec Hayssam Saleh is from Bigdata Hebdo by Vincent Heuschling.

What are the episode details?

Published Feb 20, 2026 and 55:40 long