Big Data Hebdo

40 Episodes
Subscribe

By: Vincent Heuschling, Alexander Dejanovski, Jérôme Mainaud, Nicolas Steinmetz

Toute l'actualité du Bigdata et surtout de sa communauté francophone dans un podcast.

Episode 220 : Databricks Data and AI Summit 2025
07/25/2025

Dans cet épisode du Big Data Hebdo, Vincent Heuschling et Quentin Ambard reviennent sur le Data and AI Summit 2025 de Databricks.

En autres on parle de :
L'acquisition de Néon pour avoir une BDD au dessus du LakehouseLakeflow Designer pour avoir une approche low-codeL'intégration de l'IADatabricks One pour rendre l'interface plus accessibleLes améliorations du moteur SQL de DatabricksAgent Bricks qui simplifie le développement d'agents AI.La data-gouvernance avec Unity Catalog.Le Vector Search au dessus du lakehouseLes inevitables troll envers Snowflake 🤣🤣🤣 


Episode 219 : Format Table Iceberg, Delta et Ducklake
07/11/2025

Dans cet épisode du Big Data Hebdo, on regarde l'évolution des formats de fichiers Table, en se concentrant sur Parquet, Delta Lake, Iceberg et Duck Lake. On évoque la gestion des metadata et les catalogues pour la gouvernance des données. 



Episode 218 : Agents IA
07/02/2025

(00:00:00) Episode 218 : Agents IA
(00:02:58) Définition d'un agent IA
(00:09:49) Agents et outils
(00:10:30) TAO & ReAct
(00:39:50) Frameworks

Dans cet épisode thématique, on explore les agents IA, dernière itération de l'IA Générative.
Qu'est ce qui distingue un agent d’un chatbot ou d’un simple prompt ?
On parle aussi de la relation entre agents, outils (tools) et modèles LLM.
Quels sont les frameworks les plus matures pour construire des agents?


Episode 217 : BDH live à Devoxx Paris 2025
05/28/2025

(00:00:00) Episode 217 : BDH live à Devoxx Paris 2025
(00:01:04) Conférence Bug Bash et tests autonomes
(00:06:23) Windsurf : révolution du coding assistant
(00:16:23) Automatisation de la veille technologique
(00:22:28) LLM spécialisés vs généraux
(00:37:00) Ariga Atlas pour les bases de données

Cet épisode spécial du Big Data Hebdo, enregistré à Devoxx Paris, on donne la parole aux auditeurs ! 
On parle de Windsurf pour l’assistance au code,  de test autonome avec Antithesis (qui a réussi à casser ETCD), et d’automatisation de la veille technologique, et pour finir d’automatisation pour les bases de données avec  Ariga At


Episode 216 : DBT vs SQLMesh
04/11/2025

Dans cet épisode, on revient sur l’évolution de la data-ingénierie à travers deux outils : DBT et SQLMesh. Comment ces outils ont émergé avec la montée en puissance du SQL dans les architectures modernes ? Comment ils répondent aux enjeux de modélisation, d’industrialisation et de gouvernance de la donnée ? L’épisode est aussi l’occasion d’aborder l’évolution des métiers de la data, notamment l’émergence du rôle d’analytic engineer, à la croisée des chemins entre data engineering et data analytics.
La révolution du SQL modulaire
→ Retour sur l’historique du SQL dans l’analytique mo...


Episode 215 : Le RAG en 2025 toujours d'actualité ?
04/07/2025

Dans cet épisode du Big Data Hebdo, on fait le point sur le RAG (Retrieval-Augmented Generation) : est-il toujours au cœur des usages d’IA générative en entreprise, ou dépassé par les nouveaux paradigmes comme l’agentic AI ?

Paul, Jérôme, Nicolas et Vincent reviennent sur :
Les fondamentaux du RAG : pourquoi est-il apparu ?Comment fonctionne techniquement un pipeline RAG ?Les erreurs à éviter quand on passe en productionLes bonnes pratiques : hybrid search, cache, feedback utilisateursCe qui change en 2025 : modularité, agentic RAG, graph RAG, et plus encore !
Retrouvez les épiosodes et show notes sur https://bigdatah...


Episode 214 : Plus vite et moins cher sur Snowflake avec Indexima
03/21/2025

Dans cet épisode du Big Data Hebdo, 🎙️ j’ai eu le plaisir d’échanger avec Nicolas Korchia de Indexima, qui nous dévoile comment leur solution révolutionne la performance des requêtes analytiques sur Snowflake⚡

👉 Indexima for Snowflake analyse les requêtes en temps réel et génère automatiquement des agrégats optimisés avec les Dynamic Tables, réduisant drastiquement les temps de réponse et les coûts ! 💰💨

Show notes et chapitres sur http://bigdatahebdo.com/podcast/episode-214-plus-vite-et-moins-cher-sur-snowflake-avec-indexima/

-----------------
Cette publication est sponsorisée par Datatask (http...


episode 213 : Timeseries et SQL avec Warp10
02/21/2025


🎙️ On plonge dans les séries temporelles et l’intégration SQL avec Warp 10, en compagnie de Mathias Herbert (Senx.io).

📊 SQL atteint vite ses limites face aux time series. Comment faire mieux sans exploser la facture cloud ? WarpLibapporte une solution en s’intégrant dans Databricks, Starburst et bientôt Snowflake !

Show notes et chapitres sur http://bigdatahebdo.com/podcast/episode-213-timeseries-et-sql-avec-warp10/


Episode 212 Analytique en Cloud Hybride
02/03/2025

Le BigDataHebdo reçoit Florian Caringi, responsable des plateformes Data & IA au sein du groupe BPCE. On discute de l'évolution des architectures Big Data, de Hadoop aux environnements hybrides et cloud, avec une adoption massive de Google Cloud (BigQuery, Vertex AI) pour des usages analytiques et data science.

Florian partage son expérience sur les défis de migration, de FinOps, et l'intégration des IA génératives. Une discussion passionnante sur la modernisation des infrastructures et l'impact des nouvelles technologies dans les grandes organisations.

Show notes et chapitres sur http://bigdatahebdo.com/podcast/episode...


Episode 211 - Motherduck
01/23/2025

Le BigDataHebdo, reçoit Mehdi, Developer Advocate chez MotherDuck, pour explorer l’univers de DuckDB et MotherDuck. Au programme, les origines académiques de DuckDB, son évolution en tant que moteur SQL analytique performant, et son extension MotherDuck qui permet de l’utiliser comme un Data Warehouse en ligne.

Show notes sur http://bigdatahebdo.com/podcast/episode-211-motherduck/


Episode 210 - Prédictions 2025
01/17/2025

Dans cet épisode on revient brièvement sur l'année écoulée, et on vous parle de ce qu'on prévoit sur 2025. Evidement ces prédictions sont très tintées d'IA ! 

Retrouvez tous les épisodes avec leurs shownotes : https://bigdatahebdo.com/?src=shownotes

-----------------
Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (https://www.cerenit.fr/) .

CerenIT (https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr (https://cerenit.fr) et retrouvez-nous...


Episode 209 : FoundationDB, brique élémentaire de Materia KV feat @MACI
11/22/2024

Dans cet épisode on revient sur FoundationDB. FoundationDB est le socle de beaucoup de services (Icloud, Snowflake...) mais reste peu connue.

Qui de mieux que l'équipe de spécialistes de Clever cloud qui l'a utilisé pour construire ses "Databases as a Service" pour en parler ?  C'est donc un épisode conjoint avec leur podcast "Message à Caractère informatique" que vous retrouvez ici.

Show notes de l'épisode : https://bigdatahebdo.com/podcast/episode-209-foundationdb-labrique-elementaire

-----------------
Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (https://www.cerenit.fr/) .

CerenIT (https://ww...


Episode 208 : Aux sources de FoundationDB feat @MACI
11/15/2024

Dans cet épisode on revient sur FoundationDB. FoundationDB est le socle de beaucoup de services (Icloud, Snowflake...) mais reste peu connue.

Qui de mieux que l'équipe de spécialistes de Clever cloud qui l'a utilisé pour construire ses "Databases as a Service" pour en parler ?  C'est donc un épisode conjoint avec leur podcast "Message à Caractère informatique" que vous retrouvez ici.

Show notes de l'épisode : https://bigdatahebdo.com/podcast/episode-208-aux-sources-de-foundationdb-feat-maci

-----------------
Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (https://www.cerenit.fr/) .

CerenIT (https://ww...


Episode 207 : Live au Salon Data & IA de Nantes 2024
11/01/2024

Episode enregistré en Live au Salon de la Data et De l'IA de Nante en Septembre 2024. On débat de la Data-Quality avec la contribution du public.

à retrouver aussi sur Youtube https://youtu.be/9_C6hbZpDrw

Les shownotes de cet épisode sont à retrouver sur
https://bigdatahebdo.com/podcast/episode-207-live-salon-data-ia/


Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com
Et sur la chaine Youtube


Episode 206 : portes ouvertes chez OpenAI
10/18/2024

Les shownotes de cet épisode sont à retrouver sur
https://bigdatahebdo.com/podcast/episode-206-portes-ouvertes-chez-openai/


Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com
Et sur la chaine Youtube


Episode 205 : Kestra avec Ludovic Dehon
09/27/2024

Les shownotes de cet épisode sont à retrouver sur
https://bigdatahebdo.com/podcast/episode-205-Kestra-avec-Ludovic-Dehon


Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com
Et sur la chaine Youtube


Episode 204 : 70 milliards de réflections
09/14/2024

Les shownotes de cet épisode sont à retrouver sur
https://bigdatahebdo.com/podcast/episode-204-70-milliards-de-relections/ 


Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com
Et sur la chaine Youtube  


------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer v...


Episode 203 : Pas de trêve olympique pour les LLMs
08/01/2024

Les shownotes de cet épisode sont à retrouver sur
https://bigdatahebdo.com/podcast/episode-203-pas-de-treve-olympique-pour-les-llms/


Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com


------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask p...


Episode 202 : Data Architecture avec Frédéric Brossard de Dcube
07/27/2024

Retrouvez les shownotes de cet épisode sur https://bigdatahebdo.com/podcast/episode-202-data-architecture-avec-frederic-brossard-de-dcube/  



------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. 

Le générique a été composé et réalisé par Max


Episode 201 : Snowflake Summit 24 - part 2 ML et Generative AI
07/16/2024

Retrouvez les liens de cet épisode dans les shownotes sur 
https://bigdatahebdo.com/podcast/episode-201-snowflake-summit-24-part-2-ml-et-genai/


------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data a...


Episode 200 : Snowflake Summit 24 part 1 Data-Engineering
07/09/2024

Retrouvez les liens de cet épisode dans les shownotes sur 
https://bigdatahebdo.com/podcast/episode-200-snowflake-summit-24-part-1-data-engineering/


------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data a...


Episode 199 : Databricks Data & AI Summit 2024
07/02/2024

Retrouvez les liens de cet épisode dans les shownotes sur 
https://bigdatahebdo.com/podcast/episode-199-databricks-dais-2024/


------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous...


Episode 198 : IA Gen et Anssi
06/25/2024

Retrouvez les liens de cet épisode dans les shownotes sur 
https://bigdatahebdo.com/podcast/episode-198-ia-gen-et-anssi/



------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...


Episode 197 : GLADIA avec Jean-Louis Queguiner
06/11/2024

Retrouvez les liens de cet épisode dans les shownotes sur 
https://bigdatahebdo.com/podcast/episode-197-gladia-avec-jean-louis-queguiner/



------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...


Episode 196 : python, duckdb, etc...
06/04/2024

Retrouvez les liens de cet épisode dans les shownotes sur 
https://bigdatahebdo.com/podcast/episode-196-python-news-et-autres/



------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...


Episode 195 : DBT avec Florian Eiden
05/28/2024

Retrouvez les liens de cet épisode dans les shownotes sur 
https://bigdatahebdo.com/podcast/episode-195-dbt-avec-florian-eiden



------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...


Episode 194 : Self Service Data - Tristan Mayer - CastorDoc
05/21/2024

Retrouvez les liens de cet épisode dans les shownotes sur 
https://bigdatahebdo.com/podcast/episode-194-self-service-data-avec-tristan-mayer/



------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...


Episode 193 : Microsoft Fabric avec Marie Aubert
05/14/2024

Retrouvez les liens de cet épisode dans les shownotes sur 
https://bigdatahebdo.com/podcast/episode-193-microsoft-fabric-avec-marie-aubert



------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...


Episode 192 : DuckDB et autres avec Christophe Blefari
05/10/2024

Retrouvez les liens de cet épisode dans les shownotes sur 
https://bigdatahebdo.com/podcast/episode-192-duckdb-et-autres-avec-christophe-blefari



------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...


Episode 191 : Popsink avec Benjamin Djidi
04/29/2024

Retrouvez les liens de cet épisode dans les shownotes sur 
https://bigdatahebdo.com/podcast/episode-191-popsink-avec-benjamin-djidi 



------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec...


Episode 190 : Databricks DBRX avec Quentin Ambard
04/22/2024

Retrouvez les liens de cet épisode dans les shownotes sur 
https://bigdatahebdo.com/podcast/episode-190-databricks-dbrx-avec-quentin-ambard

------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ec...


Episode 189 : la compta du futur et autres news
04/08/2024

Retrouvez les liens de cet épisode dans les shownotes sur 
https://bigdatahebdo.com/podcast/episode-189-la-compta-du-futur-et-autres-news/


------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous...


Episode 188 : Data-Ops avec Matthieu Rousseau
03/29/2024

Retrouvez les liens de cet épisode dans les shownotes sur 
https://bigdatahebdo.com/podcast/episode-188-data-ops-avec-matthieu-rousseau/


------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous...


Episode 187 : La data chez Nickel avec Paul Marcombes
03/20/2024


Episode 186 : plus jQuery que Terraform
03/09/2024

Retrouvez les liens de cet épisode dans les shownotes sur 
https://bigdatahebdo.com/podcast/episode-186-plus-jquery-que-terraform/

------------------
Cette publication est sponsorisée par Datatask et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.

Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ec...


Episode 185 : C'est génial jusqu'au moment ou c'est plus génial
03/01/2024


* La Nuit de la Data et de l'IA - And the winners are... : -> https://www.republikgroup-it.fr/palmares-2024-tda


* IA ACT


* Probabl is a new AI company built around popular library scikit-learn -> https://techcrunch.com/2024/02/01/probabl-is-a-new-ai-company-built-around-popular-library-scikit-learn/


* From Silos to Standardization: Leveraging DBT for a Democratized Data Framework -> https://medium.com/uc-engineering/from-silos-to-standardization-leveraging-dbt-for-a-democratized-data-framework-f444dcd07cd9


* DuckDB vs Polars -> https://medium.com/gitconnected/duckdb-vs-polars-2ff19cc7af41


* Meetup Python sur les frameworks UI -> https://youtu.be/yspHNEFjKfQ?list=PLv7xGPH0RMUT1...


Episode 184 : Pour une poignée de dollars
02/15/2024

Shownotes sur : https://bigdatahebdo.com/podcast/episode-184-pour-une-poignee-de-dollars/


Episode 183 : Promptologues de l'infra
02/09/2024

### Promptologues

* How to Cut RAG Costs by 80% Using Prompt Compression -> https://towardsdatascience.com/how-to-cut-rag-costs-by-80-using-prompt-compression-877a07c6bedb

* Prompt Compression avec LLMLingua -> https://github.com/microsoft/LLMLingua


### LLM Infra* Introducing Pinecone Serverless -> https://www.pinecone.io/blog/serverless/

* embedchain/embedchain: The Open Source RAG framework -> https://github.com/embedchain/embedchain

* A Guide to Large Language Model Abstractions - Two Sigma -> https://www.twosigma.com/articles/a-guide-to-large-language-model-abstractions/

### Data eng* How to Scale Your Data Pipelines and Data Products with Contract Testing and Dbt...


Episode 182 : Zuck fabric une AGI avec des data-contracts
02/03/2024

Shownotes sur :
https://bigdatahebdo.com/podcast/episode-182-zuck-fabric-une-agi-avec-des-data-contracts/


Episode 181 : Le Maestro du GPT Store
01/26/2024


Shownotes sur :
https://bigdatahebdo.com/podcast/episode-181-le-maestro-du-gptstore/