Dans ta science : focus sur le Data Engineering

A la croisée de plusieurs disciplines, la Data Science s'appuie sur des méthodes et des algorithmes pour tirer des informations et de la connaissances à partir de données structurées et non structurées. Encore inconnus il y a quelques années, les métiers de la Data Science et du Machine Learning évoluent très vite. Compétences, méthodes,...

Lire la suite

Dataiku Data Science Studio : focus sur les fonctionnalités et l’intégration dans un environnement AWS

Cet article a été co-rédigé par Olivier Randavel et David Dupin. Dans le cadre de l'accompagnement d'un client dans sa migration vers le cloud d’AWS, nous avons mis en place un datalake complexe répondant aux défis imposés par le caractère sensible des données de santé. Après les phases de préparation, d’anonymisation et d’exposition,...

Lire la suite

Retour d’expérience : l’évolution d’un Datalake vers les services Cloud

Un Datalake est un produit complexe qui est le plus souvent construit sur mesure pour chaque besoin métier. Dans le retour d’expérience client que nous présentons ici, la problématique rencontrée était le remplacement d’un Datalake on premise basé sur la solution Cloudera. A l’origine de ce changement, des problèmes récurrents de scalabi...

Lire la suite