Top 200 des meilleures startups data à suivre

On assiste depuis quelques années à l’émergence de plateformes et d’outils (souvent no code) facilitant l’exploitation des données sur toute la chaîne de traitement : collecte, consolidation, unification, préparation, transformation, enrichissement, activation, BI…

Les ELT cloud remplacent progressivement les ETL lourds du passé, les data warehouses cloud prennent le relais des vieux Data Warehouses « on premise » (type Informatica), les « Reverse ETL » permettent de mettre les données du DWH à disposition des équipes métier. Etc. Et tout ça, c’est grâce à un écosystème de startups data particulièrement florissant et innovant dont Octolis, à son échelle, fait partie.

Nous avons voulu vous présenter dans cet article les startups data qui nous inspirent le plus. Plusieurs experts du domaine se sont prêtés au même jeu que nous. Vous découvrirez leurs tops startups data en deuxième partie d’article.

Un Top 12 très personnel des startups data qui nous inspirent

Castor, le data catalog inspiré des géants de la Tech

top startups data castor

Castor est un outil collaboratif et automatisé de catalogage des données. Ciblant des cas d’utilisation tels que la rationalisation des projets de conformité des données et la migration vers le cloud, Castor se connecte aux entrepôts de données du cloud (Snowflake, BigQuery, Redshift, MySQL…) et aux outils de business intelligence (Looker, Tableau, PowerBI, Metabase…) pour créer et mettre à jour automatiquement la documentation à laquelle les employés peuvent se référer lorsqu’ils ont des questions relatives aux données.

Solution plug & play prenant la forme d’un moteur de recherche, Castor fournit une source unique de référencement et de documentation des données, pour les rendre claires et accessibles à tous dans l’entreprise.

  • Date de création : 2020
  • Levées de fonds :
    • Novembre 2021 : Pre seed (2M$)
    • Juin 2022 : Série A (23,5M$)
  • Site web

Metaplane, le Datadog qui met vos tableaux de bord au propre

top startups data metaplane

Metaplane est une plateforme d’observabilité des données utilisée par les équipes data dans les entreprises à forte croissance pour gagner du temps d’ingénierie et gagner en fiabilité des données. L’objectif principal est de détecter les anomalies des tableaux de bords pour résoudre le problème avant que cela n’impacte le travail des autres équipes dans
l’entreprise.

En surveillant de près les métadonnées, la plateforme identifie les signaux anormaux (grâce à l’historique, les volumes, les distributions…), depuis les warehouses jusqu’aux tableaux de bord de BI, et peut ainsi alerter dès qu’un tableau bord s’avère être défaillant.

  • Date de création : 2019
  • Levées de fonds :
    • Janvier 2021 : Seed (montant non divulgué)
    • Mars 2020 : Pre Seed (montant non divulgué)
  • Site web

Cube, le middleware pour préparer et exploiter vos données

top startups data cube

Cube est une couche sémantique, c’est-à-dire un intergiciel entre la source de données et l’application de données, qui permet aux ingénieurs et développeurs de rendre leurs données cohérentes, sécurisées, performantes et accessibles dans toutes les applications.

Orientée API, la couche sémantique de Cube permet la modélisation des données (en créant une source de données unique et centralisée) et un contrôle d’accès aux données. Cube offre un système de mise en cache à deux niveaux (un cache en mémoire et des pré-agrégations configurables) permettant à chaque application en aval de recevoir rapidement les informations les plus récentes. Enfin, les API SQL, REST et GraphQL de Cube permettent de créer des interfaces personnalisées pour visualiser les données et tableaux de bord de BI.

  • Date de création : 2019
  • Levées de fonds :
    • Juillet 2021 : Série A (15,5M$)
    • Septembre 2020 : Seed (6,2M$)
  • Site web

Portable, pour connecter facilement toutes vos sources de données à votre Data Warehouse

top startups data portable

Portable est une plateforme ELT (Extract Transform Load) permettant d’obtenir l’ensemble des données de toutes les applications business, et ce sans aucun code. Portable offre des pipelines de données simples et prêts à l’emploi que l’on peut configurer en quelques minutes.

En se connectant à plus de 300 sources de données, Portable permet de centraliser les données sources provenant de différentes applications métier dans l’entrepôt de données cloud (Snowflake, BigQuery, Redshift, PostgreSQL…) à des fins d’analyse, d’automatisation ou de développement de produits.

Les solutions développées sont des solutions d’e-commerce (pour optimiser les opérations et créer des expériences d’achat innovantes), de marketing (pour développer des audiences et expériences clients de grande qualité, analyser des campagnes), d’analyse des ressources humaines (embauche et rétention des meilleurs collaborateurs grâce à des données centralisées) et de promotion du produit.

  • Date de création : 2020
  • Levées de fonds :
    • Août 2022 : Seed (3,2M$)
  • Site web

Hasura, le GraphQL pour créer vos APIs 10x plus vite

top startups data hasura

Hasura implémente un moteur de métadonnées pour simplifier et accélérer le développement d’applications sans serveur, en rendant les données instantanément accessibles via des API GraphQL. Hasura fournit des API web prêtes à l’emploi permettant des opérations flexibles et sécurisées sur les données, particulièrement utiles pour les entreprises où toutes les nouvelles capacités (applications ou API) doivent se connecter aux données en ligne existantes et où il ne s’agit pas seulement de créer des applications entièrement nouvelles.

Les produits développés sont des API GraphQL et REST instantanées sur toutes les données nouvelles et existantes pour alimenter des applications et des API modernes (Hasura Community Edition, Hasura Cloud, Hasura Enterprise Edition).

  • Date de création : 2017
  • Levées de fonds :
    • Avril 2018 : Seed (1,6M$)
    • Février 2020 : Série A (9,9M$)
    • Septembre 2020 : Série B (25M$)
    • Février 2022 : Série C (100M$)
  • Site web

Neon, la solution pour créer une BDD Postgres serverless

top startups data neon

Neon est un produit PostgreSQL sans serveur et open source permettant de créer un service de base de données en cloud pour les développeurs. Il devient facile de créer des branches pour chaque déploiement de code dans sa pipeline CI/CD de sa base de données PostgreSQL, et ce, à un coût très faible grâce à la technique de « copy-on-write » de Neon. Neon propose également un système de stockage illimité (écrit en rust) spécialement conçu pour le cloud.

Les entreprises SaaS utilisent Neon pour maximiser la vitesse d’ingénierie et minimiser les coûts. L’architecture sans serveur minimise le coût de la maintenance pour les clients inactifs notamment.

  • Date de création : 2021
  • Levées de fonds : Non
  • Site web

Firebolt, pour accélerer vos analyses de données

top startups data firebolt

Firebolt est un entrepôt de données sous forme de cloud pour les créateurs d’expériences analytiques de nouvelle génération, combinant les avantages et la facilité d’utilisation d’une architecture moderne avec des performances ultra rapides, en moins d’une seconde. En construisant une architecture basée sur SQL, Firebolt utilise de nouvelles techniques de compression qui peuvent connecter les lacs de données et réduire les besoins en capacité du cloud, ce qui se traduit par une réduction des coûts et de meilleures performances.

Firebolt propose des API, SDK et IDE web. Firebolt utilise ANSI-SQL et dispose d’un IDE SQL.

  • Date de création :2019
  • Levées de fonds :
    • Décembre 2020 : Série A (37M$)
    • Juin 2021 : Série B (127M$)
    • Janvier 2022 : Série C (100M$)
  • Site web

Lightdash, l’alternative open source de Looker conçue pour les analystes

top startups data lightdash

Lightdash est une alternative BI open source à Looker, conçue pour les analystes sur la base des outils de données qu’ils utilisent déjà. Lightdash réunit l’interface visuelle avec l’interface de modélisation et de transformation des données, créant ainsi une source unique pour les analyses de données.

Dans Lightdash, tout se fait en code (les champs dans Lightdash sont définis dans le projet dbt), ce qui permet une meilleure gestion de son outil de BI. Développer ce dernier devient plus rapide que jamais : en utilisant le CLI de Lightdash avec un éditeur de texte, il est possible de tester, prévisualiser et enregistrer ses modifications dans Lightdash. En quelques clics, on peut facilement créer des graphiques à partir des données ajoutées à son projet Lightdash.

  • Date de création : 2021
  • Levées de fonds :
    • Août 2020 : pré seed (125K$)
    • Octobre 2022 : seed (8,4M$)
    • Octobre 2022 : pre seed (2,3M$)
  • Site web

Superbase, pour créer des bases de données cloud sur-mesure

top startups data superbase

Pionnier en Windows databases, Superbase propose un produit de développement multiplateforme et des outils qui permettent aux entrepreneurs de créer leurs propres solutions à leurs problèmes de gestion de données.

Les produits disponibles sont la “Superbase: Next Generation”, qui s’installe facilement au système existant grâce à des options d’API, “Superbase Database Engine”, moteur de base de données puissant et rapide qui peut être exécuté à la fois sur Linux et Windows, et enfin “Superbase Classic”, outil RAD.

  • Date de création : 1983
  • Levées de fonds : Non.
  • Site web

June, pour analyser en profondeur les produits B2B

top startups data june

June est un outil d’analyse pour le SaaS B2B qui se veut simple à configurer et facile à comprendre, en connectant facilement les sources de données pour obtenir un rapport des données d’utilisation des produits.

Pour vous aider à démarrer, June propose une bibliothèque de modèles de rapports prêts à l’emploi, permettant de suivre la rétention des utilisateurs, les utilisateurs actifs, le taux d’acquisition, d’engagement… June génère automatiquement des graphiques, classe la base d’utilisateurs en cohortes et calcule les indicateurs importants. Pour les plus aguerris, il est possible de créer des requêtes SQL personnalisées et de construire un modèle basé sur ces requêtes.

  • Date de création : 2021
  • Levées de fonds :
    • Mars 2021 : pre seed (montant non divulgué)
    • Juillet 2022 : seed (2,4M$)
  • Site web

Trevor, l’outil de DataViz nouvelle génération

top startups data trevor

Trevor est une solution de Business Intelligence plug-and-play qui donne un accès simple et sûr à la base de données. L’interface « point & click » de Trevor offre la puissance de SQL, sans la courbe d’apprentissage. En effet, Trevor donne la possibilité aux collaborateurs d’une équipe qui ne sont pas ingénieurs ou analystes d’établir leurs propres rapports, même s’ils ne connaissent pas le langage SQL. Les membres de l’équipe partagent leurs résultats en temps réel, collaborent sur des requêtes et analysent les résultats pour comprendre les données.

Le plus de Trevor : l’installation est sécurisée et se fait en quelques minutes seulement. Trevor se connecte directement à la base de données, sans prendre de copie des données. Trevor permet aussi de créer facilement et partager des tableaux de bord intuitifs à l’ensemble de son équipe. Enfin, Trevor permet de créer des flux de travail puissants, en envoyant des données en quelques clics seulement vers Google Sheets, Slack, une messagerie électronique ou des milliers d’autres applications.

  • Date de création : 2016
  • Levées de fonds :
    • Janvier 2017 : pre seed (montant non divulgué)
    • Août 2018 : Seed (montant non divulgué)
  • Site web

Octolis, la stack data des équipes marketing modernestop startup data octolis

Octolis est une Customer Data Platform 2.0, largement no code, permettant d’unifier et de préparer l’ensemble des données online et offline. Fonctionnant en surcouche d’une base de données (DWH) indépendante, Octolis gère toutes les étapes de data prep et permet aux équipes métier d’avoir des données propres et exploitables dans leurs outils (CRM, Marketing Automtion, Ads, ERP, Service Client…). Octolis est le moyen le plus rapide de préparer vos données pour l’activation et la BI.

  • Date de création : 2021
  • Levées de fonds : Non
  • Site web : vous êtes dessus 🙂

Top 300+ startups data à suivre

Découvrez à présent notre sélection de benchmarks favoris proposés par d’autres acteurs, bien souvent des médias, des fonds d’investissement…qui, comme vous et nous, sont passionnés par l’univers des start-ups data.

Top 121 des startups data & analytics à suivre selon Seedtable

top startups data seedtable

Alors que le secteur technologique des données et de l’analyse est en plein essor, Seedtable propose une sélection de startups data & analytics à suivre en 2022, d’au moins 10 salariés et en pleine croissance.

Cette liste présente la carte d’identité ultra synthétique de chaque start-up :

Top 100 des startups Data & BI européennes et israéliennes selon Accel

top startups data accel euroscape

Partner chez Accel, Philippe Botteri a travaillé dans la tech pendant plus de 15 ans, dont près de 10 ans dans la Silicon Valley.

Constatant une perte de dynamisme dans le secteur du SaaS ces dernières années, Philippe Botteri commence son analyse en exposant les tendances similaires observées aux Etats-Unis et en Europe, l’impact de la dynamique des marchés publics sur le marché du financement privé, avant de conclure sur les 100 premières entreprises sélectionnées pour l’Accel Euroscape 2022.

Top 35 des startups unicornes Big Data selon Failory

top startups data failory

Failory est un blog destiné aux fondateurs de startups et aux entrepreneurs, créé par Nico Cerdeira, étudiant argentin qui publie sur ce site interviews, articles et newsletters chaque semaine, avec plus de 25 000 entrepreneurs abonnés.

Son Top 35 regroupe les start-ups licornes du Big Data, classées de la valorisation la plus élevée à la plus faible, avec des informations détaillées et illustrées pour chacune.

Top 50 des startups data selon Future

top startups data future

Jennifer Li, Sarah Wang et Jamie Sullivan, partners chez a16z, proposent un article complet et détaillé d’un listing de 50 startups les plus intéressantes à suivre.

Alors que le marché de la data connaît la croissance la plus rapide avec une valeur estimée à plus de 70 milliards de dollars en 2021, la big data continue d’être l’un des moteurs d’innovation les plus dynamiques, pour les grandes entreprises comme pour les jeunes pousses.

À la croisée de l’informatique, de l’analytics et de l’intelligence artificielle, les startups phares du monde de la data présentées par les auteurs sont évaluées à plus de 100 milliards de dollars, et 20 ont atteint le statut de licorne d’ici 2021.

Top 20 des startups data analytics selon Exploding Topics

top startup data exploding topics

Josh Howarth, co-fondateur et CTO d’Exploding Topics, met en lumière la forte croissance de l’industrie de l’analyse des données, nourrie par l’arrivée de nouvelles entreprises sur le marché ces dernières années. Il passe en revue 20 des meilleures startups d’analyse à suivre en 2023 selon lui.

Pour chaque start-up, Josh Howarth présente la courbe de croissance, un bullet point de présentation de la structure et quelques lignes sur les solutions qu’elles proposent.