Databricks propose son système d'analyse Big Data sur Google Cloud

La plate-forme de données unifiée de Databricks sera disponible sur la plate-forme Google Cloud à partir d’avril, ont annoncé mercredi les deux sociétés, complétant un trio pour Databricks dont le logiciel fonctionne déjà sur les plates-formes cloud Amazon Web Services et Microsoft Azure.

Le logiciel de Databrick sera également intégré au système d’analyse commerciale Google BigQuery et exploitera Google Kubernetes Engine, permettant aux entreprises et aux organisations de déployer Databricks dans un environnement cloud conteneurisé pour la première fois.

Avec Databricks disponible sur Google Cloud, les clients peuvent créer des « data lakehouses » – une combinaison de data lake et de systèmes d’entrepôt de données dont Databricks a fait la promotion – pour une gamme de tâches d’analyse commerciale, d’ingénierie des données, de science des données et d’apprentissage automatique.

[Enrapport:[Related :

10 entreprises Big Data à surveiller en 2021

L’alliance avec Google intervient à un moment où Databricks a pris de l’ampleur – et beaucoup d’attention – dans l’espace du Big Data. Plus tôt ce mois-ci, la société a levé 1 milliard de dollars dans le cadre d’un cycle de financement de série G, portant sa valorisation post-monétaire à 28 milliards de dollars, un mouvement que beaucoup considèrent comme un précurseur d’une introduction en bourse cette année.

L’alliance intervient également alors que de plus en plus d’entreprises et d’organisations choisissent de stocker leurs données – en particulier les données gérées pour des tâches analytiques – dans le cloud et d’exécuter leurs outils d’analyse commerciale et de visualisation de données sur des plates-formes cloud.

« Le cloud est énorme maintenant. Mais c’est vraiment le début du voyage pour de nombreux clients, en particulier en ce qui concerne les données et les entrepôts de données « , a déclaré David Meyer, vice-président senior de la gestion des produits de Databricks, dans un entretien avec CRN.

« Nous constatons une accélération très significative de la migration de ces charges de travail de données vers le cloud », a déclaré Kevin Ichhpurani, vice-président d’entreprise de Google et responsable de l’écosystème mondial et du développement commercial de Google Cloud, également dans l’interview avec CRN.

Ichhpurani a déclaré que ces efforts pour déplacer les données et l’analyse commerciale vers le cloud sont motivés par des volumes de données en croissance rapide et par le rôle que l’analyse de données, l’orchestration des données et l’apprentissage automatique jouent dans les initiatives de transformation numérique et la réinvention des processus commerciaux.

L’exécutif de Google a également souligné que l’alliance va au-delà du développement conjoint pour inclure des activités de commercialisation et de vente – y compris la collaboration avec des partenaires de distribution.

Les deux sociétés ont déclaré que les membres de leurs écosystèmes partenaires se sont engagés à soutenir Databricks sur Google Cloud, y compris les intégrateurs de systèmes Accenture, Cognizant et Deloitte; des prestataires de services stratégiques tels que Slalom et SADA; et des partenaires développeurs de logiciels, notamment Qlik, Tableau, Informatica et Confluent.

Meyer a noté que de nombreuses entreprises et organisations mettent hors service d’anciens systèmes d’entrepôt de données et d’analyse et les déplacent vers le cloud. « C’est le moment idéal pour ces SI [systems integrators] pour se pencher et aider ces clients à déterminer où ils veulent être dans trois ou quatre ans.  »

Ichhpurani a déclaré que plusieurs des intégrateurs de systèmes qui s’associent à Google et Databricks sont intéressés par le lancement de pratiques autour de l’offre Databricks-on-Google Cloud.

La plate-forme de données unifiée Databricks sur Google Cloud est actuellement en test bêta et devrait être disponible en avril. Il sera disponible via Google Cloud Marketplace pour simplifier l’approvisionnement, l’approvisionnement des utilisateurs, la connexion et la facturation unifiée.

Databricks on GCP permettra aux clients de déployer et de faire évoluer rapidement les logiciels de Databrick sur le réseau mondial de Google Cloud et d’ajuster facilement le taux d’utilisation en fonction de leurs besoins actuels.

Les deux sociétés ont également déclaré que les contrôles avancés de sécurité et de protection des données fournis par le GCP rendraient la combinaison particulièrement intéressante pour une utilisation dans des secteurs hautement réglementés.

En utilisant Google Kubernetes Engine comme environnement d’exploitation pour exécuter Databricks sur Google Cloud, Databricks peut tirer parti des services gérés Kubernetes pour la sécurité, la politique réseau et le calcul, selon les deux sociétés. Il accélère également la sortie de nouvelles fonctionnalités à grande échelle et à moindre coût.

Les entreprises ont également développé des connecteurs pour intégrer Databricks à Google BigQuery, Google Cloud Storage, l’outil d’exploration et de découverte de données Looker de Google et le système de messagerie et d’ingestion de données Pub / Sub de Google.

« En combinant les capacités de Databricks en ingénierie et en analyse de données avec le réseau mondial et sécurisé de Google Cloud, et notre expertise en analyse et en fourniture d’applications conteneurisées, nous pouvons aider les entreprises à transformer leurs activités grâce à la puissance des données », a déclaré Thomas Kurian, PDG de Google Cloud, dans un rapport.

La disponibilité de Databricks sur Google Cloud « [s] sur notre vision commune d’une plate-forme de données simplifiée, ouverte et unifiée qui prend en charge tous les cas d’utilisation d’analyse et d’IA qui permettront à nos clients d’innover encore plus rapidement « , a déclaré Ali Ghodsi, PDG de Databricks, dans le même communiqué. « Il s’agit d’une étape cruciale qui souligne notre engagement à permettre la flexibilité et le choix des clients avec une expérience transparente sur les plates-formes cloud. »

Tags: ,