La nouvelle fonctionnalité Varada élimine les problèmes de complexité et de coût de l'analyse de texte en offrant des performances optimisées pour le texte directement sur le lac de données pour les consommateurs de données SQL

TEL AVIV, Israël – (BUSINESS WIRE) – Varada, l’innovateur de l’accélération des requêtes sur les lacs de données, a annoncé aujourd’hui une nouvelle capacité de sa plate-forme phare conçue pour prendre en charge les charges de travail d’analyse de texte et aider les équipes de données à fournir des informations plus rapides sur des exaoctets de données basées sur des chaînes. La solution Varada d’analyse de texte interactive, intégrée au populaire moteur de recherche open source Apache Lucene, fonctionne directement sur le lac de données du client et sert les consommateurs de données SQL prêts à l’emploi. En conséquence, les équipes de données peuvent atteindre des performances maximales sans déplacer les données, les dupliquer ou les modéliser.

La plupart des solutions d’analyse de texte sont déployées en complément des piles d’analyse de données existantes, ce qui pose des problèmes d’agilité, de coût, de délai de mise sur le marché et d’évolutivité. L’ajout par Varada de la prise en charge de Lucene dans sa solution fournit une pile intégrée qui fonctionne et s’adapte à des exaoctets de données sur les lacs de données, ce qui permet d’obtenir des informations commerciales plus riches.

L’annonce d’aujourd’hui signifie que la technologie de Varada peut donner aux entreprises des informations commerciales exploitables en exploitant 10 fois plus de données et en fournissant des résultats jusqu’à 100 fois plus rapidement. La fonction d’analyse de texte de Varada est facilement déployée dans le propre environnement de l’organisation, de sorte que les données ne sont pas dupliquées et ne partent jamais. De plus, il intègre toutes les données de n’importe quelle source sans modélisation, ce qui signifie que les équipes de données obtiennent un «temps de mise sur le marché nul» avec des résultats à la fois complets et précis. La technologie d’indexation dynamique et adaptative de Varada permet aux charges de travail d’analyse de texte de s’exécuter à un temps de réponse de latence proche de zéro, en particulier sur les requêtes sensibles à la latence.

«L’analyse de texte a évolué des solutions sur site aux solutions basées sur le cloud», a déclaré Eran Vanounou, PDG de Varada. «Ces approches étaient innovantes lors de leur introduction, mais elles sont devenues complexes et coûteuses, en particulier compte tenu du large éventail de plates-formes et de piles d’analyse. Chez Varada, nous introduisons la nouvelle ère de l’analyse de texte avec une solution qui s’exécute directement au-dessus du lac de données du client et aux côtés d’autres charges de travail d’analyse. Pour la première fois, les utilisateurs peuvent déployer une solution d’analyse de texte sans avoir à déplacer des données vers des systèmes coûteux et des schémas de données complexes et propriétaires. »

Les défis de l’analyse de texte sont mieux relevés sur le lac de données

Alors que le volume des applications d’analyse de données et de texte augmente de manière exponentielle, les équipes de données sont de plus en plus mises au défi d’optimiser les coûts et les performances. L’analyse de texte à grande échelle nécessite des optimisations personnalisées pour la fonction LIKE% text% et RegExps, ce qui aboutit souvent à se tourner vers des silos de données disparates spécialisés dans le texte.

«Le plus souvent, les entreprises utilisent des solutions d’analyse de texte complexes et haut de gamme pour la recherche de texte SQL simple, telles que les fonctions« préfixe »,« suffixe »et« contient »», explique Ori Reshef, vice-président des produits de Varada. «Il n’est pas nécessaire de créer et de maintenir une solution d’analyse de texte autonome qui surindexera chaque chaîne et qui coûtera cher à la fois en termes de licence et de maintenance. Un exemple ici serait les n-grammes. Avec Varada, qui intègre l’index Lucene dans notre moteur d’accélération de requête de lac de données, nous utilisons une indexation minimale pour faire le travail. »

*** En savoir plus sur l’utilisation de Varada pour l’analyse de texte sur le lac de données. ***

Technologie d’indexation adaptative de Varada

La technologie d’indexation adaptative et autonome de Varada exploite les capacités d’apprentissage automatique pour accélérer de manière dynamique les requêtes afin de répondre aux besoins évolutifs de l’entreprise. Varada indexe les données directement à partir du lac de données sur toutes les colonnes. En fonction du type de données, de la structure et de la distribution des données, Varada crée automatiquement un index optimal à partir d’un ensemble d’algorithmes d’indexation comprenant une recherche et un index optimisés pour le texte (basés sur Apache Lucene) ainsi que des bitmaps, des dictionnaires, des arbres, etc. s’adaptent également aux changements des données au fil du temps, ce qui est essentiel pour une détection efficace des anomalies analytiques sur de vastes ensembles de données.

Le moteur intelligent de Varada détecte automatiquement les goulots d’étranglement et ajuste les techniques de cluster et d’accélération pour garantir que les exigences de l’entreprise sont respectées dans le budget alloué. Les principales caractéristiques comprennent:

Fonctionne au sommet du lac de données client, permettant d’accéder à de nouvelles données dès qu’elles deviennent disponibles.
Fonctionne directement sur les données de comportement brutes, sans avoir besoin de modéliser les données pour améliorer les performances; toute nouvelle donnée peut être analysée immédiatement avec zéro time-to-insights, ce qui donne des résultats rapides sans perdre toute la dimensionnalité des données
Surveille en permanence les requêtes pour identifier les données utilisées et comment elles sont utilisées par les charges de travail; cette observabilité critique est ensuite exploitée pour accélérer dynamiquement et automatiquement les charges de travail d’analyse de texte avec une indexation adaptative et une mise en cache des données ou des résultats intermédiaires
Complètement découplé de la couche de stockage et peut facilement évoluer pour répondre à une demande fluctuante
Fournit aux équipes de données un contrôle total pour hiérarchiser les projets d’analyse, définir les budgets et les exigences de performance

À propos de Varada

La mission de Varada est de permettre aux spécialistes des données d’aller au-delà des limites traditionnelles imposées par l’infrastructure de données et de se concentrer plutôt sur les données et les réponses dont ils ont besoin, avec un contrôle total des performances, des coûts et de la flexibilité. Dans le monde du Big Data de Varada, chaque requête peut trouver son plan optimal, sans préparation préalable et sans goulot d’étranglement, offrant des performances constantes à une échelle de pétaoctets. Varada a été fondée par des vétérans de l’équipe principale de Dell EMC XtremIO et se consacre à tirer parti de l’architecture du lac de données pour relever le défi de l’agilité des données et de l’entreprise. Varada a été reconnu dans le rapport Cool Vendors in Data Management de Gartner, Inc. Pour plus d’informations, visitez : https://varada.io/