ImageMAKER annonce une détection de quasi-duplication intégrant le moteur dtSearch®

– Spécialiste des solutions d'imagerie de documents et de découverte électronique, ImageMAKER commercialisera désormais sa détection de quasi-duplication en tant que composant distinct intégrant le moteur dtSearch. dtSearch offre la récupération de texte pour les entreprises et les développeurs (y compris le moteur dtSearch) pour rechercher instantanément des téraoctets de données en ligne et hors ligne. ImageMAKER intègre son système de détection de quasi-duplication dans son assistant de découverte phare, ainsi que les filtres de documents et la recherche intégrés du moteur dtSearch.

La technologie de déduplication identifie généralement les documents et les e-mails qui sont des doublons exacts à l'aide de critères tels que la comparaison des valeurs de hachage. En revanche, la détection de quasi-duplication d'ImageMAKER peut identifier les documents et les e-mails qui ont des phrases ou un contenu contextuellement similaires, mais qui ne correspondent pas exactement. La capacité de détecter les quasi-doublons rationalise considérablement les processus tels que l'eDiscovery, d'autres revues de données telles que la Freedom of Information Act (« FOIA »), les systèmes d'archivage et la gestion des documents.

ImageMAKER annonce une détection de quasi-duplication intégrant le moteur dtSearch®

Les fonctionnalités de la détection de quasi-duplication incluent la possibilité de lier séquentiellement plusieurs versions de documents ainsi que la capacité de sortie en pourcentage de similitude entre des documents similaires. En utilisant les filtres de documents dtSearch Engine et la propre technologie d'ImageMAKER, la détection de quasi-duplication peut même détecter la similitude de fichiers entièrement imbriqués dans d'autres documents. Par exemple, la détection de quasi-duplication peut trouver 87% du document A contenu dans le document B et 93% du document B contenu dans le document C.

La détection de quasi-duplication comprend également un outil de comparaison visuelle qui produit des documents au format HTML et peut mettre en évidence les différences de phrase dans différentes couleurs pour une révision facile. La comparaison visuelle fonctionne à la fois localement ou dans des environnements Web partagés pour permettre aux utilisateurs finaux de comparer des documents de manière transparente.

« ImageMAKER a choisi le moteur dtSearch pour une utilisation dans Discovery Assistant en raison de sa technologie de recherche leader sur le marché, y compris sa capacité à exploiter les métadonnées pour garantir des résultats de recherche réussis et rapides dans la recherche à facettes », déclare Ken Davies, président d'ImageMAKER. « Les clients nous disent que la technologie de recherche intégrée est une » bouée de sauvetage « . »

« La détection de quasi-doublons intègre également le moteur dtSearch », poursuit Davies. « En tant que produit autonome, la détection de quasi-doublons s'appuiera sur la vitesse de recherche robuste et extrêmement rapide du moteur de recherche dtSearch pour fournir des temps de réponse exceptionnels dans l'identification des correspondances de fichiers fermés sur des téraoctets de données. »

Le composant de développement principal de dtSearch, le moteur dtSearch, peut rechercher instantanément des téraoctets de documents mixtes, des e-mails, des pièces jointes imbriquées, des bases de données et des données en ligne avec plus de 25 options de recherche différentes. Le moteur dtSearch possède ses propres filtres de documents propriétaires pour l'analyse, l'extraction, la conversion et l'affichage des données (y compris avec les résultats en surbrillance). Le SDK dtSearch Engine offre ces fonctionnalités via les API C ++, Java et .NET / .NET Core aux développeurs Windows, Mac et Linux, aussi bien pour les applications « sur site » que pour les plates-formes en ligne telles que Microsoft Azure et Amazon Web Services (AWS ).

À propos d'IMAGEMaker,dtSearch.com

Le choix intelligent pour la récupération de texte® depuis 1991, la gamme de produits dtSearch recherche instantanément des téraoctets de texte. Parallèlement à la récupération de texte pour les entreprises et les développeurs, la société dispose de ses propres filtres de documents, offrant l'analyse, l'extraction, la conversion et la recherche d'un large éventail de formats de données. Les types de données pris en charge comprennent les bases de données, les données de sites Web, les formats « Office » populaires, les formats de compression et les e-mails avec pièces jointes. Les produits dtSearch répondent à certains des besoins de recherche de texte de plus grande capacité au monde. La société a des distributeurs dans le monde entier avec une couverture sur six continents ainsi que des copies d'évaluation entièrement fonctionnelles.

Contact médias: Daria Newell

SSPR

719-345-2889

[email protected]

SOURCE dtSearch

/dtSearch.com