Top 7 des sources d'ensembles de données gratuites à utiliser pour les projets de science des données

Sources d’ensembles de données gratuites pour les passionnés de science des données

Il utilise également divers outils tels que Apache Spark Data.gov possède diverses variétés d’ensembles de données relatives au climat, à l’agriculture, à l’énergie, aux océans et aux écosystèmes. KaggleKaggle possède plus de 23 000 ensembles de données publics qui peuvent être téléchargés gratuitement. Vous pouvez facilement rechercher l’ensemble de données que vous recherchez et les trouver sans tracas, allant de la santé aux dessins animés. La plate-forme vous permet également de créer de nouveaux ensembles de données publics et peut également gagner des médailles ainsi que des titres tels que Expert, Master et Grandmaster. Les ensembles de données Kaggle concurrentiels sont plus détaillés que les ensembles de données publics. Kaggle est l’endroit idéal pour les amateurs de science des données. Référentiel UCI Machine Learning Si vous recherchez des ensembles de données intéressants, le référentiel UCI Machine Learning est l’endroit idéal pour vous. C’est l’une des premières et des plus anciennes sources de données disponibles sur Internet depuis 1987. Les ensembles de données de l’UCI sont parfaits pour l’apprentissage automatique avec leurs options d’accès et de téléchargement faciles. La plupart des ensembles de données de l’UCI sont fournis par différents utilisateurs, la propreté des données est donc un peu faible. Mais UCI maintient les ensembles de données pour les utiliser pour les algorithmes ML. Observatoire de la santé mondiale Si vous avez une formation médicale, l’Observatoire de la santé mondiale est une excellente option pour créer des projets sur les systèmes de santé et les maladies mondiales. L’OMS a rendu toutes ses données publiques sur cette plateforme. C’est pour les informations de santé de bonne qualité disponibles dans le monde entier. Les données de santé sont caractérisées selon diverses maladies transmissibles et non transmissibles, santé mentale, moralité, médicaments pour un meilleur accès. EarthdataSi vous recherchez des données liées à la Terre ou à l’Espace, Earthdata est fait pour vous. Ceci est créé par la NASA pour fournir des ensembles de données basés sur l’atmosphère terrestre, les océans, la cryosphère, les éruptions solaires et la tectonique. Il fait partie du système de données et d’information du système d’observation de la Terre qui aide à collecter et à traiter les données de divers satellites, avions et champs de la NASA. Earthdata dispose également d’outils pour gérer, ordonner, rechercher, cartographier et visualiser les données.

Partagez cet article

Faire le partage