Des chercheurs ont développé un nouveau modèle pour un filtrage plus efficace des spams

Les spams sont quelque chose que nous méprisons tous. En plus d’être bombardés de messages non pertinents, ils peuvent contenir des logiciels malveillants et contenu de phishing pouvant causer des dommages à toi. Les filtres anti-spam jouent un rôle essentiel pour vous en protéger.

Les modèles de détecteur de spam peuvent détecter automatiquement le spam, mais nous devons les entraîner sur de grands ensembles de données de messagerie et les étiqueter manuellement. C’est ce que les chercheurs du Sinhgad Institute of Technology Lonavala en Inde espèrent aborder. »La détection du spam est essentielle car elle peut garantir la justice pour les vendeurs et conserver la confiance de l’acheteur sur les boutiques en ligne », a déclaré Vikas Samarthrao Kadam, l’un des chercheurs impliqués dans l’étude publiée dans l’International Journal of Intelligent Robotics and Applications.

« Contrairement à d’autres méthodes, cela améliore la vitesse d’entraînement et l’efficacité de la classification. Notre modèle pourrait améliorer la qualité de vie des personnes qui reçoivent de grandes quantités d’e-mails, leur permettant de parcourir leurs e-mails de manière fluide et d’utiliser leurs comptes uniquement aux fins souhaitées.

» L’équipe a développé un modèle basé sur une sélection de fonctionnalités à objectifs multiples. et un réseau de capsules adaptatives, et l’ont formé sur des ensembles de données d’images et de textes. Ce modèle utilisant la technique d’apprentissage en profondeur est censé offrir une mise en œuvre facile et peut être formé rapidement en peu de temps.

Kadam a déclaré que leurs évaluations initiales montrent que le nouveau modèle possède une plus grande précision que les autres méthodes existantes. L’équipe a noté que cela peut aider à améliorer la sécurité des utilisateurs et les aider à parcourir plus facilement et plus facilement les e-mails non pertinents. « Notre modèle réduit également les vitesses de formation et conduit à une plus grande efficacité de classification », a déclaré Kadam dans une interview avec TechXplore.

« Contrairement à d’autres modèles, il augmente le taux de convergence de la détection des spams, obtenant de meilleurs résultats. » D’autre part, le groupe a déclaré que le modèle doit encore être développé pour garantir une efficacité maximale en termes de vitesse et de précision. Une fois prête, la technique de filtrage des spams peut néanmoins être utilisée à grande échelle, y compris sur Gmail, Yahoo Mail et Outlook.

« La sécurité des systèmes de détection et de filtrage des spams est cruciale pour obtenir une meilleure précision et des résultats fiables, ce qui peut être amélioré à l’avenir en utilisant l’apprentissage d’ensemble », a déclaré Kadam. « Le taux de faux positifs de nombreux modèles est encore plus élevé que nécessaire, mais il devrait être réduit à la plus petite valeur possible à l’avenir. La classification des spams en temps réel est indispensable, car la plupart des modèles proposés ne fonctionnent pas bien avec des données en temps réel… Presque tous les chercheurs présentent leurs résultats en fonction de l’exactitude, de la précision et du rappel de leurs modèles, mais nous pensons que le temps la complexité des modèles d’apprentissage automatique doit également être considérée comme une mesure d’évaluation », a déclaré Kadam.

« Certains chercheurs montrent des résultats prometteurs dans le processus d’extraction de caractéristiques à l’aide d’un sac de mots, car ils affirment que l’en-tête de l’e-mail est aussi important pour la détection du spam que le contenu du corps. Ainsi, l’extraction approfondie des caractéristiques de la ligne d’en-tête pourrait également être envisagée à l’avenir.