Les moteurs de recherche manquent de sites infectés, ce qui met les entreprises en danger

‘non malveillant’  : 1}) df = df.drop_duplicates(keep=False) X, y = df.drop(« Label », axe=1), df[« Label »]

X_train, X_test, y_train, y_test= train_test_split(X,y, test_size=0.2, random_state=42) Nous sommes maintenant prêts à construire nos modèles. Nous allons utiliser un modèle de régression logistique simple  :lr_model = LogisticRegression(max_iter=1,000) lr_model.fit(X_train, y_train) Nous pouvons maintenant évaluer les performances de notre modèle sur l’ensemble de test  :lr_model.score(X_test, y_test) y_pred = lr_model.predict(X_test) print(accuracy_score(y_test, y_pred)) print(‘ROC-AUC score’, roc_auc_score(y_test,y_pred)) print(‘Confusion matrix :n ‘, confusion_matrix(y_test, y_pred)) Exécution de ce code nous donne la sortie suivante  : 0,9864864864864865 Score ROC-AUC 0,9705882352941176 Matrice de confusion  :

[[57 0]

[ 1 16]]En fin de compte, nous avons réussi à créer un modèle précis avec à la fois une précision et un rappel élevés. Pas mal ! Bien sûr, il ne s’agit que d’une preuve de concept, car la situation réelle est d’un ordre de grandeur plus complexe. À grande échelle, les systèmes d’IA formés au Big Data peuvent faire une réelle différence dans la lutte contre les logiciels malveillants.