• À propos
  • Formations
  • Blog
Avez- vous une question?
contact@jafwin.com
Suivez-nous sur Youtube
JAFWIN
  • À propos
  • Formations
  • Blog

Data Science

  • Home
  • Blog
  • Data Science
  • Techniques de validation en machine learning

Techniques de validation en machine learning

  • Posted by Jonas Agbakou
  • Categories Data Science
  • Date 30 juillet 2022
  • Comments 0 comment

Après avoir entraîné un modèle de machine learning sur des données étiquetées,
celui-ci est supposé fonctionner sur de nouvelles données. Toutefois, il est important de s’as-
surer de l’exactitude des prédictions du modèle en production. Pour ce faire, il est nécessaire
de valider le modèle.

Afin de valider les performances d’un modèle de machine learning, il est nécessaire de le tester sur de nouvelles données. En fonction des performances des modèles sur des données inconnues, on peut déterminer s’il est sous-ajusté, sur-ajusté, ou ”
bien généralisé “.

Deux techniques de validation que vous devez absolument connaître en tant que Data Scientist

En machine learning, il existe plusieurs techniques de validation dont les deux principales sont la validation croisée et la validation non-croisée également connue sous l’expression anglaise holdout
method.

La validation non-croisée

Pour ce qui est de la validation non-croisée, elle consiste à diviser l’ensemble de données
aléatoirement en deux sous-ensembles disjoints : un ensemble de données d’apprentissage
(généralement supérieur à 60) et un ensemble de données de test correspondant à la portion
restante. Le modèle est entraîné avec l’ensemble de données d’apprentissage et puis il est
validé sur sa performance avec l’ensemble de données de test.

La validation croisée consiste

La validation croisée consiste à diviser aléatoirement l’ensemble de données en k plis
(fold) égaux de données ayant une représentation similaire des classes. Ensuite, le modèle est
entraîné avec k-1 plis et puis validé avec le pli restant. Ce processus est répété jusqu’à ce
que tous les plis ont été utilisés comme données de validation. Le classifieur est validé sur la
performance moyenne des modèles des diverses itérations.

Cliquez ici pour vous abonner à ma chaîne YouTube
Formation en Data science : RAPIDMINER
Formation en programmation : PYTHON

Partagez l'article à vos réseaux: on Twitter on Facebook on Google+ on LinkedIn

  • Share:
author avatar
Jonas Agbakou

Je suis Jonas Agbakou, un amoureux et professionnel de la Data Science. J’aime partager plus efficacement mes expériences et donc permettre à ceux qui ont soif de connaissance et souhaiteraient découvrir de nouvelles choses de bien approfondir leurs compétences.

Previous post

L'essentiel à savoir sur le Sous-Apprentissage et Sur-Apprentissage​ en Data Science
30 juillet 2022

Next post

𝐏𝐨𝐮𝐫𝐪𝐮𝐨𝐢 vous 𝐧𝐞 𝐝evez 𝐣𝐚𝐦𝐚𝐢𝐬 𝐟𝐚𝐢𝐫𝐞 𝐮𝐧 𝐬𝐞𝐥𝐞𝐜𝐭 𝐬𝐮𝐫 𝐮𝐧𝐞 𝐛𝐚𝐬𝐞 𝐝𝐞 𝐝𝐨𝐧𝐧é𝐞 𝐝𝐞 𝐏𝐫𝐨𝐝𝐮𝐜𝐭𝐢𝐨𝐧
31 juillet 2022

You may also like

Docker_pour_la_Data_Science
Docker pour tout Data scientist
6 août, 2022
no_select_on_db_prod
𝐏𝐨𝐮𝐫𝐪𝐮𝐨𝐢 vous 𝐧𝐞 𝐝evez 𝐣𝐚𝐦𝐚𝐢𝐬 𝐟𝐚𝐢𝐫𝐞 𝐮𝐧 𝐬𝐞𝐥𝐞𝐜𝐭 𝐬𝐮𝐫 𝐮𝐧𝐞 𝐛𝐚𝐬𝐞 𝐝𝐞 𝐝𝐨𝐧𝐧é𝐞 𝐝𝐞 𝐏𝐫𝐨𝐝𝐮𝐜𝐭𝐢𝐨𝐧
31 juillet, 2022
Overfitting and Underfitting
L’essentiel à savoir sur le Sous-Apprentissage et Sur-Apprentissage​ en Data Science
24 juillet, 2022

Leave A Reply Annuler la réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Catégories

  • Business Intelligence
  • Commerce électronique
  • Data Science
  • Deep Learning
  • Développement Informatique
  • Forensique informatique
  • Le Big Data
  • Machine Learning
  • Sécurité Informatique

Articles récents

Docker pour tout Data scientist
06Août2022
𝐏𝐨𝐮𝐫𝐪𝐮𝐨𝐢 vous 𝐧𝐞 𝐝evez 𝐣𝐚𝐦𝐚𝐢𝐬 𝐟𝐚𝐢𝐫𝐞 𝐮𝐧 𝐬𝐞𝐥𝐞𝐜𝐭 𝐬𝐮𝐫 𝐮𝐧𝐞 𝐛𝐚𝐬𝐞 𝐝𝐞 𝐝𝐨𝐧𝐧é𝐞 𝐝𝐞 𝐏𝐫𝐨𝐝𝐮𝐜𝐭𝐢𝐨𝐧
31Juil2022
Techniques de validation en machine learning
30Juil2022

Articles récents

Top 8 des outils de forensique informatique
Jonas Agbakou
26 avril 2019

Top 8 des outils de forensique informatique

Tout savoir sur le fonctionnement d’Amazon Publishing pour se faire d’argent.
Jonas Agbakou
10 novembre 2018

Tout savoir sur le fonctionnement d’Amazon Publishing pour se faire d’argent.

Docker  pour tout Data scientist
Jonas Agbakou
6 août 2022

Docker pour tout Data scientist

Top 5 des outils les plus utilisés en Data Mining
Jonas Agbakou
14 janvier 2019

Top 5 des outils les plus utilisés en Data Mining

Tout savoir sur la technologie OLAP
Jonas Agbakou
2 mars 2019

Tout savoir sur la technologie OLAP

Différence entre Data Warehouse et Datamart
Jonas Agbakou
3 février 2019

Différence entre Data Warehouse et Datamart

NE RATEZ PAS NOS COURS ET ASTUCES, C’EST GRATUIT

loader

Prénom

Adresse courriel*

Plateforme de formation en Data Science

INFORMATIONS

  • Contact
  • À propos

Liens utils

  • Articles gratuits

Suivez-nous

Copyright © 2022 JAFWIN . Tous les droits sont réservés

Voulez-vous devenir un Data Scientist?

Rejoignez nos milliers apprenants et faire évoluer votre carrière professionnelle facilement!

Commencer maintenant

Prove your Humanity: + =

Forgot your password?

Lost your password? Please enter your email address. You will receive mail with link to set new password.

Prove your Humanity: + =

Back to login

Follow via Facebook Follow via Linkedin Follow via Youtube