• À propos
  • Formations
  • Blog
Avez- vous une question?
contact@jafwin.com
Suivez-nous sur Youtube
JAFWIN
  • À propos
  • Formations
  • Blog

Data Science

  • Home
  • Blog
  • Data Science
  • L’essentiel à savoir sur le Sous-Apprentissage et Sur-Apprentissage​ en Data Science

L’essentiel à savoir sur le Sous-Apprentissage et Sur-Apprentissage​ en Data Science

  • Posted by Jonas Agbakou
  • Categories Data Science, Deep Learning, Le Big Data, Machine Learning
  • Date 24 juillet 2022
  • Comments 0 comment

Le Sous-Apprentissage et le Sur-Apprentissage sont deux concepts majeurs de l’appren-
tissage automatique. Ces termes définissent la capacité d’un modèle à prédire les données.
Par ailleurs, le Sous-Apprentissage et le Sur-Apprentissage sont les causes principales des
mauvaises performances des modèles prédictifs générés par les algorithmes d’apprentissage
automatique. Dans cet article, je vous explique l’éssentiel à savoir sur le  Sous-Apprentissage et le Sur-Apprentissage.

Sous-Apprentissage

Un modèle peut générer des prédictions précises avec des données d’apprentissages et
s’adapte mal aux données de tests. Ainsi, le modèle ne se généralisera pas bien sur des nou-
velles données, c’est-à-dire les données qu’il n’a pas encore vu parce qu’il est incapable de
capturer les modèles complexes dans les données. Par conséquent, le modèle ne produira pas
de résultats précis et ne sera d’aucune utilité. Afin d’éviter ce problème, la meilleure stratégie
consiste à augmenter la complexité du modèle en augmentant le nombre de paramètres du modèle d’apprentissage. La technique de la validation croisée est aussi une bonne solution pour obtenir un modèle qui possède un bon compromis entre le biais et la variance.

Sur-Apprentissage

Le Sur-Apprentissage est simplement l’opposé du Sous-Apprentissage. Cela signifie qu’en
plus d’apprendre les données et d’extraire le modèle, le modèle apprend plus que sa capacité.
Cette condition indique que les données vont capter du bruit, ce qui conduit au problème de
généralisation du modèle pour les nouvelles données. Le bruit est constitué de données non
pertinentes qui affectent la sortie de la prédiction lors de la rencontre de nouvelles données. En d’autres termes, ce type de modèle conduit à de mauvaises performances car, trop complexe, il manque de capacité de généralisation. La régularisation est couramment utilisée pour limiter le « Sur-Apprentissage » et permettant ainsi de contrôler l’erreur de type variance pour aboutir à de meilleures performances.

Cliquez ici pour vous abonner à notre chaîne Youtube
Formation sur la Data Science: RAPIDMINER

Partagez l'article à vos réseaux: on Twitter on Facebook on Google+ on LinkedIn

  • Share:
author avatar
Jonas Agbakou

Je suis Jonas Agbakou, un amoureux et professionnel de la Data Science. J’aime partager plus efficacement mes expériences et donc permettre à ceux qui ont soif de connaissance et souhaiteraient découvrir de nouvelles choses de bien approfondir leurs compétences.

Previous post

Clustering K-means expliqué pour les nuls
24 juillet 2022

Next post

Techniques de validation en machine learning
30 juillet 2022

You may also like

Docker_pour_la_Data_Science
Docker pour tout Data scientist
6 août, 2022
no_select_on_db_prod
𝐏𝐨𝐮𝐫𝐪𝐮𝐨𝐢 vous 𝐧𝐞 𝐝evez 𝐣𝐚𝐦𝐚𝐢𝐬 𝐟𝐚𝐢𝐫𝐞 𝐮𝐧 𝐬𝐞𝐥𝐞𝐜𝐭 𝐬𝐮𝐫 𝐮𝐧𝐞 𝐛𝐚𝐬𝐞 𝐝𝐞 𝐝𝐨𝐧𝐧é𝐞 𝐝𝐞 𝐏𝐫𝐨𝐝𝐮𝐜𝐭𝐢𝐨𝐧
31 juillet, 2022
Techniques_de_validations_en_machine_learning
Techniques de validation en machine learning
30 juillet, 2022

Leave A Reply Annuler la réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Catégories

  • Business Intelligence
  • Commerce électronique
  • Data Science
  • Deep Learning
  • Développement Informatique
  • Forensique informatique
  • Le Big Data
  • Machine Learning
  • Sécurité Informatique

Articles récents

Docker pour tout Data scientist
06Août2022
𝐏𝐨𝐮𝐫𝐪𝐮𝐨𝐢 vous 𝐧𝐞 𝐝evez 𝐣𝐚𝐦𝐚𝐢𝐬 𝐟𝐚𝐢𝐫𝐞 𝐮𝐧 𝐬𝐞𝐥𝐞𝐜𝐭 𝐬𝐮𝐫 𝐮𝐧𝐞 𝐛𝐚𝐬𝐞 𝐝𝐞 𝐝𝐨𝐧𝐧é𝐞 𝐝𝐞 𝐏𝐫𝐨𝐝𝐮𝐜𝐭𝐢𝐨𝐧
31Juil2022
Techniques de validation en machine learning
30Juil2022

Articles récents

Top 8 des outils de forensique informatique
Jonas Agbakou
26 avril 2019

Top 8 des outils de forensique informatique

Tout savoir sur le fonctionnement d’Amazon Publishing pour se faire d’argent.
Jonas Agbakou
10 novembre 2018

Tout savoir sur le fonctionnement d’Amazon Publishing pour se faire d’argent.

Docker  pour tout Data scientist
Jonas Agbakou
6 août 2022

Docker pour tout Data scientist

Top 5 des outils les plus utilisés en Data Mining
Jonas Agbakou
14 janvier 2019

Top 5 des outils les plus utilisés en Data Mining

Tout savoir sur la technologie OLAP
Jonas Agbakou
2 mars 2019

Tout savoir sur la technologie OLAP

Différence entre Data Warehouse et Datamart
Jonas Agbakou
3 février 2019

Différence entre Data Warehouse et Datamart

NE RATEZ PAS NOS COURS ET ASTUCES, C’EST GRATUIT

loader

Prénom

Adresse courriel*

Plateforme de formation en Data Science

INFORMATIONS

  • Contact
  • À propos

Liens utils

  • Articles gratuits

Suivez-nous

Copyright © 2022 JAFWIN . Tous les droits sont réservés

Voulez-vous devenir un Data Scientist?

Rejoignez nos milliers apprenants et faire évoluer votre carrière professionnelle facilement!

Commencer maintenant

Prove your Humanity: − =

Forgot your password?

Lost your password? Please enter your email address. You will receive mail with link to set new password.

Prove your Humanity: + =

Back to login

Follow via Facebook Follow via Linkedin Follow via Youtube