79
pages
Français
Documents
Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres
79
pages
Français
Documents
Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres
Université de Bourgogne
DESS informatique
EXTRACTION DE
CONNAISSANCES
Année universitaire 2004-20051. THéMATIQUE DU COURS
1.1. PRIME DéFINITION.............................................................................. 1
1.2. DE L'INFORMATIQUE DE PRODUCTION à
L'INFORMATIQUE DéCISIONNELLE....................................................... 1
1.2.1. Rationnalisation des traitements informatiques............................. 2
1.2.2. Mise en place d'infocentres........................... 2
1.2.3. Émergence de l'informatique de décision...................................... 2
1.3. DES DONNéES BRUTES AUX INFORMATIONS UTILES
INTERPRéTéES............................................................................................. 3
1.3.1. Données....................... 3
1.3.2. Connaissances.............................................................................. 3
1.3.3. Extraction de connaissances......................... 3
1.4. FONCTIONNALITéS EXTERNES........................................................ 3
1.4.1. Classification................................................ 4
1.4.2. Estimation..................... 4
1.4.3. Prédiction................................ 4
1.4.4. Association (analyse du panier de la ménagère)............................ 4
1.4.5. Interprétation ................................................ 5
1.4.6. Révélation..................................................... 5
1.4.7. Regroupement.............. 5
1.5. FONCTIONNALITéS INTERNES......................... 5
1.6. EXEMPLES DE DOMAINES D'APPLICATION.................................. 6
1.7. PROCESSUS DE DATA MINING........................................................ 7
1.7.1. Poser le problème......................................................................... 7
1.7.2. Recherche des données. 8
1.7.3. “Enrôlement” des données.......................................................... 8
1.7.4. Nettoyage des données................................. 8
1.7.5. Modification des données............................. 8
1.7.6. Extraction proprement dite............................................................ 8
1.7.7. Évaluation des résultats................................. 8
1.7.8. Intégration de la connaissance...................... 9
- I -2. EXTRACTION D’ASSOCIATIONS
2.1. IMPLICATIONS (NIVEAU VALEURS) ............................................... 9
2.1.1. Table de contingence de deux variables........ 9
2.1.2. Utilisation des tables de contingence............ 9
2.1.3. Définitions.................................................................................... 9
2.1.3.1. Confiance..... 10
2.1.3.2. Support........ 10
2.1.4. Rôle de la confiance et du support.............................................. 10
2.1.5. Exemple...................................................... 10
2.1.6. Limites de l’approche................................................................. 12
2.2. DéPENDANCE (NIVEAU ATTRIBUTS)............ 12
2.2.1. Dépendances fonctionnelles ....................................................... 12
2.2.2. Déterminations ........................................... 12
2.2.3. Expression générale de la relation de détermination.................... 13
2.2.4. Exemple...................................................... 13
2.2.5. Utilité des déterminations........................... 14
3. DISTANCE
3.1. DISTANCE............................................................................................ 16
3.1.1. Distance entre valeurs................................. 16
3.1.2. Distance globale ......................................... 17
3.1.3. Propriétés de la distance............................. 17
3.2. RESSEMBLANCE / SIMILITUDE...................................................... 17
3.2.1. Définition qualitative de la ressemblance .................................... 17
3.2.2. Mesure de la ressemblance entre valeurs.... 18
3.2.3. Mesure de la ressemblance globale entre objets.......................... 18
3.2.4. Calcul du meilleur couple sans calcul d’une ressemblance
globale.................................................................................................. 19
3.3. JUGEMENT DE LA RESSEMBLANCE............. 19
3.3.1. Ressemblance absolue 19
3.3.2. Ressemblance relative................................................................. 20
3.4. TECHNIQUES DE REGROUPEMENT.............. 20
3.4.1. K-moyennes............................................................................... 20
- II -3.4.2. Voisinage dense.......................................................................... 21
3.4.3. Agglomération............ 22
3.5. RECHERCHE D'INFORMATION PAR RESSEMBLANCE.............. 23
3.5.1. Quand les recherches impératives sont inadéquates.................... 23
3.5.1.1. Exemples...................................................................... 24
3.5.2. Exemple des Bases de Données textuelles.. 24
3.5.3. Exemple d'une base de données d'images... 24
4. APPRENTISSAGE ET OUTILS VOISINS
4.1. DéFINITIONS PRéLIMINAIRES........................................................ 25
4.1.1. Espace de description, descripteur, exemples positifs,
négatifs, propriétés................................................ 25
4.1.2. Objet concret / abstrait................................................................ 25
4.1.3. Description d'un objet. 25
4.1.4. Concept / classe.......... 26
4.1.5. Définition intensive ou intension ................................................ 26
4.1.6. Définition extensive ou extension............... 26
4.2. LES TROIS FAMILLES DE RAISONNEMENTS HUMAINS.......... 26
4.2.1. Fiabilité d'un raisonnement......................................................... 27
4.2.1.1. Validité......................................................................... 27
4.2.1.2. Pertinence..... 28
4.2.2. Rôle informatique des différents raisonnements......................... 29
4.2.2.1. Preuve, Argumentation ................................................. 29
4.2.2.2. Heuristique................................... 29
4.2.2.3. Créativité, imagination.................. 29
4.2.2.4. fi Transfert de niveau de connaissances....................... 29
4.2.3. Le raisonnement étalon : la déduction......................................... 30
4.2.3.1. Sémantique de la déduction.......... 30
4.2.3.2. Règles d'inférence ........................................................ 31
Modus Ponens............................ 31
Modus Tollens 31
4.2.4. Le raisonnement analogique ....................................................... 31
4.2.4.1. Inférence analogique.................... 31
4.2.4.2. Quand l’analogie devient valide.................................... 32
Dépendance forte......................................................... 32
Relation de détermination............ 32
- III -Détermination et dépendance fonctionnelle.................. 33
4.2.4.3. Qualité du raisonnement analogique............................. 34
Qualité de la validité..................................................... 34
Possibilité d’utiliser les relations de
détermination............................... 34
4.2.5. Le raisonnement inductif ............................................................ 36
4.2.5.1. Induction abductive...................... 36
Inférence...................................... 36
Qualité......................................... 36
4.2.5.2. Induction par généralisation......... 37
Inférence...................................... 37
Qualité......................................... 38
4.2.5.3. Induction par orientation des concepts ......................... 38
Inférence...................................... 38
Qualité......................................... 38
4.3. TYPES D'APPRENTISSAGES............................. 38
4.3.1. Apprentissage non supervisé ..................................................... 38
4.3.2. Apprentissage supervisé 39
4.3.3. Apprentissage semi-supervisé (par renforcement) ...................... 39
4.3.4. Apprentissage à partir d'exemples............................................... 39
4.3.4.1. Hypothèse de l'apprentissage à partir
d'exemples................................................. 39
4.3.4.2. Paradigme de l'apprentissage à partir
d'exemples................................................. 39
4.3.5. Apprentissage incrémental.......................... 40
4.3.6. Apprentissage à partir d'un nombre réduit d'exemples................ 41
4.3.6.1. Exemple ....................................................................... 41
Théorie du monde........................ 41
Définition du concept but............ 42
Description de l'exemple.............................................. 42
Critère d'opérationalité................. 42
Preuve...................