Introducere in descoperirea cunostintelor - data mining

                                   Cuprins
        |1. INTRODUCERE                                                          |2  |
|    |1.1 Necesitatea apariţiei unei noi tehnologii de manipulare a      |2  |
|    |datelor                                                            |   |
|    |1.2 Posibilitãţi oferite de tehnicile data mining                  |3  |
|    |1.3 Tehnicile data mining şi depozitarea datelor                   |4  |
|    |1.4 Data mining şi OLAP                                            |5  |
|    |1.5 Data mining, învãţarea automatelor şi statistica               |6  |
|    |1.6 Data mining şi tendinţele hardware şi software                 |7  |
|    |1.7 Aplicaţii ale tehnicilor data mining                           |7  |
|    |1.8 Succesul în data mining                                        |8  |
|2. DESCRIEREA DATELOR PENTRU DATA MINING                                |9  |
|    |2.1 Sumarizare şi vizualizare                                      |9  |
|    |2.2 Clustering                                                     |10 |
|    |       |2.2.1    Definiţie şi exemple de clustering               |10 |
|    |       |2.2.2    Mãsurarea distanţelor                            |11 |
|    |       |2.2.3    Clasificarea algoritmilor de clustering          |13 |
|    |       |2.2.4    Algoritmul K-means                               |13 |
|    |       |2.2.5    Algoritmul BFR                                   |15 |
|    |       |2.2.6    Fastmap                                          |19 |
|    |       |2.2.7    Clustering ierarhic                              |21 |
|    |       |2.2.8    Algoritmul GRGPF                                 |21 |
|    |       |2.2.9    Algoritmul CURE                                  |24 |
|    |2.3 Analiza legãturilor                                            |26 |
|3. Modele şi algoritmi data mining                                      |29 |
|    |3.1 Data mining predictiv                                          |29 |
|    |       |3.1.1    O ierarhie a alegerilor                          |29 |
|    |       |3.1.2    Terminologie                                     |30 |
|    |       |3.1.3    Clasificare                                      |30 |
|    |       |3.1.4    Regresii                                         |31 |
|    |       |3.1.5    Şiruri temporale                                 |31 |
|    |3.2 Modele data mining                                             |31 |
|    |       |3.2.1    Introducere                                      |31 |
|    |       |3.2.2    Reţele neuronale                                 |32 |
|    |       |3.2.3    Arbori de decizie                                |36 |
|    |       |3.2.4    Modelul MARS                                     |39 |
|    |       |3.2.5    Reguli de inducţie                               |39 |
|    |       |3.2.6    Metoda celor mai apropiaţi vecini                |40 |
|    |       |3.2.7    Regresii logistice                               |41 |
|    |       |3.2.8    Analiza discriminantã                            |42 |
|    |       |3.2.9    Modelul aditiv generalizat                       |42 |
|    |       |3.2.10  Boosting                                          |43 |
|    |       |3.2.11  Algoritmi genetici                                |43 |
|    |3.3 Modelul episoadelor                                            |44 |
|    |       |3.3.1   Introducere în modelul episoadelor                |44 |
|    |       |3.3.2   Episoade                                          |44 |
|    |       |3.3.3   Monotonia episoadelor şi algoritmul A-Priori      |45 |
|    |       |3.3.4   Verificarea episoadelor paralele                  |46 |
|    |       |3.3.5   Verificarea episoadelor seriale                   |47 |
|    |       |3.3.6   Veficarea episoadelor compuse                     |49 |
|    |       |                                                          |   |
|4. MODELAREA PROCESULUI DE DATA MINING                                  |50 |
|    |4.1 Modelarea proceselor. Generalitãţi                             |50 |
|    |4.2 Modelarea de tip „Two Crows”                                   |50 |
|    |       |4.2.1    Definirea problemei                              |51 |
|    |       |4.2.2    Construirea bazei de date                        |51 |
|    |       |4.2.3    Explorarea datelor                               |55 |
|    |       |4.2.4    Prepararea datelor pentru modelare               |55 |
|    |       |4.2.5    Construirea modelului pentru data mining         |57 |
|    |       |4.2.6    Evaluare şi interpretare                         |59 |
|    |       |4.2.7    Aplicarea modelului şi analiza rezultatelor      |63 |
|5. PRODUSE ŞI APLICAŢII DATA MINING                                     |65 |
|    |5.1 Categorii de  produse data mining                              |65 |
|    |5.2 Capabilitãţi esenţiale                                         |65 |
|    |5.3 Forarea în WWW                                                 |68 |
|    |       |5.3.1    Ierarhizarea paginilor                           |69 |
|    |       |5.3.2    Probleme cu grafurile reţelei reale              |70 |
|    |       |5.3.3    Soluţii Google pentru problemele reţelei         |72 |
|    |       |5.3.4    Dispozitive anti-spam                            |73 |
|    |       |5.3.5    Centri şi autoritãţi                             |73 |
|    |       |5.3.6    Gãsirea seturilor neobişnuite de obiecte         |75 |
|    |       |5.3.7    Motorul DICE                                     |76 |
|    |       |5.3.8    Cãrţi şi autori                                  |77 |
|    |       |5.3.9    Ce este acela un tipar ?                         |77 |
|    |       |5.3.10  Apariţii ale datelor                              |78 |
|    |       |5.3.11  Construirea tiparelor din apariţii ale datelor    |79 |
|    |5.4 Învãţarea automatelor                                          |80 |
|    |       |5.4.1   Capacitatea roboţilor de a învãţa                 |80 |
|    |       |5.4.2   Ce se înţelege prin învãţarea automatelor ?       |80 |
|    |       |5.4.3   Contribuţii în învãţarea automatelor              |82 |
|    |       |5.4.4   Învãţarea probabilã aproximativ corectã           |83 |
|    |       |5.4.5   Aplicaţii în lumea realã                          |83 |
|    |       |                                                          |   |
|Concluzii                                                               |84 |
|Bibliografie                                                            |85 |
|Anexe                                                                   |   |
-----------------------
                          2