Cuprins
|1. INTRODUCERE |2 |
| |1.1 Necesitatea apariţiei unei noi tehnologii de manipulare a |2 |
| |datelor | |
| |1.2 Posibilitãţi oferite de tehnicile data mining |3 |
| |1.3 Tehnicile data mining şi depozitarea datelor |4 |
| |1.4 Data mining şi OLAP |5 |
| |1.5 Data mining, învãţarea automatelor şi statistica |6 |
| |1.6 Data mining şi tendinţele hardware şi software |7 |
| |1.7 Aplicaţii ale tehnicilor data mining |7 |
| |1.8 Succesul în data mining |8 |
|2. DESCRIEREA DATELOR PENTRU DATA MINING |9 |
| |2.1 Sumarizare şi vizualizare |9 |
| |2.2 Clustering |10 |
| | |2.2.1 Definiţie şi exemple de clustering |10 |
| | |2.2.2 Mãsurarea distanţelor |11 |
| | |2.2.3 Clasificarea algoritmilor de clustering |13 |
| | |2.2.4 Algoritmul K-means |13 |
| | |2.2.5 Algoritmul BFR |15 |
| | |2.2.6 Fastmap |19 |
| | |2.2.7 Clustering ierarhic |21 |
| | |2.2.8 Algoritmul GRGPF |21 |
| | |2.2.9 Algoritmul CURE |24 |
| |2.3 Analiza legãturilor |26 |
|3. Modele şi algoritmi data mining |29 |
| |3.1 Data mining predictiv |29 |
| | |3.1.1 O ierarhie a alegerilor |29 |
| | |3.1.2 Terminologie |30 |
| | |3.1.3 Clasificare |30 |
| | |3.1.4 Regresii |31 |
| | |3.1.5 Şiruri temporale |31 |
| |3.2 Modele data mining |31 |
| | |3.2.1 Introducere |31 |
| | |3.2.2 Reţele neuronale |32 |
| | |3.2.3 Arbori de decizie |36 |
| | |3.2.4 Modelul MARS |39 |
| | |3.2.5 Reguli de inducţie |39 |
| | |3.2.6 Metoda celor mai apropiaţi vecini |40 |
| | |3.2.7 Regresii logistice |41 |
| | |3.2.8 Analiza discriminantã |42 |
| | |3.2.9 Modelul aditiv generalizat |42 |
| | |3.2.10 Boosting |43 |
| | |3.2.11 Algoritmi genetici |43 |
| |3.3 Modelul episoadelor |44 |
| | |3.3.1 Introducere în modelul episoadelor |44 |
| | |3.3.2 Episoade |44 |
| | |3.3.3 Monotonia episoadelor şi algoritmul A-Priori |45 |
| | |3.3.4 Verificarea episoadelor paralele |46 |
| | |3.3.5 Verificarea episoadelor seriale |47 |
| | |3.3.6 Veficarea episoadelor compuse |49 |
| | | | |
|4. MODELAREA PROCESULUI DE DATA MINING |50 |
| |4.1 Modelarea proceselor. Generalitãţi |50 |
| |4.2 Modelarea de tip „Two Crows” |50 |
| | |4.2.1 Definirea problemei |51 |
| | |4.2.2 Construirea bazei de date |51 |
| | |4.2.3 Explorarea datelor |55 |
| | |4.2.4 Prepararea datelor pentru modelare |55 |
| | |4.2.5 Construirea modelului pentru data mining |57 |
| | |4.2.6 Evaluare şi interpretare |59 |
| | |4.2.7 Aplicarea modelului şi analiza rezultatelor |63 |
|5. PRODUSE ŞI APLICAŢII DATA MINING |65 |
| |5.1 Categorii de produse data mining |65 |
| |5.2 Capabilitãţi esenţiale |65 |
| |5.3 Forarea în WWW |68 |
| | |5.3.1 Ierarhizarea paginilor |69 |
| | |5.3.2 Probleme cu grafurile reţelei reale |70 |
| | |5.3.3 Soluţii Google pentru problemele reţelei |72 |
| | |5.3.4 Dispozitive anti-spam |73 |
| | |5.3.5 Centri şi autoritãţi |73 |
| | |5.3.6 Gãsirea seturilor neobişnuite de obiecte |75 |
| | |5.3.7 Motorul DICE |76 |
| | |5.3.8 Cãrţi şi autori |77 |
| | |5.3.9 Ce este acela un tipar ? |77 |
| | |5.3.10 Apariţii ale datelor |78 |
| | |5.3.11 Construirea tiparelor din apariţii ale datelor |79 |
| |5.4 Învãţarea automatelor |80 |
| | |5.4.1 Capacitatea roboţilor de a învãţa |80 |
| | |5.4.2 Ce se înţelege prin învãţarea automatelor ? |80 |
| | |5.4.3 Contribuţii în învãţarea automatelor |82 |
| | |5.4.4 Învãţarea probabilã aproximativ corectã |83 |
| | |5.4.5 Aplicaţii în lumea realã |83 |
| | | | |
|Concluzii |84 |
|Bibliografie |85 |
|Anexe | |
-----------------------
2