(IFCD012PO) Data Mining: principios y aplicaciones
César Pérez López
El objetivo de este libro es que el lector descubra las bases de datos de soporte a la decisión y toda la problemática asociada tanto a su construcción y desarrollo como a la extracción de conocimiento de las mismas y enfrentarse a un proyecto de data mining con los conocimientos suficientes pudiendo abordar cualquiera de sus fases de desarrollo finalidad la descripción precisa del proceso de KDD.
- Escritor
- César Pérez López
- Colección
- Formación en el Empleo (Especialidades Formativas)
- Materia
- Software para bases de datos
- Idioma
- Castellano
- EAN
- 9788418551987
- ISBN
- 978-84-18551-98-7
- Depósito legal
- M-22398-2021
- Páginas
- 576
- Ancho
- 17 cm
- Alto
- 24 cm
- Peso
- 985 g
- Edición
- 1
- Fecha publicación
- 25-08-2021
581,80 MX$28,84 US$
Índice de contenido
Introducción
Capítulo 1. El concepto de Data Mining
Introducción
Una definición de Data Mining
El proceso de Data Mining
Selección de objetivos
La preparación de los datos
Tipos de problemas de Data Mining y enfoques para su resolución
Problemas descriptivos
Problemas predictivos
Técnicas de Data Mining
El éxito de un proyecto de Data Mining: consideraciones finales
Capítulo 2. El entorno de Enterprise Miner.
La herramienta Enterprise Miner
Preparación de los datos
Abrir Enterprise Miner
Navegador del Proyecto
Conjunto de herramientas de análisis de SAS Enterprise Miner
Zona de trabajo
Barra de Herramientas
Menú principal de aplicaciones
File
Edit
View
Options
Actions
Help
Comenzar un proyecto nuevo
Acerca de los dato y los nodos
Capítulo 3. Selección de datos y muestras. Exploración
El nodo de datos (Input Data Source Node)
Conexión de nodos en un diagrama activo
El nodo de muestreo (Sampling Node)
El nodo partición de datos (Data Partition Node)
Nodo explorador de distribuciones (Distribution Explorer Node)
Nodo multigráficos (Multiplot node)
Nodo de exploración de patrones (Insight Node)
Nodo de asociaciones (Association Node)
Node de selección de variables (Variable Selection Node)
Nodo de análisis de relaciones (Link Analisis Exp. Node)
Visor de resultados
Capítulo 4. Exploración y análisis interactivo de datos. El nodo Insight
El node de análisis interactivo (Insight)
Introducción de datos
Edición de datos
Presentación de ventanas
Trabajo con variables
Búsqueda y selección de datos
Análisis de datos
Análisis univariante y bivariante
Análisis de la distribución de una variable
Ajustar Modelos (Fit Y X)
Análisis Multivariante (Multivariate)
Capítulo 5. Depuración y modificación de datos
Nodo de asignación de atributos (Data Set Attributes Node)
Nodo de transformación de variables (Transform Variables Node)
Nodo de filtro de datos (Filter Outliers Node)
Nodo de reemplazo (Replacement Node)
Imputación de la información faltante
Resultados
Nodo para series temporales (Time Series Node, Exp.)
Trabajo con el nodo de series temporales
Visor de resultados
Capítulo 6. Análisis cluster
Métodos descriptivos: Técnicas del análisis de interdependencia
Análisis en componentes principales
Análisis factorial
Análisis de correspondencias
Escalamiento multidimensional
Análisis de conglomerados (análisis cluster)
Nodo de Enterprise Miner para el análisis cluster (Clustering Node)
Trabajando con el nodo de Análisis Cluster
Visor de resultados
Ejemplo de Clustering
Capítulo 7. Modelos: regresión múltiple y logística
Métodos explicativos: Técnicas del análisis de la dependencia
Regresión múltiple
Análisis canónico (correlación canónica)
Análisis discriminante
Modelos de elección discreta
Modelo ANOVA (Análisis de la varianza simple)
Modelo ANCOVA (Análisis de la covarianza simple)
Modelo MANOVA (Análisis de la varianza múltipe)
Modelo MANCOVA (Análisis de la covarianza múltiple)
Regresión múltiple y modelos de elección discreta con variables ficticias.. 180
Nodo de regresión de Enterprise Miner
Especificación del modelo
Resultados de la regresión
Model Manager
Ejemplo de regresión múltiple
Resultados
Ejemplo de regresión logística
Capítulo 8. Árboles de decisión
Extracción de reglas mediante árboles de decisión
Conceptos previos
Metodología de construcción de reglas del algoritmo del nodo Tree de Enterprise Miner
C&RT (Classification and Regression Trees)
C4.5 y C5.0
Nodo de árboles de decisión (Tree Node)
Opciones para los árboles de decisión
Elementos de los árboles de decisión
El visor de resultados del nodo de árboles de decisión
Entrenamiento interactivo (Interactive Training)
Ejemplo de árbol de decisión
Capítulo 9. Redes Neuronales
Introducción a las redes neuronales
Las Redes Neuronales Biológicas
Las Redes Neuronales Artificiales
Un poco de historia
Características generales de las RNAs
Una clasificación de las RNAs
El aprendizaje del MLP: el algoritmo Backpropagation
Principales ventajas y desventajas de las RNAs
Nodo de Redes Neuronales Artifíciales (Neural Network Node)
Trabajo con el nodo de redes neuronales
Ejecución del nodo de redes neuronales
Visor de resultados
Ejemplo de red nueronal
Capítulo 10. Redes neuronales y componentes principales. Modelos de usuario
Nodo de análisis de componentes principales para uso individual o en redes neuronales (PRINCOMP/DMNEURAL Node)
Funciones de activación
Trabajo con el nodo PRINCOMP/DMNEURAL
Ejecución del nodo PRINCOMP/DMNEURAL
Resultados del nodo PRINCOMP/DMNEURAL
Nodo de modelo creado por el usuario (User Defined Node)
Trabajo con el nodo Data Set Attributes
Visor de resultados
Nodo de combinación de modelos (Ensemble Node)
Trabajando con el nodo de combinación de modelos
Visor de resultados
Nodo de razonamiento basado en la memoria (Memory-Based Reasoning, Exp.)
Trabajando con el nodo de razonamiento basado en la memoria
Visor de resultados
Nodo de modelo en dos etapas (Two Stage Model Node)
Trabajando con el nodo de modelo en dos etapas
Visor de resultados
Nodo para mapas autoorganizados (SOM/KOHONEN NODE)
Kohonen VQ
Self Organizing Maps
Trabajo con el nodo de SOM/KOHONEN
Visor de resultados
Nodo para mapas autoorganizados (SOM/KOHONEN NODE)
Kohonen VQ
Self Organizing Maps
Trabajo con el nodo de SOM/KOHONEN
Visor de resultados
Ejemplo de PRINCOMP/DMNEURAL
Ejemplo de redes autoorganizadas SOM/KOHONEN
Capítulo 11. Valoración y comparación de modelos
Nodo de valoración (Assessment)
Trabajo con el nodo de valoración
Gráficos del nodo Assessment
LIFT (Gráfico de ganancias)
DIAGNOSTIC (Gráfico de clasificación)0
THRESHOLD-BASED (Gráfico de clasificación basado en el umbral)
Curvas ROC
Scatter Plot (Gráfico de dispersión)
Nodo de informes (Reporter Node)
Opciones por defecto del nodo Reporter
Localización de los fichero de informes
Ejemplo de combinación de modelos
Capítulo 12. Predicción y utilidades
Nodo de predicción de nuevos datos (Score)
Trabajo con el nodo de predicción
Nodo de predicción en lenguaje C (C*Score)
Principales limitaciones del nodo C*Score
Trabajo con el nodo C*Store
Visor de resultados
Nodo de utilidades (Utility) y nodo de tratamiento de grupos (Group Processing)
Trabajo con el nodo de tratamiento de grupos
Visor de resultados en model manager
Nodo de base de datos para Data Mining (Data Mining Database Node)
Trabajo con el nodo de base de datos para Data Mining
Visor de resultados
Nodo de código de programación SAS (SAS Code Node)
Trabajando con el nodo de código de programación SAS
Nodo de punto de control (Control Point Node)
Nodo de subdiagrama (Subdiagram Node)
Capítulo 13. Data Mining y reducción de la dimensión con variables cuantitativas: Componentes Principales
Libros relacionados
(IFCT25) MCSA SQL Server
(IFCT076PO) Fundamentos De SQL en Oracle Database
(IFCT075PO) Oracle Database 11g Administration I
(IFCT073PO) Oracle 11G
Oracle Assets
SQL Server 2014 Soluciones prácticas de administración
Domine Oracle 11g
Las Macros en Access 2010
Programación en Oracle 11g SQL, SQL*Plus y PL/SQL
Access 2010. Básico