Visión Artificial. Componentes de los sistemas de visión y nuevas tendencias en Deep Learning
Jaime Duque Domingo, Jaime Gómez García- Bermejo, Eduardo Zalama Casanova
Los avances continuos en la visión artificial permiten resolver problemas de distinta índole, como pueden ser la conducción autónoma, el reconocimiento biométrico, la detección de defectos industriales o la interacción entre humanos y robots.
Este libro es una readaptación y ampliación del libro de Visión Artificial mediante aprendizaje automático con Tensorflow y Pytorch, publicado anteriormente por los autores, y es una guía esencial para cualquier persona que desee comprender cómo las máquinas interpretan el mundo visual. De forma secuencial y con numerosos ejemplos prácticos, se desglosan los conceptos básicos, las tecnologías de procesamiento de imágenes más novedosas y las últimas tendencias de programación mediante aprendizaje automático.
En la primera parte del libro se realiza una introducción a la visión artificial y se presentan los componentes básicos de los sistemas de visión. En la segunda parte se muestran las últimas tendencias en procesamiento con Deep Learning a través ejemplos en Tensorflow y Pytorch, de manera que el lector sea capaz de implementar y utilizar, desde modelos sencillos, hasta otros más complejos como por ejemplo los modelos generativos mediante redes GAN o de difusión, entre otros.
El libro presenta numerosos modelos incluyendo VAEs, U-Nets, YOLO, Mask R-CNN, etc., los componentes básicos de los sistemas de visión.
El libro contiene material adicional que podrá descargar desde este ENLACE
- Escritor
- Jaime Duque Domingo
- Escritor
- Jaime Gómez García- Bermejo
- Escritor
- Eduardo Zalama Casanova
- Colección
- Profesional
- Materia
- Visión por ordenador
- Idioma
- Castellano
- EAN
- 9788410360075
- ISBN
- 978-84-10360-07-5
- Páginas
- 498
- Edición
- 1
- Fecha publicación
- 24-05-2024
Reseñas
Índice de contenido
Indice general
Introducción a la visión artificial y componentes de
los sistemas de visión
1. Introducción y conceptos básicos
1.1. Introducción general
1.2. Imagen y vídeo
1.3. El color
1.4. Operaciones básicas con imágenes
1.5. El producto de convolución
1.6. Convolución multicanal
1.7. Procesamiento del resultado del filtrado
1.8. Transformaciones geométricas
1.9. Remuestreo y pirámides de imágenes
2. Componentes de un sistema de visión artificial
2.1. Introducción
2.2. Cámaras
2.2.1. Características de las cámaras
2.2.2. Cámaras monocromas y color
2.2.3. Cámaras lineales
2.3. Opticas
2.3.1. La cámara pinhole
2.3.2. Lentes
2.3.3. Distancia focal
2.3.4. Enfoque
2.3.5. Apertura focal
2.3.6. Distorsiones, aberraciones y otros fenómenos
2.3.7. Opticas especiales
2.3.8. Filtros ópticos
2.4. Iluminación
2.4.1. Un poco de radiometría
2.4.2. Magnitudes fotométricas
2.4.3. La reflexión de la luz. Componentes de la reflexión
2.4.4. La función de distribución de la reflectancia bidireccional
2.4.5. Caracterización de la reflexión mediante cámaras, colorímetros y reflectómetros
2.4.6. Fuentes de luz
2.4.7. Técnicas de iluminación
2.5. Sistemas de visión 3D
2.5.1. Geometría de formación de las imágenes
2.5.2. Modelado y calibración de cámaras
2.5.3. Objetos a una distancia dada
2.5.4. Estéreo
2.5.5. Luz estructurada
2.5.6. Tiempo de vuelo
2.5.7. La visión 3D en los humanos
2.6. Sensores y cámaras industriales
2.7. Metodologías para la selección del hardware
3. Aplicaciones de la visión en la Industria 4.0
3.1. Sistemas de Visión Artificial en la industria
3.1.1. SVA integrados
3.2. Aplicaciones clásicas
3.2.1. Discriminación, detección de fallos
3.2.2. Paletizado
3.2.3. Detección de códigos de barras
3.2.4. Trazabilidad de los productos
3.2.5. Escaneado 3D
3.2.6. Visión artificial en el ámbito de la robótica
3.2.7. Visión artificial en la robótica autónoma móvil
3.2.8. Soluciones propietarias, tipo OKAO
4. Frameworks de visión y deep learning
4.1. Introducción a OpenCV
4.2. Pillow y DLIB
4.2.1. Pillow
4.2.2. DLIB
4.3. Introducción a Tensorflow
4.4. Introducción a Pytorch
4.5. Esquema abierto de intercambio de redes neuronales
5. Ciclo del proyecto y tipos de problemas
5.1. Ciclo del proyecto
5.2. Tipos de problemas
5.2.1. Clasificación de imágenes y v´ideos
5.2.2. Detección, segmentación y reconocimiento de objetos y personas
5.2.3. Problemas de regresión
5.2.4. Aprendizaje de un único caso
5.2.5. Generación de imágenes sintéticas
6. Aprendizaje supervisado y no supervisado
6.1. Aprendizaje no supervisado con K-Means
6.2. Aprendizaje supervisado con SVM
6.2.1. SVMcon Scikit-Learn
6.2.2. SVMcon OpenCV
7. Redes neuronales
7.1. Perceptrón simple
7.2. Perceptrón multicapa
7.3. Algoritmo de retropropagación
7.3.1. Optimizadores
7.3.2. Ejemplo utilizando Tensorflow (modo secuencial)
7.3.3. Ejemplo utilizando Pytorch (modo secuencial)
7.3.4. Ejemplo utilizando Tensorflow (con API Funcional)
7.3.5. Ejemplo utilizando Pytorch (con API Funcional)
7.4. Problemas de clasificación
7.4.1. Entropía cruzada
7.4.2. Ejemplo de clasificación utilizando Tensorflow
7.4.3. Ejemplo de clasificación utilizando Pytorch
7.5. Problemas de regresión
7.5.1. Regresión con Tensorflow
7.5.2. Regresión con Pytorch
7.6. Redes de convolución
7.6.1. Ejemplo de clasificación utilizando Tensorflow
7.6.2. Ejemplo de clasificación utilizando Pytorch
7.6.3. Convoluciones 3D
7.7. Redes recurrentes
8. Redes neuronales de clasificación
8.1. Transfer learning
8.2. Clasificación con Tensorflow
8.3. Mapas de calor con Tensorflow
8.4. Clasificación con Pytorch
8.5. Mapas de calor con Pytorch
8.6. Matriz de confusión con Pytorch
8.7. Redes ViT
8.8. Ejemplo de modelo ViT utilizando Pytorch
8.9. Comparativa de modelo ViT con modelo ConvNeXt-base utilizando Pytorch
9. Clasificación en vídeo
9.1. Obtención de los vectores de features para la clasificación DCSASS utilizando Tensorflow
9.2. Entrenamiento de la LSTM de clasificación de DCSASS utilizando Tensorflow
10.Redes siamesas
10.1. Ejemplo de red siamesa utilizando Tensorflow
11.Redes generativas antagónicas (GAN)
11.1. Ejemplo de red generativa antagónica con Tensorflow
12.Redes de codificación automática (AutoEncoder-Decoder)
12.1. Ejemplo de AutoEncoder-Decoder con Tensorflow
12.2.VAE y CVAE
13.Detección y segmentación de objetos
13.1.Detección
13.2.YOLO
13.2.1. Entrenamiento y detección con YOLO de manos
13.2.2. Entrenamiento y detección con YOLO de la Luna
13.3.Segmentación
13.3.1. Segmentación con U-Net
13.3.2. Mask R-CNN
13.3.3. Entrenamiento y segmentación con Mask R-CNN
14.Reconocimiento de articulaciones y puntos de personas
14.1.OpenPose
14.2.BlazePose
14.3. Algunos modelos de MediaPipe y DLIB
15.Métodos combinados de integración de redes neuronales
15.1.Validación cruzada
15.2.Combinación de clasificadores
15.3.Cross Validation Voting (CVV)
15.4. Ejemplo de aplicación de CVV sobre CIFAR-10 con Pytorch
16.One-Shot Learning
16.1. Implementación de CP-CVV con Fss1000
16.2. Evaluación de CP-CVV con Fss1000
17.Avances recientes en redes neuronales
17.1.SAM: Segment AnythingModel
17.2. Fast SAM y extracción de objetos 3D mediante SAM + mapa de profundidad
17.3.YOLO 3D
17.4.Aprendizaje contrastivo
17.5.Modelos de difusión
17.6.StyleGAN
17.7. Modelos generativos condicionados
17.8. Modificación de imágenes con modelos generativos
17.9.Backbones rápidos:MobileOne
17.10.Differentiable Rendering
17.11.NeRF
17.12.Knowledge distillation
7.5.1. Regresión con Tensorflow
7.5.2. Regresión con Pytorch
7.6. Redes de convolución
7.6.1. Ejemplo de clasificación utilizando Tensorflow
7.6.2. Ejemplo de clasificación utilizando Pytorch
7.6.3. Convoluciones 3D
7.7. Redes recurrentes
8. Redes neuronales de clasificación
8.1. Transfer learning
8.2. Clasificación con Tensorflow
8.3. Mapas de calor con Tensorflow
8.4. Clasificación con Pytorch
8.5. Mapas de calor con Pytorch
8.6. Matriz de confusión con Pytorch
8.7. Redes ViT
8.8. Ejemplo de modelo ViT utilizando Pytorch
8.9. Comparativa de modelo ViT con modelo ConvNeXt-base utilizando Pytorch
7.5.1. Regresión con Tensorflow
7.5.2. Regresión con Pytorch
7.6. Redes de convolución
7.6.1. Ejemplo de clasificación utilizando Tensorflow
7.6.2. Ejemplo de clasificación utilizando Pytorch
7.6.3. Convoluciones 3D
7.7. Redes recurrentes
8. Redes neuronales de clasificación
8.1. Transfer learning
8.2. Clasificación con Tensorflow
8.3. Mapas de calor con Tensorflow
8.4. Clasificación con Pytorch
8.5. Mapas de calor con Pytorch
8.6. Matriz de confusión con Pytorch
8.7. Redes ViT
8.8. Ejemplo de modelo ViT utilizando Pytorch
8.9. Comparativa de modelo ViT con modelo ConvNeXt-base utilizando
Pytorch
7.4.3. Ejemplo de clasificación utilizando Pytorch
7.5. Problemas de regresión
7.5.1. Regresión con Tensorflow
7.5.2. Regresión con Pytorch
7.6. Redes de convolución
7.6.1. Ejemplo de clasificación utilizando Tensorflow
7.6.2. Ejemplo de clasificación utilizando Pytorch
7.6.3. Convoluciones 3D
7.7. Redes recurrentes
8. Redes neuronales de clasificación
8.1. Transfer learning
8.2. Clasificación con Tensorflow
8.3. Mapas de calor con Tensorflow
8.4. Clasificación con Pytorch
8.5. Mapas de calor con Pytorch
8.6. Matriz de confusión con Pytorch
8.7. Redes ViT
8.8. Ejemplo de modelo ViT utilizando Pytorch
8.9. Comparativa de modelo ViT con modelo ConvNeXt-base utilizando Pytorch
Bibliografía
Material adicional