¡Somos talento Colombiano!Envio gratis por compras superiores a $250.000*10% dcto. en tu primera compra con el cupón #LEER*

(0)

COP$ 0

(0)

COP$ 0

COP$ 73.800 COP$ 59.040

PayU Pagos Seguros

Pagos 100% seguros

PayU Pagos Seguros

Sistemas de Big Data

En el momento en que tuve la oportunidad de escribir este libro, lo primero que me vino a la cabeza fue que podía aportar yo a la ya extensa y variada literatura existente sobre el tema que nos ocupa. Las estanterías de las librerías temáticas, las plataformas de aprendizaje en línea y los blogs especializados rebosan contenidos alrededor del mundo del Big Data. Si a esto sumamos el ingente número de materiales y recursos elaborados por las compañías que se dedican al tema, ya sea en el desarrollo de software o en la prestación de servicios, nos encontramos con un área de conocimiento y una práctica empresarial, a priori, sobradamente documentada.

Ebooks - Spiral Reader

López Fandiño, Víctor

Área: ,

Editorial: Ediciones de la U

ISBN: 9789587925722

Precio en Dólares: USD$ 22.36

*Este valor puede ser aproximado y podrá variar al momento del pago.

EdiciónFormatoTipo
2023 eBook .pdf
SKU: 9789587925722 Categorías: ,

Descripción

En el momento en que tuve la oportunidad de escribir este libro, lo primero que me vino a la cabeza fue que podía aportar yo a la ya extensa y variada literatura existente sobre el tema que nos ocupa. Las estanterías de las librerías temáticas, las plataformas de aprendizaje en línea y los blogs especializados rebosan contenidos alrededor del mundo del Big Data. Si a esto sumamos el ingente número de materiales y recursos elaborados por las compañías que se dedican al tema, ya sea en el desarrollo de software o en la prestación de servicios, nos encontramos con un área de conocimiento y una práctica empresarial, a priori, sobradamente documentada.

Información adicional

Número de edición

ano

Autor

Editorial

ID Digital Content

Formato

EISBN

Tabla de contenido

PRESENTACIÓN
ACERCA DEL AUTOR

CAPÍTULO 1. BIG DATA: DEL DATO A LA INFORMACIÓN
1.1 DATOS, INFORMACIÓN Y CONOCIMIENTO
1.2 CARACTERIZACIÓN DEL DATO
1.2.1 Datos en cuanto al tipo
1.2.2 Datos en cuanto al formato
1.2.3 Datos en cuanto al generador
1.2.4 Datos en cuanto al tamaño
1.2.5 Datos en cuanto a su rol
1.2.6 Datos en cuanto a su latencia
1.2.7 Datos en cuanto a su sensibilidad
1.3 BIG DATA EN CONTEXTO
1.3.1 El modelo de las cinco uves
1.3.2 Empresas orientadas por los datos
1.3.3 Computación en la nube
1.3.4 Gestión y gobierno del dato
1.4 ETAPAS DE ANÁLISIS EN LA EXPLOTACIÓN DE LA INFORMACIÓN
1.4.1 Analítica descriptiva
1.4.2 Analítica prescriptiva
1.4.3 Analítica predictiva
1.4.4 Analítica cognitiva
1.5 ESCENARIOS DE APLICACIÓN DEL BIG DATA
1.6 RESUMEN DEL CAPÍTULO

CAPÍTULO 2. ARQUITECTURAS Y PATRONES PARA BIG DATA
2.1 PATRONES ARQUITECTURALES
2.1.1 Tipologías de patrones
2.2 ARQUITECTURAS DE DATOS CENTRALIZADAS
2.2.1 Generación 0 (1970): sistemas transaccionales
2.2.2 Generación 1 (1980): data warehouse
2.2.3 Generación 2 (1990): almacenes operacionales
2.2.4 Generación 3 (2000): gestión de datos maestros
2.2.5 Generación 4 (2010): data lake
2.2.6 Generación 5 (2020): data lakehouse
2.3 ARQUITECTURAS DE DATOS ORIENTADA POR DOMINIOS
2.3.1 El concepto de data mesh
2.3.2 Organización distribuida de datos según dominios
2.3.3 El dato como producto
2.3.4 Plataforma compartida y gobierno federado
2.4 RESUMEN DEL CAPÍTULO

CAPÍTULO 3. SISTEMAS DE ALMACENAMIENTO
3.1 BASES DE DATOS RELACIONALES
3.1.1 Gestión de cargas analíticas
3.1.2 Escenarios e inconvenientes
3.1.3 Software y soluciones para data warehouse
3.2 SISTEMAS DE ARCHIVOS DISTRIBUIDOS
3.2.1 Apache Hadoop–HDFS
3.2.2 Formatos de archivos
3.2.3 Escenarios e inconvenientes
3.2.4 Software y soluciones para Apache Hadoop
3.3 ALMACENES DE OBJETOS
3.3.1 Catálogos de tablas
3.3.2 Escenarios e inconvenientes
3.3.3 Servicios para el almacenamiento de objetos
3.4 BASES DE DATOS NOSQL
3.4.1 El modelo BASE y el teorema CAP
3.4.2 Gestores NoSQL según el modelo de datos
3.4.3 Software y servicios de bases de datos NoSQL
3.5 RESUMEN DEL CAPÍTULO

CAPÍTULO 4. PROCESAMIENTO DE DATOS POR LOTES
4.1 EXTRACCIÓN, TRANSFORMACIÓN Y CARGA
4.1.1 Extracción
4.1.2 Transformación
4.1.3 Carga
4.2 MODELADO DE DATOS Y GESTIÓN DE CAMBIOS
4.2.1 Modelos multidimensionales
4.2.2 Cambios en los datos y gestión de la historia
4.3 TECNOLOGÍAS PARA EL TRATAMIENTO DE DATOS
4.3.1 Apache Hadoop
4.3.2 Aplicaciones MapReduce
4.3.3 Apache Spark
4.3.4 Tecnologías para flujos ETL
4.4 MOTORES DE CONSULTA DISTRIBUIDOS
4.4.1 Apache Hive
4.4.2 Otros motores especializados
4.4.3 Apache Arrow
4.5 RESUMEN DEL CAPÍTULO

CAPÍTULO 5. GESTIÓN DE EVENTOS EN TIEMPO REAL
5.1 TRANSMISIÓN DE EVENTOS
5.1.1 Transmisión de eventos y colas de mensajes
5.1.2 Apache Kafka
5.2 PROCESAMIENTO DE EVENTOS
5.2.1 Consideraciones sobre el análisis de datos en tiempo real
5.2.2 Soluciones para el procesamiento de eventos
5.3 UNIFICACIÓN DE PROCESOS
5.3.1 El modelo Lambda
5.3.2 El modelo Kappa
5.3.3 Revisitando los catálogos de tablas
5.4 RESUMEN DEL CAPÍTULO

CAPÍTULO 6. ANÁLISIS DESCRIPTIVO: EXPLORACIÓN DE LOS DATOS
6.1 MOTIVACIÓN Y OBJETIVOS
6.2 CARACTERIZACIÓN DE LOS DATOS
6.2.1 Observaciones y atributos
6.2.2 Relaciones entre atributos
6.3 ANÁLISIS EXPLORATORIO
6.3.1 Análisis univariante
6.3.2 Análisis multivariante
6.4 ANÁLISIS MULTIDIMENSIONAL
6.4.1 Cuadros de mando y KPI
6.5 SISTEMAS PARA ANÁLISIS DESCRIPTIVO
6.5.1 Flujo de construcción de un cuadro de mando
6.5.2 Herramientas y soluciones
6.6 RESUMEN DEL CAPÍTULO

CAPÍTULO 7. ANÁLISIS PREDICTIVO: MINERÍA DE DATOS
7.1 MOTIVACIÓN Y OBJETIVOS
7.2 PREPROCESADO DE LOS DATOS
7.3 MODELIZACIÓN DE LOS DATOS
7.3.1 Aprendizaje supervisado
7.3.2 Aprendizaje no supervisado
7.4 PUESTA EN PRODUCCIÓN E INFERENCIA DE MODELOS
7.4.1 Escenarios de inferencia de modelos
7.5 HERRAMIENTAS Y SOLUCIONES PARA MINERÍA DE DATOS
7.6 RESUMEN DEL CAPÍTULO

CAPÍTULO 8. ANÁLISIS PRESCRIPTIVO: MODELOS DE OPTIMIZACIÓN
8.1 MOTIVACIÓN Y OBJETIVOS
8.2 OPTIMIZACIÓN MATEMÁTICA
8.2.1 Programación lineal
8.2.2 Otros métodos de optimización matemática
8.3 ALGORITMOS GENÉTICOS
8.4 MODELIZACIÓN PROBABILÍSTICA
8.4.1 Cadenas de Markov
8.5 HERRAMIENTAS Y SOLUCIONES PARA ANÁLISIS PRESCRIPTIVO
8.6 RESUMEN DEL CAPÍTULO

CAPÍTULO 9. ANÁLISIS COGNITIVO: INTELIGENCIA ARTIFICIAL
9.1 MOTIVACIÓN Y OBJETIVOS
9.2 MECANISMOS DE APRENDIZAJE
9.2.1 Aprendizaje por refuerzo
9.2.2 Aprendizaje profundo
9.3 APLICACIONES EN EL ÁMBITO ANALÍTICO
9.3.1 Análisis de conversaciones
9.3.2 Análisis de imágenes
9.4 PROBLEMAS DE SESGO Y FALTA DE EQUIDAD EN LOS MODELOS
9.4.1 Mitigación del sesgo
9.5 HERRAMIENTAS Y SOLUCIONES PARA ANÁLISIS COGNITIVO
9.5.1 Aceleración de la inferencia de modelos por hardware
9.5.2 Servicios cognitivos en la nube
9.5.3 Soluciones para la detección y mitigación de sesgo
9.6 RESUMEN DEL CAPÍTULO

CAPÍTULO 10. GESTIÓN Y GOBIERNO DEL DATO Y SUS ACTIVOS
10.1 GESTIÓN DEL CICLO DE VIDA DE LOS DATOS
10.1.1 El marco DAMA-DMBOK2
10.1.2 Operaciones sobre los datos y observancia
10.2 GESTIÓN DEL APRENDIZAJE AUTOMÁTICO
10.2.1 Metodologías para minería de datos
10.2.2 Automatización de modelos: MLOps
10.3 SOLUCIONES PARA LA GESTIÓN Y GOBIERNO DEL DATO
10.4 RESUMEN DEL CAPÍTULO

BIBLIOGRAFÍA RECOMENDADA
VÍCTOR LÓPEZ FANDIÑO

Doctor en ingeniería industrial por la Universitat Ramon Llull, Barcelona, con una especialización en quimiometría sobre la aplicación de las redes neuronales artificiales al análisis estadístico multivariante. Con más de 30 años de experiencia en el sector de las tecnologías de la información, ha desarrollado la mayor parte de su carrera profesional en IBM, pasando por las divisiones de consultoría, software y, más recientemente, encargándose de la habilitación técnica de los socios tecnológicos de la compañía en España. Paralelamente, ha colaborado con distintas escuelas de negocio y universidades en la impartición de seminarios, cursos de especialización y asignaturas sobre explotación y análisis de los datos.
Siempre ha trabajado en áreas relacionadas con la gestión de la información, especialmente en temas de minería de datos, data warehousing y analítica de negocio, disciplinas por las que tiene una certificación como Distinguished Technical Specialist, otorgada por The Open Group.

Título