{"id":59901,"date":"2022-10-26T14:56:05","date_gmt":"2022-10-26T14:56:05","guid":{"rendered":"https:\/\/mailrelay.com\/glossary\/data-lake\/"},"modified":"2025-02-06T11:28:35","modified_gmt":"2025-02-06T11:28:35","slug":"data-lake","status":"publish","type":"glossary","link":"https:\/\/mailrelay.com\/es\/glosario\/data-lake\/","title":{"rendered":"Data Lake"},"content":{"rendered":"\n<p>Un data lake o lago de datos es un repositorio centralizado para todos nuestros datos, donde se pueden almacenar tanto datos estructurados como no estructurados, con sus correspondientes metadatos y que son disponibles bajo demanda en todo momento.<\/p>\n\n\n\n<p>Dentro del data Lake tienen cabida todo tipo de ficheros, independientemente de su fuente, escala o el formato que tengan y con todo ello se pueden ejecutar an\u00e1lisis, visualizaciones y procesos seg\u00fan las necesidades puntuales que tenga la empresa.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">1. \u00bfC\u00f3mo crear un data lake?<\/h2>\n\n\n\n<p>A pesar de que no existe una metodolog\u00eda est\u00e1ndar para crear un data lake, en su proceso se deben tener en consideraci\u00f3n los siguientes pasos:<\/p>\n\n\n\n<p><strong>&#8211; Adquisici\u00f3n de datos a tratar.<\/strong> Como punto de inicio se han de obtener de datos y los metadatos, y prepararlos para la incorporaci\u00f3n al data lake. Identificando las fuentes y datos de m\u00e1s valor para las tareas a la que pueden ser aplicados.<\/p>\n\n\n\n<p><strong>&#8211; Data curation \u00f3 grooming data.<\/strong> Tras ello entran en acci\u00f3n el conjunto de procesos que llevan a los datos crudos a datos consumibles por las aplicaciones anal\u00edticas. As\u00ed los datos pasan a tener formatos interpretables y reconocibles.<\/p>\n\n\n\n<p><strong>&#8211; Proveer los datos.<\/strong> En base a metainformaci\u00f3n de los datos, se ejecutan los procesos que permiten acceder a los datos contenidos en el data lake en base a las pol\u00edticas establecidas. Con ello se impide el acceso a datos inapropiados y est\u00e1n en disposici\u00f3n de ser utilizarlos de forma adecuada.<\/p>\n\n\n\n<p><strong>&#8211; Preservar de los datos<\/strong>. Finalmente entran en juego los procesos y pol\u00edticas que determinan los datos a conservarse y hasta cu\u00e1ndo. Del mismo modo sirve para garantizar la disponibilidad de los mismos y que el rendimiento\/recursos necesarios para acceder a los datos sea sostenible.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">2. Ventajas de usar un data lake<\/h2>\n\n\n\n<p>Los principales beneficios del uso de un data lake pasan por ser los siguientes:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>A pesar de que la fuente original del dato est\u00e9 obsoleta, su contenido puede seguir siendo de utilidad para su an\u00e1lisis.<\/li>\n\n\n\n<li>Centralizan todos los datos en un mismo lugar, sin importar el origen de los mismos.<\/li>\n\n\n\n<li>Con el permiso correcto, cualquier usuario relevante puede acceder y enriquecer la informaci\u00f3n para mejorar la toma de decisiones.<\/li>\n\n\n\n<li>Los datos procesados son susceptibles de ser procesados por herramientas de <a href=\"https:\/\/mailrelay.com\/es\/glosario\/big-data\/\" target=\"_blank\" rel=\"noopener\">Big Data<\/a>.<\/li>\n\n\n\n<li>La totalidad de los datos introducidos pueden ser normalizados y tratados.<\/li>\n\n\n\n<li>Se toman solo los datos seg\u00fan las necesidades puntuales, reduciendo los costes y tiempos.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">3. Data lake vs. Data warehouse<\/h2>\n\n\n\n<p>Cuando se trata de almacenar una cantidad ingente de datos, es com\u00fan que al concepto de data lake se asocie el de data warehouse o almac\u00e9n de datos. El data warehouse, b\u00e1sicamente, son los distintos componentes del data lake que tienen como misi\u00f3n tratar datos estructurados.<\/p>\n\n\n\n<p>Ambos se centran en el almacenamiento de datos, existiendo diferencias como son:<\/p>\n\n\n\n<p><strong>&#8211; Accesibilidad.<\/strong> Un data lake ofrece una accesibilidad muy simple, por contra en un data warehouse este asunto es m\u00e1s complejo.<\/p>\n\n\n\n<p><strong>&#8211; Almacenamiento.<\/strong> El data lake cuenta con un coste limitado y es ampliable en la nube, mientras que un data warehouse es generalmente m\u00e1s caro.<\/p>\n\n\n\n<p><strong>&#8211; Esquema.<\/strong> Los data lakes se basan en esquemas On Read y los data warehouses en esquemas on write.<\/p>\n\n\n\n<p><strong>&#8211; Estructura de los datos.<\/strong> Data warehouse solo recoge datos ya estructurados, y data Lake toma datos tanto estructurados como no estructurados.<\/p>\n\n\n\n<p><strong>&#8211; Finalidad de los datos.<\/strong> El uso de los datos siempre estar definido en un data warehouse, mientras que en un data lake no siempre es as\u00ed.<\/p>\n\n\n\n<p><strong>&#8211; Flexibilidad.<\/strong> En un data lake es m\u00e1s f\u00e1cil hacer modificaciones por la ausencia de estructura, por contra es un data warehouse es mucho m\u00e1s complicado.<\/p>\n\n\n\n<p><strong>&#8211; Usuarios.<\/strong> Los datos en un data lake son manejados por analistas, en un data warehouse cualquier usuario autorizado a ello puede manejar los datos.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Entradas relacionadas<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/mailrelay.com\/es\/glosario\/bandeja-de-entrada-inbox\/\">Bandeja de entrada (Inbox)<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/mailrelay.com\/es\/glosario\/banner\/\">Banner<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/mailrelay.com\/es\/glosario\/barracuda\/\">Barracuda<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/mailrelay.com\/es\/glosario\/benchmarking\/\">Benchmarking<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/mailrelay.com\/es\/glosario\/big-data\/\">Big data<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/mailrelay.com\/es\/glosario\/bitcoin\/\">Bitcoin<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/mailrelay.com\/es\/glosario\/black-friday\/\">Black Friday<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/mailrelay.com\/es\/glosario\/blockchain\/\">Blockchain<\/a><\/li>\n<\/ul>\n","protected":false},"template":"","class_list":["post-59901","glossary","type-glossary","status-publish","hentry"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.0 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Data Lake - Mailrelay<\/title>\n<meta name=\"description\" content=\"Un data lake o lago de datos es un repositorio centralizado para todos nuestros datos, donde se pueden almacenar tanto datos estructurados como no estructurados\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/mailrelay.com\/es\/glosario\/data-lake\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Data Lake - Mailrelay\" \/>\n<meta property=\"og:description\" content=\"Un data lake o lago de datos es un repositorio centralizado para todos nuestros datos, donde se pueden almacenar tanto datos estructurados como no estructurados\" \/>\n<meta property=\"og:url\" content=\"https:\/\/mailrelay.com\/es\/glosario\/data-lake\/\" \/>\n<meta property=\"og:site_name\" content=\"Mailrelay\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/Mailrelay\/\" \/>\n<meta property=\"article:modified_time\" content=\"2025-02-06T11:28:35+00:00\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:site\" content=\"@mailrelay\" \/>\n<meta name=\"twitter:label1\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data1\" content=\"3 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/mailrelay.com\/es\/glosario\/data-lake\/\",\"url\":\"https:\/\/mailrelay.com\/es\/glosario\/data-lake\/\",\"name\":\"Data Lake - Mailrelay\",\"isPartOf\":{\"@id\":\"https:\/\/mailrelay.com\/es\/#website\"},\"datePublished\":\"2022-10-26T14:56:05+00:00\",\"dateModified\":\"2025-02-06T11:28:35+00:00\",\"description\":\"Un data lake o lago de datos es un repositorio centralizado para todos nuestros datos, donde se pueden almacenar tanto datos estructurados como no estructurados\",\"breadcrumb\":{\"@id\":\"https:\/\/mailrelay.com\/es\/glosario\/data-lake\/#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/mailrelay.com\/es\/glosario\/data-lake\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/mailrelay.com\/es\/glosario\/data-lake\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/mailrelay.com\/es\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Data Lake\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/mailrelay.com\/es\/#website\",\"url\":\"https:\/\/mailrelay.com\/es\/\",\"name\":\"Mailrelay\",\"description\":\"Mailrelay.com - Email Marketing Software\",\"publisher\":{\"@id\":\"https:\/\/mailrelay.com\/es\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/mailrelay.com\/es\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"es\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/mailrelay.com\/es\/#organization\",\"name\":\"Mailrelay\",\"url\":\"https:\/\/mailrelay.com\/es\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\/\/mailrelay.com\/es\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/mailrelay.com\/wp-content\/uploads\/2019\/05\/mailrelay-logo.jpg\",\"contentUrl\":\"https:\/\/mailrelay.com\/wp-content\/uploads\/2019\/05\/mailrelay-logo.jpg\",\"width\":613,\"height\":291,\"caption\":\"Mailrelay\"},\"image\":{\"@id\":\"https:\/\/mailrelay.com\/es\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/www.facebook.com\/Mailrelay\/\",\"https:\/\/x.com\/mailrelay\",\"https:\/\/www.youtube.com\/mailrelay-email-marketing\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Data Lake - Mailrelay","description":"Un data lake o lago de datos es un repositorio centralizado para todos nuestros datos, donde se pueden almacenar tanto datos estructurados como no estructurados","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/mailrelay.com\/es\/glosario\/data-lake\/","og_locale":"es_ES","og_type":"article","og_title":"Data Lake - Mailrelay","og_description":"Un data lake o lago de datos es un repositorio centralizado para todos nuestros datos, donde se pueden almacenar tanto datos estructurados como no estructurados","og_url":"https:\/\/mailrelay.com\/es\/glosario\/data-lake\/","og_site_name":"Mailrelay","article_publisher":"https:\/\/www.facebook.com\/Mailrelay\/","article_modified_time":"2025-02-06T11:28:35+00:00","twitter_card":"summary_large_image","twitter_site":"@mailrelay","twitter_misc":{"Tiempo de lectura":"3 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/mailrelay.com\/es\/glosario\/data-lake\/","url":"https:\/\/mailrelay.com\/es\/glosario\/data-lake\/","name":"Data Lake - Mailrelay","isPartOf":{"@id":"https:\/\/mailrelay.com\/es\/#website"},"datePublished":"2022-10-26T14:56:05+00:00","dateModified":"2025-02-06T11:28:35+00:00","description":"Un data lake o lago de datos es un repositorio centralizado para todos nuestros datos, donde se pueden almacenar tanto datos estructurados como no estructurados","breadcrumb":{"@id":"https:\/\/mailrelay.com\/es\/glosario\/data-lake\/#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/mailrelay.com\/es\/glosario\/data-lake\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/mailrelay.com\/es\/glosario\/data-lake\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/mailrelay.com\/es\/"},{"@type":"ListItem","position":2,"name":"Data Lake"}]},{"@type":"WebSite","@id":"https:\/\/mailrelay.com\/es\/#website","url":"https:\/\/mailrelay.com\/es\/","name":"Mailrelay","description":"Mailrelay.com - Email Marketing Software","publisher":{"@id":"https:\/\/mailrelay.com\/es\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/mailrelay.com\/es\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es"},{"@type":"Organization","@id":"https:\/\/mailrelay.com\/es\/#organization","name":"Mailrelay","url":"https:\/\/mailrelay.com\/es\/","logo":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/mailrelay.com\/es\/#\/schema\/logo\/image\/","url":"https:\/\/mailrelay.com\/wp-content\/uploads\/2019\/05\/mailrelay-logo.jpg","contentUrl":"https:\/\/mailrelay.com\/wp-content\/uploads\/2019\/05\/mailrelay-logo.jpg","width":613,"height":291,"caption":"Mailrelay"},"image":{"@id":"https:\/\/mailrelay.com\/es\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/Mailrelay\/","https:\/\/x.com\/mailrelay","https:\/\/www.youtube.com\/mailrelay-email-marketing"]}]}},"uagb_featured_image_src":[],"uagb_author_info":{"display_name":"Paco Ruben Quintero","author_link":"https:\/\/mailrelay.com\/es\/blog\/author\/"},"uagb_comment_info":0,"uagb_excerpt":"Un data lake o lago de datos es un repositorio centralizado para todos nuestros datos, donde se pueden almacenar tanto datos estructurados como no estructurados, con sus correspondientes metadatos y que son disponibles bajo demanda en todo momento. Dentro del data Lake tienen cabida todo tipo de ficheros, independientemente de su fuente, escala o el&hellip;","_links":{"self":[{"href":"https:\/\/mailrelay.com\/es\/wp-json\/wp\/v2\/glossary\/59901","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mailrelay.com\/es\/wp-json\/wp\/v2\/glossary"}],"about":[{"href":"https:\/\/mailrelay.com\/es\/wp-json\/wp\/v2\/types\/glossary"}],"version-history":[{"count":3,"href":"https:\/\/mailrelay.com\/es\/wp-json\/wp\/v2\/glossary\/59901\/revisions"}],"predecessor-version":[{"id":83803,"href":"https:\/\/mailrelay.com\/es\/wp-json\/wp\/v2\/glossary\/59901\/revisions\/83803"}],"wp:attachment":[{"href":"https:\/\/mailrelay.com\/es\/wp-json\/wp\/v2\/media?parent=59901"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}