{"id":59991,"date":"2022-10-26T15:00:35","date_gmt":"2022-10-26T15:00:35","guid":{"rendered":"https:\/\/mailrelay.com\/glossary\/robots-txt\/"},"modified":"2024-01-12T09:33:42","modified_gmt":"2024-01-12T09:33:42","slug":"robots-txt","status":"publish","type":"glossary","link":"https:\/\/mailrelay.com\/es\/glosario\/robots-txt\/","title":{"rendered":"Robots.txt"},"content":{"rendered":"<p>El archivo robots.txt es un documento donde se indica, a las ara\u00f1as de indexaci\u00f3n de los motores de b\u00fasquedas, qu\u00e9 partes de un sitio web pueden se indexadas y proporciona un enlace al XML-sitemap.<\/p>\n<p>Dicho de forma mas sencilla, un archivo robots.txt indica a los rastreadores de los buscadores a qu\u00e9 URLs de un sitio pueden acceder, pero en ninguna caso es un mecanismo que impida que la p\u00e1gina sea indexada, pues muchos rastreadores hacen caso omiso a las instrucciones del robots.txt.<\/p>\n<p>Cuando los rastreadores o ara\u00f1as no hacen caso de la negaci\u00f3n de indexaci\u00f3n que se les coloca en el robots.txt (que no es otra que noindex), ser\u00e1 necesario proteger la p\u00e1gina web contrase\u00f1a que impedir que indexen la web en cuesti\u00f3n.<\/p>\n<h2>1. \u00bfPara qu\u00e9 se usa el archivo robots.txt?<\/h2>\n<p>De forma general, el archivo robots.txt es utilizado para dar ordenes concreta y especificas a los rastreadores de los distintos motores de b\u00fasqueda. Pero vamos a mostrar algunas funciones m\u00e1s espec\u00edficas.<\/p>\n<ul>\n<li><strong>Controla el acceso a los recursos gr\u00e1ficos.<\/strong> Permiten indicar si se desea impedir que los archivos de imagen de nuestra web aparezcan en los resultados de b\u00fasqueda. Siendo de vital importancia, para intentar tomar el control sobre la infogr\u00e1ficas e im\u00e1genes con informaci\u00f3n t\u00e9cnica de productos que tengamos. De tal forma que los interesados en dicha informaci\u00f3n, en primera instancia, solo pueden acceder a ella visitando nuestra web.<\/li>\n<li><strong>Restringe el acceso a ciertas p\u00e1ginas web<\/strong>. Los sitios web est\u00e1n formados por m\u00faltiples p\u00e1ginas, resultando interesante poder restringir la indexaci\u00f3n de p\u00e1ginas que no son interesantes que aparezcan en los resultados de b\u00fasqueda. Existen muchos motivos para ello, generalmente es para que las visitas del los rastreadores no influyan negativamente en el rendimiento de nuestro servidor web y para trabajar el posicionamiento SEO (evitando posicionar contenido que no interesa y centrar los esfuerzos en dar relevancia al que si interesa posicionar).<\/li>\n<li><strong>Bloquear el acceso a los archivos y directorios.<\/strong> Es de gran utilidad para evita que los rastreadores metan la nariz en los directorios y archivos que solo son recursos para el correcto funcionamiento del sitio web, contienen informaci\u00f3n que es exclusiva para ciertos usuarios o simplemente es contenido duplicado.<\/li>\n<\/ul>\n<h2>2. \u00bfC\u00f3mo crear un archivo robots.txt?<\/h2>\n<p>Si bien, cualquier instalaci\u00f3n por defecto de un <a href=\"https:\/\/mailrelay.com\/es\/glosario\/content-management-system-cms\/\" target=\"_blank\" rel=\"noopener\">CMS<\/a>, como <a href=\"https:\/\/mailrelay.com\/es\/glosario\/wordpress\/\" target=\"_blank\" rel=\"noopener\">WordPress<\/a> crea por defecto un archivo robots.txt, pueden crearse f\u00e1cilmente para ello haciendo uso de un editor de text plano se debe de crear un archivo de texto plano en formato ASCII o UTF-8, para colocar en su interior las instrucciones de indexaci\u00f3n deseadas.<\/p>\n<p>Justo a continuaci\u00f3n vamos a mostrar algunas de los comandos o instrucciones de uso mas com\u00fan en los robots.txt.<\/p>\n<h2>3. Comando de robots.txt<\/h2>\n<p>Los comandos que m\u00e1s asiduidad se utilizan en el documento robots.txt son:<\/p>\n<p><strong>User-agent:<\/strong>, tambi\u00e9n llamado agente de usuario, se usa para indicar a cada robots o ara\u00f1as de los motores de b\u00fasqueda, lo que se desea de ellos. Es importante destacar que las instrucciones para cada uno de los rastreadores se realizan juntas, es decir se usa una sola instancia para Googlebot (Google search engine) para indicarle lo que se le permite o no hacer.<\/p>\n<p>Su sintaxis b\u00e1sica es:<\/p>\n<ul>\n<li><strong>User-agent:<\/strong> [robot concreto al que indicare las reglas]<\/li>\n<li><strong>Disallow:<\/strong> indica al robot que no debe acceder, ni indexar una URL, subdirectorio o directorio en concreto.<\/li>\n<li><strong>Disallow:<\/strong> [directorio que se desea bloquear]<\/li>\n<li><strong>Allow:<\/strong> justo lo contrario a Disallow:, en este caso se indicas al user-agente una URL, subdirectorio o directorio al que si debe acceder e indexar.<\/li>\n<\/ul>\n<h2>4. Ejemplos para robots.txt<\/h2>\n<p>Aqu\u00ed tienes algunos ejemplos de los bots o agentes de los principales buscadores:<\/p>\n<ul>\n<li>Googlebot (Google search engine)<\/li>\n<li>Googlebot-Image (Google-image search)<\/li>\n<li>Adsbot-Google (Google AdWords)<\/li>\n<li>Slurp (Yahoo)<\/li>\n<li>bingbot (Bing)<\/li>\n<\/ul>\n<p>Con ello vamos a poner algunos ejemplos de l\u00edneas que podemos colocar en robots.txt y la utilidad de cada una:<\/p>\n<ul>\n<li>Todos los agentes tienen prohibido acceder a esos directorios\/archivos:<\/li>\n<\/ul>\n<p><code>User-agent: \\\\\\*<\/code><\/p>\n<p><code>Disallow: \/wp-admin\/<\/code><\/p>\n<p><code>Disallow: \/temp\/<\/code><\/p>\n<p><code>Disallow: \/precios.shtml<\/code><\/p>\n<ul>\n<li>Bloquear todas las im\u00e1genes del sitio web a Googlebot-Image :<\/li>\n<\/ul>\n<p><code>User Agent: Googlebot-Image<\/code><\/p>\n<p><code>Disallow: \/<\/code><\/p>\n<ul>\n<li>Bloquear todos los archivos PDF a Googlebot:<\/li>\n<\/ul>\n<p><code>User-agent: Googlebot<\/code><\/p>\n<p><code>Disallow: \/\\\\\\*.pdf$<\/code><\/p>\n","protected":false},"template":"","class_list":["post-59991","glossary","type-glossary","status-publish","hentry"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.0 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Robots.txt - Mailrelay<\/title>\n<meta name=\"description\" content=\"El archivo robots.txt es un documento donde se indica, a las ara\u00f1as de indexaci\u00f3n de los motores de b\u00fasquedas\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/mailrelay.com\/es\/glosario\/robots-txt\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Robots.txt - Mailrelay\" \/>\n<meta property=\"og:description\" content=\"El archivo robots.txt es un documento donde se indica, a las ara\u00f1as de indexaci\u00f3n de los motores de b\u00fasquedas\" \/>\n<meta property=\"og:url\" content=\"https:\/\/mailrelay.com\/es\/glosario\/robots-txt\/\" \/>\n<meta property=\"og:site_name\" content=\"Mailrelay\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/Mailrelay\/\" \/>\n<meta property=\"article:modified_time\" content=\"2024-01-12T09:33:42+00:00\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:site\" content=\"@mailrelay\" \/>\n<meta name=\"twitter:label1\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data1\" content=\"3 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/mailrelay.com\/es\/glosario\/robots-txt\/\",\"url\":\"https:\/\/mailrelay.com\/es\/glosario\/robots-txt\/\",\"name\":\"Robots.txt - Mailrelay\",\"isPartOf\":{\"@id\":\"https:\/\/mailrelay.com\/es\/#website\"},\"datePublished\":\"2022-10-26T15:00:35+00:00\",\"dateModified\":\"2024-01-12T09:33:42+00:00\",\"description\":\"El archivo robots.txt es un documento donde se indica, a las ara\u00f1as de indexaci\u00f3n de los motores de b\u00fasquedas\",\"breadcrumb\":{\"@id\":\"https:\/\/mailrelay.com\/es\/glosario\/robots-txt\/#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/mailrelay.com\/es\/glosario\/robots-txt\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/mailrelay.com\/es\/glosario\/robots-txt\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/mailrelay.com\/es\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Robots.txt\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/mailrelay.com\/es\/#website\",\"url\":\"https:\/\/mailrelay.com\/es\/\",\"name\":\"Mailrelay\",\"description\":\"Mailrelay.com - Email Marketing Software\",\"publisher\":{\"@id\":\"https:\/\/mailrelay.com\/es\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/mailrelay.com\/es\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"es\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/mailrelay.com\/es\/#organization\",\"name\":\"Mailrelay\",\"url\":\"https:\/\/mailrelay.com\/es\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\/\/mailrelay.com\/es\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/mailrelay.com\/wp-content\/uploads\/2019\/05\/mailrelay-logo.jpg\",\"contentUrl\":\"https:\/\/mailrelay.com\/wp-content\/uploads\/2019\/05\/mailrelay-logo.jpg\",\"width\":613,\"height\":291,\"caption\":\"Mailrelay\"},\"image\":{\"@id\":\"https:\/\/mailrelay.com\/es\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/www.facebook.com\/Mailrelay\/\",\"https:\/\/x.com\/mailrelay\",\"https:\/\/www.youtube.com\/mailrelay-email-marketing\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Robots.txt - Mailrelay","description":"El archivo robots.txt es un documento donde se indica, a las ara\u00f1as de indexaci\u00f3n de los motores de b\u00fasquedas","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/mailrelay.com\/es\/glosario\/robots-txt\/","og_locale":"es_ES","og_type":"article","og_title":"Robots.txt - Mailrelay","og_description":"El archivo robots.txt es un documento donde se indica, a las ara\u00f1as de indexaci\u00f3n de los motores de b\u00fasquedas","og_url":"https:\/\/mailrelay.com\/es\/glosario\/robots-txt\/","og_site_name":"Mailrelay","article_publisher":"https:\/\/www.facebook.com\/Mailrelay\/","article_modified_time":"2024-01-12T09:33:42+00:00","twitter_card":"summary_large_image","twitter_site":"@mailrelay","twitter_misc":{"Tiempo de lectura":"3 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/mailrelay.com\/es\/glosario\/robots-txt\/","url":"https:\/\/mailrelay.com\/es\/glosario\/robots-txt\/","name":"Robots.txt - Mailrelay","isPartOf":{"@id":"https:\/\/mailrelay.com\/es\/#website"},"datePublished":"2022-10-26T15:00:35+00:00","dateModified":"2024-01-12T09:33:42+00:00","description":"El archivo robots.txt es un documento donde se indica, a las ara\u00f1as de indexaci\u00f3n de los motores de b\u00fasquedas","breadcrumb":{"@id":"https:\/\/mailrelay.com\/es\/glosario\/robots-txt\/#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/mailrelay.com\/es\/glosario\/robots-txt\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/mailrelay.com\/es\/glosario\/robots-txt\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/mailrelay.com\/es\/"},{"@type":"ListItem","position":2,"name":"Robots.txt"}]},{"@type":"WebSite","@id":"https:\/\/mailrelay.com\/es\/#website","url":"https:\/\/mailrelay.com\/es\/","name":"Mailrelay","description":"Mailrelay.com - Email Marketing Software","publisher":{"@id":"https:\/\/mailrelay.com\/es\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/mailrelay.com\/es\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es"},{"@type":"Organization","@id":"https:\/\/mailrelay.com\/es\/#organization","name":"Mailrelay","url":"https:\/\/mailrelay.com\/es\/","logo":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/mailrelay.com\/es\/#\/schema\/logo\/image\/","url":"https:\/\/mailrelay.com\/wp-content\/uploads\/2019\/05\/mailrelay-logo.jpg","contentUrl":"https:\/\/mailrelay.com\/wp-content\/uploads\/2019\/05\/mailrelay-logo.jpg","width":613,"height":291,"caption":"Mailrelay"},"image":{"@id":"https:\/\/mailrelay.com\/es\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/Mailrelay\/","https:\/\/x.com\/mailrelay","https:\/\/www.youtube.com\/mailrelay-email-marketing"]}]}},"uagb_featured_image_src":[],"uagb_author_info":{"display_name":"Mailrelay","author_link":"https:\/\/mailrelay.com\/es\/blog\/author\/"},"uagb_comment_info":0,"uagb_excerpt":"El archivo robots.txt es un documento donde se indica, a las ara\u00f1as de indexaci\u00f3n de los motores de b\u00fasquedas, qu\u00e9 partes de un sitio web pueden se indexadas y proporciona un enlace al XML-sitemap. Dicho de forma mas sencilla, un archivo robots.txt indica a los rastreadores de los buscadores a qu\u00e9 URLs de un sitio&hellip;","_links":{"self":[{"href":"https:\/\/mailrelay.com\/es\/wp-json\/wp\/v2\/glossary\/59991","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mailrelay.com\/es\/wp-json\/wp\/v2\/glossary"}],"about":[{"href":"https:\/\/mailrelay.com\/es\/wp-json\/wp\/v2\/types\/glossary"}],"version-history":[{"count":2,"href":"https:\/\/mailrelay.com\/es\/wp-json\/wp\/v2\/glossary\/59991\/revisions"}],"predecessor-version":[{"id":77667,"href":"https:\/\/mailrelay.com\/es\/wp-json\/wp\/v2\/glossary\/59991\/revisions\/77667"}],"wp:attachment":[{"href":"https:\/\/mailrelay.com\/es\/wp-json\/wp\/v2\/media?parent=59991"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}