• Categoría de la entrada:Wordpress
  • Tiempo de lectura:6 minutos de lectura

¿Sabías que los archivos PDF pueden ser indexados en Google? Esto puede ser un gran problema si tienes información confidencial que no quieres que sea compartida en línea. Si estás utilizando WordPress como tu plataforma de contenido, no te preocupes, ¡hay solución!

En este artículo, te mostraremos cómo evitar el indexado de archivos PDF en WordPress para que puedas proteger tu contenido en línea.

Crear un archivo robots.txt

Lo primero que debes hacer es crear un archivo robots.txt en la raíz de tu sitio web. Este archivo le dice a los motores de búsqueda qué páginas y archivos no deben ser indexados. Para crear el archivo, abre un editor de texto y escribe lo siguiente:

User-agent: *
Disallow: /wp-content/uploads/

Este código le dice a los motores de búsqueda que no indexen la carpeta de subida de archivos de WordPress. Si tus archivos PDF se encuentran en una carpeta diferente, simplemente cambia la ruta en el código.

Otra forma de desactivar la indexación de archivos PDF en WordPress es utilizando el archivo robots.txt y añadiendo la siguiente línea:

Disallow: /*.pdf$

Este código le dice a los motores de búsqueda que no indexen ningún archivo que tenga la extensión .pdf. Es importante tener en cuenta que esta técnica no garantiza que tus archivos PDF no sean indexados en otros sitios web.

También puedes utilizar la etiqueta X-Robots-Tag para no indexar tus archivos PDF. Esta etiqueta se utiliza en el encabezado HTTP de la página y le dice a los motores de búsqueda cómo indexar el contenido. Para no indexar los archivos PDF, añade la siguiente etiqueta en el encabezado HTTP:

<Files *.pdf>
Header set X-Robots-Tag "noindex, nofollow"
</Files>

Esta etiqueta se puede añadir a través del archivo .htaccess o utilizando un plugin de WordPress que permita la edición del encabezado HTTP.

Si prefieres utilizar un plugin de WordPress para añadir la etiqueta X-Robots-Tag, puedes instalar y activar el plugin «Header and Footer Scripts«. Luego, ve a Configuración > Header and Footer Scripts y añade el siguiente código en la sección «Scripts en el encabezado»:

<Files *.pdf>
Header set X-Robots-Tag "noindex, nofollow"
</Files>

Guarda los cambios y la etiqueta X-Robots-Tag se añadirá automáticamente en el encabezado HTTP de tus archivos PDF.

Agregar metadatos a tus archivos PDF

La mayoría de los archivos PDF tienen metadatos que se pueden editar para ayudar a prevenir su indexación en Google. Para hacer esto, abre el archivo PDF en Adobe Acrobat y haz clic en Archivo > Propiedades. En la ventana de Propiedades, selecciona la pestaña Avanzadas y luego selecciona «No permitir que los motores de búsqueda indexen este documento«.

Agregar código en el archivo functions.php

El último paso es agregar código en el archivo functions.php de tu tema de WordPress. Este código le dice a WordPress que no incluya los archivos PDF en el archivo sitemap.xml, que es utilizado por los motores de búsqueda para indexar tu sitio. Aquí está el código que debes agregar:

function exclude_pdf_from_sitemap($value, $loc, $changefreq, $priority, $lastmod, $pdf) {
    if($pdf) {
        return null;
    }
return $value;
}
add_filter('wpseo_sitemap_entry', 'exclude_pdf_from_sitemap', 10, 6);

Este código le dice a WordPress que si un archivo es un PDF, no lo incluya en el archivo sitemap.xml. Si tienes otros tipos de archivos que no quieres incluir en el sitemap, simplemente agrega una nueva condición en el código.

¡Listo! Ahora tus archivos PDF están protegidos de la indexación en Google. Asegúrate de actualizar tu archivo robots.txt y agregar metadatos a tus archivos PDF existentes.

¡Esperamos que este artículo te haya sido útil! Si tienes algún comentario o sugerencia, por favor compártelo en la sección de comentarios. También, si crees que alguien más puede beneficiarse de esta información, compártela en tus redes sociales. ¡Gracias por leer!

Deja una respuesta