Yo se que algunos o muchos de ustedes se han cuestionado esta pregunta: ¿Se debería o no indexar las categorías y etiquetas?, y pues la respuesta puede tener algo positivo o negativo al momento de indexar dichas páginas a los buscadores (Google).
Si tu sitio web se encuentra desarrollado en WordPress, y quieres evitar el riesgo de contenido duplicado, ¿Deberías desindexar las categorías y etiquetas de tu página?, ¿Hacer esto afectará tu tráfico orgánico?.
Estas como otras son algunas preguntas, que les importa a todos los profesionales SEO para entender fundamentalmente cómo funciona dichas etiquetas y categorías en el buscador de Google.
Entonces, para empezar, la respuesta es probablemente no. La mayoría de los sitios web no necesitan preocuparse por el rastreo de Google de algunas páginas en las que no encuentran ningún valor.
Las páginas como las etiquetas, categorías y filtros de busqueda que se incluyen automáticamente (listos para usar) en un gestor de contenidos “CMS” populares como Drupal y WordPress, lo cual generalmente no son lo suficientemente frecuentes como para importar. Si Google ve valor en ellos, los rastreará e indexará. Si no ve nada atractivo, !no lo hará¡.
Si tienes una tienda online o eCommerce, con cientos de miles de productos, esto puede convertirse en un problema mayor, porque desea centrar los rastreadores de Google en las páginas que importan y eliminar cosas que no tienen ningún valor.
Para responder completamente a esta pregunta, también debe comprender la diferencia entre el bloqueo de robots.txt y una etiqueta meta noindex, así como también cómo funcionan los 404 y los soft 404.
Desindexar páginas con el Robots.txt
Si coloca un comando en robots.txt para bloquear el acceso de Google (y otros rastreadores) a las páginas, en realidad evita que lleguen a esas páginas.
Si Google se encuentra con una página que está bloqueada en robots.txt, no ejecutará un comando “Fetch” o GET para acceder al encabezado de la página. Esto significa que si más tarde decide que desea que esa página no esté indexada o que desee publicar otro estado (como un redireccionamiento o un 404), Google no podrá ver ese cambio.
Los comandos de Robots.txt deben limitarse a las páginas que sabe que Google no verá de otra manera (es decir, las personas no se vincularán a ellas, usted no se vinculará a ellas dentro de su sitio y probablemente estén protegidas con contraseña).
Las funciones de administrador, inicio de sesión de miembros o carrito son un buen ejemplo de páginas que le gustaría bloquear en robots.txt. Nunca debe bloquear los archivos JavaScript o CSS que son necesarios para representar correctamente las páginas.
Etiqueta Robots noindex
La etiqueta meta robots=”noindex” es diferente a archivo Robots.txt, y muchos profesionales de SEO la tratan igual. Las mayores diferencias con una etiqueta noindex son:
- Si bien también es una directiva de robots, es menos restringida que robots.txt. Google y otros motores de búsqueda pueden OBTENER la página, los encabezados y todo.
- Hace exactamente lo que suena. Le indica a Google que no indexe, es decir, que no agregue la página como elegible para resultados de búsqueda. Google aún recopilará todos los datos en la página y seguirá todos los enlaces a menos que también use nofollow. Nofollow no es una directiva oficial, pero Google y otros motores de búsqueda lo respetan.
- Si usa una etiqueta noindex y luego decide enviar una redirección del lado del servidor o 404, Google podrá acceder a ese cambio de estado y actualizar sus datos en consecuencia.
Errores 404 y 404 suaves
Las páginas con errores 404 indican que la página no se encuentra y son un estándar web que todos los rastreadores respetan. Si Google encuentra una página de error 404, la eliminará del índice, pero la mantendrá en su programador de rastreo para verificarla periódicamente … solo para asegurarse de que no ha cambiado.
Un error 404 suave es una designación no oficial que Google coloca en páginas que pueden resolverse con un estado 200 (Encontrado), pero que no proporcionan ningún contenido. Las páginas de resultados de búsqueda interna que tienen cero resultados son un ejemplo de esto. Si Google designa una página como un error 404 suave, la trata de la misma manera que el error 404. Al igual que con el error 404, lo revisarán periódicamente para asegurarse de que no cambie.
¿Debería usar Noindex en las páginas de categoría?
Lo que nos lleva de vuelta a nuestra pregunta: ¿no es el índice la estrategia correcta para las páginas de categoría que agregan poco o ningún valor a su sitio web?.
La respuesta es que si cree que las páginas no agregan valor, probablemente debería eliminarlas por completo y mostrar un estado de error 404. Si las páginas son importantes para que los usuarios naveguen y son un “mal necesario” de tener un blog, entonces no se deben indexar.
Si no indexa las páginas, Google ha declarado que eventualmente tratarán esas páginas como 404 suaves. Esto significa que ningún enlace que apunte a estas páginas contará para las determinaciones de clasificación.
¿Por qué importa esto? En última instancia, probablemente no.
Si los enlaces apuntan a páginas que no crees que tengan ningún valor, entonces los motores de búsqueda y los usuarios probablemente tampoco encuentren ningún valor en ellas.
Qué no hacer
No canonice todas las páginas de categorías y etiquetas a la página raíz del blog. Este es un uso inadecuado para la canolización de URLs. Google lo ignorará.
Te invito a leer un poco más sobre las URL canonica >> Que es una url canonica
No coloque estas páginas en robots.txt. Si los bloquea, Google no podrá ver cuándo los actualiza o cambia, pero permanecerán en los resultados de búsqueda.
Mi opinión sobre desindexar categorías y etiquetas de un blog
Después de todo lo escrito y hablado de cómo desindexar algunas páginas y en especial las categorías y etiquetas de un blog o portal web de noticias. Lo primero que debemos saber es que tan optimizado se encuentra tu sitio blog.
Si tenemos la calidad de contenido y una buena estructura y distribución en un blog, podemos mejorar la optimización de las categorías y etiquetas mismas si es que son relevantes o no. Pero no quiero decir que si tenemos todo estructurado a nivel SEO, podemos indexar las categorías y etiquetas. ¡Déjame decirte que no!.
Primero tienes que saber diferenciar la estructura de las Categorías y Etiquetas de un blog. A menudo que vamos creando contenido, nos fijamos que las categorías son como las secciones principales de un blog, donde se listarán todos los contenidos relacionados del tema generado.
Pero también las Etiquetas cumplen con esta misma acción. Solo que son más especificas y directas al momento de encontrar o relacionar los contenos.
Ahora mi pregunta es…. ¿Para que necesitaría indexar las Categorías y Etiquetas a la vez si es que cumplen casi la misma función?.
Antes de responder, quiero mencionar que debemos tener un punto de vista breve y detallado a que nos vamos a someter al momento de indexar dichas URLs a Google. Entonces la respuesta es simplemente si alguna vez tomaste en cuenta optimizar las etiquetas o categorías. Si es así no deberías de desindexarlo, ya que puede ser relevante.
Pero si tienes 10 a 20 categorías, optimizalos lo más que puedas. ¿Y las etiquetas? Pueda ser que tengas la misma cantidad de urls o más, pero probablemente no será de gran beneficio optimizarlo e indexarlo ya que duplicarías el contenido con las mismas palabras clave y aumentarías el presupuesto de rastreo. Así que mejor Desindexalos.
Espero con esas duda quede un poco claro de cómo puedes aprovechar las categorías y etiquetas de tu blog, si es conveniente indexarlos o no desde los buscadores.
En conclusión
Asegúrese de que usted y su equipo de desarrollo sepan la diferencia entre los comandos noindex de robots.txt y meta robots. Úsalos apropiadamente y estarás un paso por delante del juego.
Si tiene categorías o páginas que no proporcionan ningún valor a los buscadores como página de destino, pero son necesarias para la navegación, reconsidere su estrategia seo (¿quizás sería apropiada una página de categoría más informativa con algún contenido único?) O no indexe las páginas.
Si solo tiene un puñado de estas páginas, o no cree que sean un gran problema en su sitio, simplemente déjelas como están. Google es lo suficientemente inteligente como para descubrirlo.
¿Tienes alguna pregunta o duda?, no olvides dejar tu comentario para poder ayudarte o resolver alguna duda. Nos vemos.
Esta entrada tiene 0 comentarios