BUSCADORES » Blog Archive » POSICIONAMIENTO: FACILIDAD DE INDEXACIÓN. PHP vs. HTML

POSICIONAMIENTO: FACILIDAD DE INDEXACIÓN. PHP vs. HTML

Imagen prueba capacidad indexacion urls dinamicas reestructuradas semanticamente. Graf. SHB.
Google no tiene problemas en indexar URL’s dinámicas “reestructuradas semánticamente”. Graf. SHB
Este es un tema que aunque no hemos tratado en ningún post de este blog de forma especifica, pero si hemos comentado algún experimento sobre como aparentemente la velocidad y disponibilidad de un website  afectan a su posicionamiento, y este tema aunque orientado al lenguaje de programación, también como veremos los procesos de indexación de contenidos textuales, enlaces, imágenes y otros elementos son distintos para ambos tipos de documentos.
En este post trataremos de dilucidar que tipo de documentos HTML ó PHP, son más fáciles de indexar.
Quiero aclarar un concepto, no analizamos que tipo de documento se presta mejor para el trabajo SEO, porque aquí sería imprescindible hablar de un puñado de cuestiones sobre métodos poco éticos o al menos cuestionables de clonación de la información y muchas otras cuestiones. En todo caso los métodos de optimización del posicionamiento no son el objeto de este artículo.
Tampoco podemos evaluar la pericia y calidad de los trabajos y sus creadores. Partimos de que comparamos documentos virtualmente perfectos. Es evidente, no obstante, que a la hora de evaluar la capacidad de indexación de la paginación de los documentos, en este punto cabe hacer una excepción referente a los idiomas de paginación dinámica, se trata de la utilización ó no de plugins y facilidades de emulación de URL’s semánticas. Esta consideración es imprescindible para evaluar correctamente variables como la velocidad de indexación y es muy de tener en cuenta en cualquier estrategia de posicionamiento.
Aclarado todo esto, vamos a centrar esta disertación, en tratar de recomponer los procesos de indexación de un robot perteneciente a un buscador avanzado y desde la humilde perspectiva del método científico en cuanto intentaremos no presuponer nada y limitarnos a anotar las variables y sus resultados contrastados, intentaremos vislumbrar las diferencias y las exigencias que cada tipo de documento ofrece a los robot de búsqueda para su indexación.
Esencialmente la indexación robotizada de documentos comienza a instancias de otro documento que lo enlaza, este otro documento puede ser cualquier otra página web incluidas las propias del buscador, su memoria. El robot sigue el enlace del que ha almacenado información del contenido de su anchor text, del texto alternativo si es una imagen, de la temática web que lo contiene y otras como los criterios de autoridad y ranking si le son disponibles, el robot siguiendo dicho enlace intenta acceder a nuestra pátina web para ello primero mira si existe un archivo “robot.txt” que administra los accesos a las distintas páginas por parte de los robot de búsqueda y establece que páginas ( las de datos de clientes entre otras) el robot no debe almacenar, si no encuentra este archivo indexará ( hablamos de la parte automática del proceso) el contenido de la página, los robot sofisticados almacenan distintos tipos de información una bastante interesante porque resulta visible es la que denominamos “caché” se trata de 2 documentos, uno es como una fotocopia de la página en cuestión el otro denominado “caché de texto” recoge la parte textual visible de la página, si no conoce suficiente de este tema debería leer este post dedicado a los comandos en buscadores, por otra parte comienza la indexación del documento y entre otras partes en el tenemos una parte denominada “head” que contiene las metaetiquetas, son indexadas sin dificultad, hasta aquí nada nos puede hacer intuir ninguna diferencia en la facilidad de indexación de ambos modelos. En algún momento y siguiendo los enlaces internos el robot comienza con la indexación de la paginación, referente a los enlaces externos contenidos serán igualmente seguidos por instancias del mismo robot.
Minerales. Aguamarina. Foto SpainHotelsBooking s.l.
Aguamarina. Minerales. Foto SHB
El problema que queremos analizar surge en este momento cuando el robot comienza la indexación de la paginación del documento. Aquí hablar de documentos virtualmente perfectos no es computable en tanto la evolución formal de los documentos web hacen preconizar otras formas de indexación no paginada, pero en cualquier caso, en tanto los buscadores sean buscadores de páginas web, sus resultados irán orientados a documentos completos.
Uno de los procesos que el buscador avanzado hace es el calculo de la densidad de las palabras, para con ella intentar establecer un contenido temático al que adscribirla, este proceso trascendental para el correcto posicionamiento de nuestros websites tampoco parece hacernos intuir un funcionamiento mas eficaz para uno u otro lenguaje, pero es importante señalar que uno de los elementos que el buscador tiene en cuenta para calcular tal densidad global de palabras clave de nuestro sitio y puntualizada de cada página es su presencia en las URL’s y aquí encontramos uno de los puntos críticos, por esto hemos hecho una excepción en cuanto a los métodos porque existen algunos capaces de construir, con distinta suerte, URL’s semánticas. Decimos con distinta suerte porque por ejemplo sabemos que el método que utiliza Oscommerce pues está en ciernes y en sus propias páginas lo advierten aunque existen plugins externos para el mismo fin que parece funcionan. Sin embargo y tal y como ilustra la imagen que encabeza este artículo programas como el Wordpress construyen URL’s semánticas totalmente funcionales y perfectamente indexables. Hasta aquí todo lo que podemos afirmar sin entrar en el terreno de la especulación.
Como ya hemos afirmado la velocidad de acceso de nuestro servidor que se puede traducir en disponibilidad ó no de ancho de banda puede afectar a la indexación de vuestra web, sabemos que si una web pasa muchos intervalos de tiempo caída o no accesible, debemos tener en cuenta que el robot como cualquier programa tiene un time-out,  perderá progresivamente posicionamiento. Por lo tanto podemos intuir que las velocidades de los procesos pueden tener una importancia, recordemos que no todas las páginas de un website son indexadas simultáneamente ni adquieren la misma relevancia.
Llegado este punto y de una forma totalmente improvisada me atrevo a afirmar que la paginación de un documento HTML es más fácilmente indexable porque requiere un proceso de conversión menos. Soy perfectamente consciente de lo arriesgado de mi afirmación, que se fundamenta simplemente en el funcionamiento de construcción dinámica y deja a un lado, evidentemente considerar la pericia y calidad del método quiero decir que podría equivocarme en tanto realmente los buscadores almacenan las URL’s directamente como se muestran en el navegador, pero al afectar al proceso de seguimiento de link y sobre todo teniendo en cuenta que el proceso de construcción dinámica requiere la interpretación de una base de datos, al igual que para la construcción de su URL’s y siendo estos procesos coincidentes en el mismo servidor pensamos que la cantidad de información total a procesar por su CPU, es superior y más compleja en el caso del lenguaje PHP que en el caso del HTML. En cualquier caso la diferencia no parece ser significativa ¿ o sí?.
Para una mejor indexación de la paginación de su web site use Google SiteMaps, en breve hablaremos de su uso.
Relacionados en nuestro MANUAL DE POSICIONAMIENTO:
Arquitectura web

Leave a Reply