Principales tecnicas de webspam

Principales tecnicas de WebSpam

Voy a enumerar las principales técnicas de webspam que se están utilizando hoy dia en la red.

  • Spamdexing / Spining: Mediante diferentes técnicas se generan contenidos artificialmente y de manera automática, con lo que se consigue una gran cantidad de contenidos y páginas indexadas en poco tiempo y sin esfuerzo.

Existen diferentes tipos de software que de manera mas o menos avanzada succiona contenidos a través de las SERPs de buscadores, feed RSS, diversos grupos de noticias, wikis, foros, etc Estos contenidos son alterados mediante diferentes técnicas para intentar evitar los algoritmos de detección de contenido duplicado que han implementado los buscadores.

¿Como se camufla este contenido duplicado?

  1. Mezcla de Contenido de diferentes fuentes
  2. Cambio de orden en frases y párrafos
  3. Cacheo de consultas a buscadores internos con contenido aleatorio
  4. Mezcla de frases al azar, o selectivamente mediante afinidad de palabras clave.
  5. Traducción de contenios a diferentes idiomas
  6. “Find and Replace” mediante diccionarios de sinónimos, y términos relacionados
  7. etc

Continue reading “Principales tecnicas de webspam”

¿Que es el Webspam?

Mi colaboración en el Search Congress de Barcelona trataba sobre el Webspam. Me podían encontrar en el Google Corner, junto a Judith Garcia – AdWords Account Strategist – de Google España, y el viernes también gozamos con la presencia de Eva Visiers – Google Analytics Specialist -.

Los Corners no funcionaron todo lo bien que nos hubiera gustado, pero aprovecharé mi presentación para ir publicando una serie de post sobre Webspam, analizando este tema desde dos puntos de vista:

  • Webspammers “Los Malos”: Nuevas amenazas, Quienes Son, Como Actuan, Que técnicas utilizan, Como aprovechan la Web 2.0, Porque son “Los Malos”, etc
  • Buscadores “Los Buenos”: Que consideran Webspam, Como lo detectan, Que miden, Herramientas y Algoritmos que usan, o usarán en el futuro para combatir estas amenazas para la calidad de sus resultados. Y por supuesto una valoración y crítica final sobre la efectividad de estas medidas de Lucha Anti-Spam.

El SPAM ha sido relacionado históricamente con el spam por correo electrónico, pero con la evolución de la red han aparecido nuevas amenazas como el Web-SPAM, o el mas reciente Mobile-SPAM relacionados por la intención de los atacantes, pero diferente en los métodos y medios utilizados.

Empezamos con una definición generalista, ¿Que es el webspam?:

Continue reading “¿Que es el Webspam?”

WebSpam en el Search Congress

Webspam Search Congress
Webspam Search Congress

Esta semana asisto como “Padrino Experto” del Google Corner en el Search Congress de Barcelona. Allí hablaré sobre WebSpam, que es, evolución de las técnicas que emplean los webspammers, y como los motores de búsqueda luchan contra este problema.

La realidad es que mucha gente confunde Webspam, con SEO. Para una persona no familizarizada con este trabajo puede parecer lo mismo, pero existen diferencias muy significativas entre la optimización para motores de búsqueda y el WebSpam.

Hablaré sobre lo que ha supuesto la evolución de la Web 2.0 en el webspam:

  • Técnicas de hijacking
  • Generación automática de contenidos
  • Splogs
  • etc.

Así como los últimos trabajos realizados por los buscadores en matería de lucha contra el spam. Los nuevos algoritmos que intentan mejorar la detección, y eliminación de los rankings de estas páginas creadas mediante técnicas de webspam (Trustrank, Anti-Trustrank, WITH, etc).

Explicaré como estos algoritmos, algunos ya implementados total, o parcialmente, y otros en proceso de incorporación filtran los resultados basándose en diferentes análisis complejos de enlaces y contenido.

Y un nuevo problema:

  • Spam en redes sociales
  • Agregadores de noticias
  • Sistemas de valoracion de productos
  • Ranking por Votación de usuarios
  • etc

De momento quien quiera saber algo más de todo esto, tendrá que acercarse por el Google Corner (Jueves y Viernes) del Search Congress. Los Corners serán zonas distendidas, donde se podrá charlar tranquilamente de todos estos temas, tomar un café, y descansar en los intermedios de las ponencias.

El próximo fin de semana colgaré la presentación, y publicaré un artículo explicando algunas cosas de esta mala práctica que cada vez se convierte en un problema mayor para los buscadores, y usarios de la red.

WordPress Appliance - Powered by TurnKey Linux