Opera afirma que sólo el 4,13% de las páginas web cumplen los estándares

El fabricante del navegador Opera ha publicado los primeros resultados de un estudio que está llevado a cargo para profundicar sobre la estructura de los contenidos de Internet. Para llevar a cabo este proyecto, Opera ha creado Metadata Analysis and Mining Application (MAMA), una herraamienta que peina e indexa actualmente los datos de aproximadamente 3,5 millones de páginas

Los datos estadísticos obtenidos de la recolección de datos por MAMA ha permitido que los ingenieros de Opera comprendan en mayor manera cómo está repartido el mercado en cuanto a formatos, estándares usados y tecnologías varias. Opera planes llevar el proyecto al sigueiente nivel, como motor de búsqueda sobre los datos indexados para que los diseñadores web, programadores de navegadores, y expertos en estándares puedan obtener información sobre el uso real de tecnologías web.

Los datos preliminares publicados hoy traen consigo algunos datos intrigantes sobre el uso de elementos específicos del lenguaje HTML como son las etiquetas HEAD, TITLE, HTML, BODY, A, META, IMG, y TABLE. El popular Adobe Flash se encuentra en el 35% de páginas indexadas, llegando hasta un 67% en las páginas de China.

MAMA arrojó unos datos muy chocantes sobre el cumplimiento de estándares por parte de las páginas web, sólo un 4,13% son completamente válidas. Los ingenieros de Opera han indagado un poco más en los valores y según parece un 50% de las páginas web fueron creadas siguiendo el estándar pero se desvirtuó con adiciones y cambios posteriores.

vINQulos:
ArsTechnica