Usuario:Lalcantaram/Taller

Webmetría

La Webmetría se conoce como el estudio de los aspectos cuantitativos de la construcción y uso de los recursos de información, estructuras y tecnologías de una parte concreta de Internet, por regla general a una web o portal, desde perspectivas bibliométricas e informétricas^[1]. Este estudio consiste en la aplicación de estadística especializada, cuyos resultados varían dependiendo del tamaño de la muestra o dicho ámbito de aplicación. Este área del conocimiento está en pleno estudio y desarrollo, por lo que existe una variación semántica bastante notable en muy corto espacio de tiempo según se avanza en las investigaciones y pruebas.

Origen

En el ámbito de las Ciencias de la Información, es muy importante hacer uso de indicadores métricos. Estos, al ser analizados, nos permiten comprender, predecir y controlar un fenómeno en particular, determinando factores como:

El crecimiento de cualquier campo de la ciencia, según la variación cronológica del número de trabajos publicados.
El envejecimiento de los campos científicos, según la «vida media» de las referencias de sus publicaciones.
La evolución cronológica de la producción científica, según el año de publicación de los documentos.
La productividad de los autores o instituciones, medida por el número de sus trabajos.
La colaboración entre los científicos e instituciones, medida por el número de autores por trabajo o centros de investigación que colaboran.
El impacto o visibilidad de las publicaciones dentro de la comunidad científica internacional, medido por el número de citas que reciben estas en trabajos posteriores.
El análisis y la evolución de las fuentes difusoras de los trabajos, que se establece por medio de indicadores de impacto de fuentes.
Es así como la webmetría comienza a desarrollarse a finales del siglo XX una nueva métrica acorde al mundo de la información.

El profesor Ingwersen, quien durante varias décadas se ha dedicado a la investigación en el campo de la Informática, Biblioteconomía y Documentación, es considerado el padre de la webmetría. Este término en buena medida surgió de la visionaria mirada del profesor al concebir la idea de comparar la web danesa con la de otros países nórdicos, considerando como un hecho fundamental que la web es un potente medio de comunicación científica y el hecho de medir su comportamiento, nos permite conocer su factor de impacto.

A su vez definió los indicadores web para medir dicho impacto y esto no es más que la lógica del número de enlaces externos y autoenlaces que apuntan a un determinado país o sitio web, dividido por el número de páginas en ese país o sitio web en un momento determinado.

Evolución

La evidente analogia entre páginas web e hiperenlaces, por un lado, y articulos cientificos y citas bibliográficas, por otro, hace que desde la creación de la Web hayan surgido intentos de aplicar los conceptos y herramientas de la bibliometria a ella. La idea de que un enlace a una página Web puede interpretarse como un voto a favor de la misma se deriva del funcionamiento de los sistemas de citación y de elaboración de clasificaciones de impacto en el campo de la investigación cientifica.^[2]

En el contexto de la Web se han puesto de manifiesto relaciones entre variables como son los enlaces recibidos o inlinks (número de enlaces que apuntan a una determinada URL o dominio) y diversas medidas de desempeño de la actividad investigadora. Por ejemplo, se han estudiado las relaciones entre enlaces recibidos por sitios web de universidades con los niveles de investigación alcanzados por las mismas (Thelwall, 2001; Smith y Thelwall, 2002; Tang y Thelwall, 2003; Aguillo, Granadino, Ortega y Prieto, 2006; Aguillo, Ortega, Prieto y Granadino, 2007), enlaces a sitios web de facultades con su productividad investigadora^[3] y enlaces a sitios web de revistas con la calidad de las revistas (Vaughan y Hysen, 2002; Vaughan y Thelwall, 2003). Otros trabajos han empleado los enlaces para medir la visibilidad y el impacto de un grupo de sitios web^[4], para analizar patrones de comunicación informal entre académicos, para analizar la relación con patrones geográficos o distancias entre organizaciones^[5], o para identificar áreas académicas con un mayor impacto en la Web^[6]. Muchos de los trabajos realizados en el campo del estudio de la ciencia son de carácter exploratorio, buscando poner de manifiesto relaciones entre fenómenos observados en la Web y fenómenos propios del mundo fisico. Esta exploración progresiva es la que ha permitido sentar las bases para el desarrollo de sistemas cada vez más elaborados que explotan la información contenida en los hiperenlaces.

Si se tiene en cuenta la naturaleza en apariencia caótica de la Web, es muy significativo el hecho de que, en determinados ámbitos, los estudios webmétricos hayan encontrado correlaciones significativas entre enlaces recibidos y otras variables de reconocido valor, ajenas a la Web; por ejemplo, la calidad de una publicación cientifica o determinadas variables financieras.^[7]

Método

Dada la diversidad de información almacenada en la web las posibilidades para medirla son ilimitadas, pueden ir desde sitios web, páginas web, partes de las páginas web, palabras en las páginas web, enlaces o resultados del motor de búsqueda en la web. Para llevar a acabo este análisis una de las herramientas utilizadas son los llamados webcrawler, también conocidos como arañas, robot de búsqueda, spider, bot, etc.^[8]

Su propósito es analizar y extraer ciertos elementos de la web y básicamente sustrae la información contenida en la URL de una pagina o sitio web, pueden localizar la información completa o dividirla en diversos componentes y realizar la extracción de información muy precisa como pueden ser imágenes, archivos multimedia o documentos.

Utilidad

Llevar a acabo estudios webmétricos nos puede ser de utilidad para obtener datos como:

Banco de datos de imágenes, documentos, metadatos, canales de sindicación.
Colección de textos para la recuperación de información.
Nº total de enlaces analizados (incluyendo duplicaciones).
Nº total de enlaces únicos analizados (sin duplicaciones).
Nº total de enlaces analizados según niveles de profundidad.
Nº de dominios, sitios y páginas web analizadas en cada nivel de profundidad.
Distribución de dominios de tipo genérico y geográfico, según sitios y páginas web.
Distribución de tipos de documentos según su extensión o formato. Por ejemplo documentos ofimáticos, audiovisuales, imágenes, web dinámica y estática.
Análisis de macroestructura de la web. Determinación de los componentes de la web Main, Out, In, Island, Tunnel, Tentacle In, Tentacle Out, según el enlazamiento de los vínculos entre sitios y páginas web del análisis llevado a cabo.
Ranking de sitios y páginas con más metadatos.
Distribución de la tipología de metadatos más utilizada.
Ranking de sitios web con más enlaces únicos y páginas.
Ranking de sitios web con más documentos, imágenes, archivos audiovisuales, etc.
Ranking de sitios web con más canales de sindicación.
Análisis de coenlaces. Sitios y páginas más coenlazados.
Sitios web más enlazados.
Páginas web más enlazadas.
Trazado de hipervínculos entre sitios y páginas web que permite la elaboración de gráficas topográficas de la web analizada.^[9]

Referencias

↑ Björneborn, Lennart (2006-09). «'Mini small worlds' of shortest link paths crossing domain boundaries in an academic Web space». Scientometrics 68 (3): 395-414. ISSN 0138-9130. doi:10.1007/s11192-006-0119-8. Consultado el 19 de noviembre de 2021.
↑ Oppenheim, Charles (1979-10). «Book Reviews : E. GARFIELD, Citation indexing: its theory and application in Science Technology and Humanities (New York, Wiley-Interscience, 1979). ISBN 0 471 02559 3». Journal of Information Science 1 (5): 301-303. ISSN 0165-5515. doi:10.1177/016555157900100511. Consultado el 19 de noviembre de 2021.
↑ Smith, Alastair; Thelwall, Mike (2002). Scientometrics 54 (3): 363-380. ISSN 0138-9130. doi:10.1023/a:1016030415822 http://dx.doi.org/10.1023/a:1016030415822 |url= sin título (ayuda). Consultado el 19 de noviembre de 2021.
↑ Ingwersen, Peter (1998-05). «The calculation of web impact factors». Journal of Documentation 54 (2): 236-243. ISSN 0022-0418. doi:10.1108/eum0000000007167. Consultado el 19 de noviembre de 2021.
↑ Thelwall, Mike (2002-10). «Evidence for the existence of geographic trends in university Web site interlinking». Journal of Documentation 58 (5): 563-574. ISSN 0022-0418. doi:10.1108/00220410210441586. Consultado el 19 de noviembre de 2021.
↑ Li, Xuemei (2003-12). «A review of the development and application of the Web impact factor». Online Information Review 27 (6): 407-417. ISSN 1468-4527. doi:10.1108/14684520310510046. Consultado el 19 de noviembre de 2021.
↑ Holmberg, Kim; Thelwall, Mike (13 de noviembre de 2008). «Local government web sites in Finland: A geographic and webometric analysis». Scientometrics 79 (1): 157-169. ISSN 0138-9130. doi:10.1007/s11192-009-0410-6. Consultado el 19 de noviembre de 2021.
↑ Ochando, Manuel Blázquez (26 de noviembre de 2012). «Sistemas de Recuperación e Internet: Webmetría y análisis de páginas web». Sistemas de Recuperación e Internet. Consultado el 19 de noviembre de 2021.
↑ Thelwall, Michael (1 de enero de 2009). «Introduction to Webometrics: Quantitative Web Research for the Social Sciences». Synthesis Lectures on Information Concepts, Retrieval, and Services 1 (1): 1-116. ISSN 1947-945X. doi:10.2200/S00176ED1V01Y200903ICR004. Consultado el 19 de noviembre de 2021.

[1] Björneborn, Lennart (2006-09). «'Mini small worlds' of shortest link paths crossing domain boundaries in an academic Web space». Scientometrics 68 (3): 395-414. ISSN 0138-9130. doi:10.1007/s11192-006-0119-8. Consultado el 19 de noviembre de 2021.

[2] Oppenheim, Charles (1979-10). «Book Reviews : E. GARFIELD, Citation indexing: its theory and application in Science Technology and Humanities (New York, Wiley-Interscience, 1979). ISBN 0 471 02559 3». Journal of Information Science 1 (5): 301-303. ISSN 0165-5515. doi:10.1177/016555157900100511. Consultado el 19 de noviembre de 2021.

[3] Smith, Alastair; Thelwall, Mike (2002). Scientometrics 54 (3): 363-380. ISSN 0138-9130. doi:10.1023/a:1016030415822 http://dx.doi.org/10.1023/a:1016030415822 |url= sin título (ayuda). Consultado el 19 de noviembre de 2021.

[4] Ingwersen, Peter (1998-05). «The calculation of web impact factors». Journal of Documentation 54 (2): 236-243. ISSN 0022-0418. doi:10.1108/eum0000000007167. Consultado el 19 de noviembre de 2021.

[5] Thelwall, Mike (2002-10). «Evidence for the existence of geographic trends in university Web site interlinking». Journal of Documentation 58 (5): 563-574. ISSN 0022-0418. doi:10.1108/00220410210441586. Consultado el 19 de noviembre de 2021.

[6] Li, Xuemei (2003-12). «A review of the development and application of the Web impact factor». Online Information Review 27 (6): 407-417. ISSN 1468-4527. doi:10.1108/14684520310510046. Consultado el 19 de noviembre de 2021.

[7] Holmberg, Kim; Thelwall, Mike (13 de noviembre de 2008). «Local government web sites in Finland: A geographic and webometric analysis». Scientometrics 79 (1): 157-169. ISSN 0138-9130. doi:10.1007/s11192-009-0410-6. Consultado el 19 de noviembre de 2021.

[8] Ochando, Manuel Blázquez (26 de noviembre de 2012). «Sistemas de Recuperación e Internet: Webmetría y análisis de páginas web». Sistemas de Recuperación e Internet. Consultado el 19 de noviembre de 2021.

[9] Thelwall, Michael (1 de enero de 2009). «Introduction to Webometrics: Quantitative Web Research for the Social Sciences». Synthesis Lectures on Information Concepts, Retrieval, and Services 1 (1): 1-116. ISSN 1947-945X. doi:10.2200/S00176ED1V01Y200903ICR004. Consultado el 19 de noviembre de 2021.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]