Usuario discusión:Angus/Wikipedia semántica

Contenido de la página no disponible en otros idiomas.
De Wikipedia, la enciclopedia libre

Actualización de datos[editar]

Surgió el tema hace tiempo (lamentablemente no encuentro referencias). Fue poco después de la introducción de <noinclude> e <includeonly> y la idea había sido usarlas para especificar un dato que pudiera extraerse de un miniartículo del tipo:

<noinclude>La población de Argentina, según el censo del 2078 es de </noinclude>74.201.498<noinclude> habitantes.</noinclude>

Luego, cada artículo que necesite referirse a la población de Argentina, podría hacerlo de la siguiente manera

La población de Argentina es de {{Población de Argentina}} habitantes.

La opinión general fue que era engorrosísimo y que el autor del artículo bien puede actualizar el número a mano. Coincidí (y coincido) con que ese tipo de actualizaciones y/o referencias intra-artículos no son realmente necesarias, así que podríamos quitar esa parte de la propuesta. Lo que importa es que se actualice el principal. --angus (msjs) 16:46 15 mar 2006 (CET)

A mí me gusta más la opción de insertar los metadatos como comentarios dentro del texto, me parece más cómodo que duplicar datos y la información semántica es invisible; no obstante, no son razones de peso, y creo que me podéis convencer de cualquier otra opción rápidamente, pero bueno. Por otro lado, creo que se podría empezar por un tipo de artículo muy concreto, y que ese tipo de artículo podría ser ciudades o municipios. En parte porque se puede seguir el ejemplo de San Diego, que ya estará bastante pensado, y en parte porque me parece un tipo de artículo que da juego, tiene varios tipos de metadatos, de pertenencia, cantidades, coordenadas (lo de enlazar con googlemaps está bastante bien, por cierto), y es el típico tipo de artículo que se beneficiaría de la sustitución de categorías y listas por metadatos, aunque aún no se pueda buscar por metadatos. La discusión de los tipos de metadato en estos artículos creo que sería más sencilla que en otros, y puede ser un buen grupo para hacer pruebas. --Chabacano (discusión) 23:15 16 mar 2006 (CET)

Dirección de la semántica[editar]

Yo veo en la propuesta dos direcciones distintas de la información: desde tablas maestras a los artículos (por ejemplo, para actualizar automáticamente los datos a partir de una fuente única), y de los artículos a tablas maestras, de clasificación o categorización. Lamentablemente, los nombres que acabo de darles son un poco confusos; en realidad, el flujo de información en la segunda dirección puede servir para actualizar artículos (como los de efemérides, o las listas de ciudades por población). Quizás haya que distinguir entre artículos narrativos y artículos tabulares, o más abstractamente entre narraciones y tablas, para ser preciso. En fin, en lo que sigue hablará de artículos y de tablas, y espero que se me entienda.

Por como funciona Wikipedia, los procedimientos para habilitar los dos flujos de información van a necesitar estructura distinta. Crear y gestionar tablas es relativamente fácil, y la sintaxis de plantillas permite darles una forma fácil de parsear (perdón por el neologismo) junto con un aspecto útil sin demasiada complicación. Es decir: podríamos transformar los infoboxes en vehículos de información categorizable (y no tienen por qué ser necesariamente visibles; de:Vorlage:Personendaten no lo es, salvo que uno se lo habilite explícitamente en el CSS), de los que después los bots se alimenten para transformar esos datos en tablas. Supongo que no hay demasiados géneros de cosas en que se puedan usar con facilidad, sin embargo; se me ocurren las biografías —quizás con algún ajuste para acomodar los datos propios de políticos, actores, músicos y algunas otras profesiones que pueden resultar interesantes de clasificar—, las localidades, las divisiones territoriales, los países, las películas; sin infobox al corriente, pero con firmes posibilidades de recibir uno, tenemos los libros, los discos, algunos accidentes geográficos (ríos, montes, islas). Claro está que en algunos de estos casos los datos son más bien estáticos (los montes no cambian de altura como las ciudades de población), así que la utilidad sería más reducida. Formalizando las propiedades semánticas de las plantillas de una manera regular, podemos permitir el parseo de las mismas para producir otras tablas (listas por población, gobernantes en ejercicio, efemérides, etc.). Yo preferiría usar las mismas infoboxes a ese efecto antes que obligar a duplicar la información en una tabla adicional al final; el proyecto de estandarizarlas sería largo y a veces difícil, pero no imposible.

Veo más complicado el flujo en el otro sentido: de tablas a artículos. La flexibilidad sintáctica de los lenguajes naturales hace difícil el parseo. La alternativa obvia es usar un lenguaje de marcado; podría ser de tipo XML clásico (tipo "la población de Pirulandia es de <población>69.001</población> habitantes", con la posible adición de parámetros extra; "Con <población>6.901</población> habitantes, Pirulo City es la segunda ciudad más grande de Pirulandia, sólo superada por Puerto Pirulez, con <población ciudad="Puerto Pirulez">13.099</población>"), o podría asimilarse a las convenciones de Wikipedia mediante (otra vez) plantillas: "la población de Pirulandia es de {{población|69.001}} habitantes". Las plantillas no tendrían aquí valor de renderizado (podrían contener simplemente {{{1}}} como código), sino para el parser; los parámetros adicionales se colocarían con la sintaxis de barras ya habitual ("Con {{población|6.901}} habitantes, Pirulo City es la segunda ciudad más grande de Pirulandia, sólo superada por Puerto Pirulez, con {{población|13.099|Puerto Pirulez}}".

No estoy seguro, sin embargo, de que esto no haga más pronunciada de lo que ya es la curva de aprendizaje de MediaWiki. Habría que evaluar muy seriamente los costos y beneficios que el esquema impone, y el perceptible coste de la implementación. Quizás podríamos hablar con los alemanes para que nos cuenten su experiencia. Taragüí @ 21:47 25 mar 2006 (CET)