Ir al contenido

Usuario:FAR/Ensayo sobre las categorías/IRC

De Wikipedia, la enciclopedia libre

<F-AR> Hprmedina, tienes un momento?
<Hprmedina> cri cri F-AR, claro
<F-AR> sigo dandole vueltas a un experimento mental sobre bots y categorías que comenté en el café con angus hace meses
<F-AR> y como se parece al favor que me hiciste quería consultar como de factible lo ves
<Hprmedina> o.o
<F-AR> ¿recuerdas cuando me ayudaste a subdividr la categoría de zaragozanos según el siglo?
<Hprmedina> linka!
<Hprmedina> sí
<Hprmedina> no recuerdo el hilo del café, F-AR, ¿tienes el link a mano? o me explicas acá
<F-AR> estoy buscano, un seg
<F-AR> https://es.wikipedia.org/wiki/Wikipedia:Caf%C3%A9/Archivo/2013/Mayo#Duda_sobre_procedimientos
<F-AR> es un tocho
<F-AR> y mucho era elucubrar
<F-AR> pero resumiendo
<F-AR> hay muchas categorías que requieren mucho mantenimiento y que algunos creemos que se podría hacer mejor con bots
<F-AR> por ejemplo, es muy habitual que una categoría de biografías se subdivida por siglo y/o país
<F-AR> en el fondo, se trata de definir un conjunto de intersección de categorías como lo de zaragozanos, pero de forma más general 
<F-AR> la idea es, aportar la información sobre categorías de la forma lo más semantica posible, por ejemplo del tipo 
<AsimovBot> [1] https://es.wikipedia.org/wiki/Template:NF
<F-AR> y que la plantilla o un bot compruebe si existen Categoría:Filósofos de Argentina del siglo XX
<F-AR> si no, Categoría:Filósofos de Argentina y Categoría:Filósofos del siglo XX
<F-AR> o si no Categoría:Argentinos, etc
<F-AR> el objetivo es evitar casos donde hay numerosas intersecciones y un artículo no está siempre bien categorizado
<F-AR> porque lo ponen bajo una categoría sin mirar sus subdivisiones o usan una subdivisión cronológica en vez de una espacial cuando coexisten ambos esquemas
<F-AR> me preguntaba, dado que ya lo habías hecho, que necesitarías que estuviera "marcado"
* Hprmedina ha terminado de leer el hilo.. .ufff...
* Hprmedina está compilando la información proporcionada por F-AR ....
<F-AR> era más teórico, quería hacer rebotar las ideas con angus
* Hprmedina termina la compilación y está lleno de ideas por ordenar...
<Hprmedina> En teoría, cada artículo debería estar al nivel de hojas, dentro del árbol de categorías.
* F-AR busca el bugzilla de Hprmedina para sugerir que le sea incorporado una barra de progreso (a ser posible con el calculador de tiempos de Windows Vista)
<Hprmedina> si está en una rama, el bot debería tratar de bajarlo a la hoja más apropiada
<Hprmedina> XD
<F-AR> Hprmedina, no reduciría tiempo y complejidad saber que trabajamos con un determinado subconjunto?
<F-AR> quiero decir
<F-AR> sería mirar todos los artículos en la categoría:nacidos en XX y fallecidos en YY
<F-AR> y comprobar cuales interesectan con subcategorías de unas determinadas categorías (por profesión, nacionalidad, etc)
<Hprmedina> claro
<F-AR> para reducir el número de peticiones de páginas del bot
<Hprmedina> a ver....
<Hprmedina> existen árboles de varios tipos
<Hprmedina> por ejemplo, por país... localidad
* F-AR toma nota en su cuadernillo
<Hprmedina> estoy divagando...
<Hprmedina> otro árbol por ejemplo es el de la parte temporal.... (por siglo, año, milenio, etc)
<Hprmedina> son árboles distintos
<F-AR> el problema es que pueden cruzarse
<Hprmedina> y cada artículo debería estar en algún punto de ese árbol y en ambos árboles
<Hprmedina> por ejemplo los "físicos"
<F-AR> me refiero: que debería no significa que lo haga en la wiki
<Hprmedina> la persona "es un físico" y lo categorizamos en el árbol de "nacidos" (temporal) árbol de fallecidos (temporal),  localidad de nacimiento (espacial) y lo mismo para fallecimiento
<F-AR> hombre, así dicho
<F-AR> habría una manera menos botera de trampear
<F-AR> lo que no sé es los efectos en el servidor
<F-AR> que será más eficiente
<F-AR> dado que existe {{ficha de persona}}
<AsimovBot> [2] https://es.wikipedia.org/wiki/Template:ficha_de_persona
<F-AR> se podría hacer un módulo LUA que lo gestionara
<F-AR> (notese el condicional dado que yo no sé lua)
<F-AR> porque esa misma información ya está ahí
<Hprmedina> la misma ficha lo puede hacer, podría categorizar según los datos que tenga
<F-AR> Hprmedina, por curioidad tu estabas en el proyecto:plantillas?
<Hprmedina> sí
<Hprmedina> aún estoy XD
<F-AR> aunque esto sería una fase ulterior: puedo preguntar como va exactamente el tema de las plantillas con bandera y país?
<Hprmedina> no he visto nada de eso.
<Hprmedina> Estoy metido de cabeza potenciando a Grillitus para mejorar más rápido las plantillas
<F-AR> vale, una de las cosas a las que daba vueltas es si de Lugar de nacimiento = Santiago se podía obtener Chile de alguna forma
<Hprmedina> sí
<F-AR> de forma eficiente?
<F-AR> un día tengo que aprender en serio a programar 
<Hprmedina> hay que recorrer el árbol en forma ascendente
<Hprmedina> en todo caso siempre será un lio
<F-AR> ok
<Hprmedina> cada localidad debería tener un "está en"
<F-AR> entonces diagnóstico: ¿es muy loco plantear lo que digo?
<Hprmedina> el gran problema, es que finalmente al no teneruna herramienta de consulta de categorías decente, hemos terminado mezclando los árboles creando todas las intersecciones
<Hprmedina> no, es ideal, solo habría que reordenar "todo"
<Hprmedina> y categorizar como sugieres
<Hprmedina> Física
<Hprmedina> Personas
<Hprmedina> Siglo XX
<Hprmedina> Francia
<Hprmedina> Femenino
<Hprmedina> por ejemplo ahí, tienes varios árboles, pero está mal categorizado.
<Hprmedina> Física- > ok
<Hprmedina> Personas -> ok
<Hprmedina> Siglo XX -> mal -> 1936
<Hprmedina> Francia -> mal, debería ser la localidad más granular
<Hprmedina> Femenino -> ok
<F-AR> si
<Hprmedina> dado que Siglo XX es un derivado de 1936
<F-AR> hace años que ya leí una crítica seria al sistema
<F-AR> son todo booleanos: pertenece o no a la categoría tal
<F-AR> no admite cantidades
<Hprmedina> luego bastaría con categorizar en las puntas de cada árbol.
<F-AR> y desde luego es ortopédico para operar a partir de datos
<Hprmedina> incluso "Física" sería incorrecto, podría ser una hoja, ej "Física cuantica"
<Hprmedina> pero no es así
<Hprmedina> el tema es que "pertenece a todas las categorías en alguno de sus puntos"
<Hprmedina> o no pertenece
<F-AR> Hprmedina, no se puede citar una conversación del IRC, verdad?
<Hprmedina> sí se puede, si los involucrados acceden
<Hprmedina> siguiendo el ejemplo anterior
<Hprmedina> tenemos el árbol de categoría "genero", con dos hojas por ejemplo "femenino", "masculino"  -> es un árbol con 1 nivel, para el caso sería "femenino"
<F-AR> como ultimamente llevo muchis debates sobre el tema, estoy tratando de ponerlo por escrito
<F-AR> me preguntaba si podía añadir esta conversación
<Hprmedina> árbol de ubicación, (sobre el planeta tierra XD ) "ubicación" -> "continente"-> "país" -> "subdivisiones" -> etc... y esta ponerla en la hoja más baja, este sería un árbol multinivel, al ponerla en la hoja, se puede deducir el país y con eso el continente por ejemplo en la consulta
<Hprmedina> por mí no hay problema, dale
<Hprmedina> supongamos que luego hacemos una consulta, y aparece un formulario. Este debería mostrarte los árboles disponibles sobres los cuales consultar, en este caso vimos "genero" y "ubicación"
<Hprmedina> luego seleccionas el punto dentro de cada árbol, por ejemplo quiero "francia" y "femenino". y el sistema puede buscar las intersecciones.
<Hprmedina> como no existe la herramienta hemos creado las intersecciones, ej "Franceces femeninos"
<Hprmedina> y para colmo lo hacemos por año XD "franceces femeninos del siglo XX" :P
<Hprmedina> bastaría con poner el árbol temporal "tiempo" -> "milenio" ->"siglo" ->"decenio" ->"año" -> "mes"->"día" 
<Hprmedina> ¿no sería más simple simplemente categorizar en cada punto de cada árbol?
<Hprmedina> ¿y que luego el sistema o software haga lo suyo?
<Hprmedina> ya vuelvo
<Hprmedina> En todo caso es algo que maneja Wikidata