Wikipedia:Café/Archivo/Miscelánea/Actual

De Wikipedia, la enciclopedia libre
Esta es una versión antigua de esta página, editada a las 23:54 29 abr 2018 por Metrónomo (discusión · contribs.). La dirección URL es un enlace permanente a esta versión, que puede ser diferente de la versión actual.



Esta página es archivada automáticamente.

Parámetros del archivado:

Lugar: Wikipedia:Café/Portal/Archivo/Miscelánea/AAAA/MM
Días a mantener: 7
Avisar al archivar: Sí
Estrategia: Firma más reciente en la sección
Mantener caja de archivos: No


Parada de PatruBOT

Comunico que acabo de detener indefinidamente a PatruBOT. He visto que se han mantenido las quejas, y dado que anuncié esa posibilidad y que por ahora apenas si tengo tiempo de revisar (bastante por detrás) mi lista de seguimiento y de estar atento a IRC, creo que es lo más prudente. Notifico a Mar del Sur y Ganímedes. Según mi tiempo disponible es posible que reconsidere en un futuro una reactivación con un nuevo algoritmo o si ORES facilita que sea más efectivo, en función también del interés que pueda tener la comunidad. En este sentido, leeré también aquello que se quiera comentar en este hilo. Saludos, - José Emilio –jem– Tú dirás... 09:34 27 mar 2018 (UTC)[responder]

Yo me desentendí hace bastante del asunto, pero gracias por el aviso. --Saludos. Ganímedes 12:14 27 mar 2018 (UTC)[responder]
Una vez corregidos, al menos en parte, los problemas debería reactivarse, creo que es positivo. --PePeEfe (discusión) 13:11 27 mar 2018 (UTC)[responder]
Aunque cometiera (bastantes) errores, ayudaba muchísimo. De todos modos, si es la decisión de su operador, lo respetaré y aceptaré, por supuesto. Un bot antivandalismo me parece necesario en una Wikipedia tan visitada por vándalos que se empeñan en dejar su huella aquí. Espero que algo podamos hacer, porque con los reversores o wikipedistas en general interesados en revisar los cambios recientes de los que disponemos actualmente no creo que tengamos suficiente. Un saludo cordial. --Fdo.: Gonzalo P.M.G. • 13:40 27 mar 2018 (UTC)[responder]
Considero que, a pesar de sus errores, el bot ayudaba mucho, ahora que ya n oesta activo los reversores tendremos una tarea ardua. Espero que lo puedas activar de nuevo pronto. Saludos. --Chico512 13:44 27 mar 2018 (UTC)[responder]
No me extraña que lo desactive por las constantes quejas que recibe. Algunas de estas quejas proceden de usuarios que llegan para editar un tiempo limitado, pero que se quejan de que se les han borrado datos, cuando en muchos casos lo que aportan son ediciones incorrectas. ¿Comete errores? Está claro, yo también, pero no me hago a la idea del trabajo que va a dejar de hacer. Los vándalos estarán encantados, y no me extrañaría que alguno fuese precisamente el que genera quejas para conseguir esto. Un saludo. --vanbasten_23 (discusión) 13:55 27 mar 2018 (UTC)[responder]
No extrañándome la decisión, que comprendo perfectamente, solo nos queda distribuirnos el trabajo lo mejor que podamos. Yo tengo marcas de seguimiento en todos los días y meses del año (efemérides), que son las páginas que patrullo continuamente. Supongo que hay otras formas de patrullar por intereses (no me veo patrullando deportes, por ejemplo). ¿Cómo se pueden implementar listas de patrullaje por categorías?. Saludos,--Jmrebes (déjame un mensaje aquí) 14:02 27 mar 2018 (UTC)[responder]
@Jmrebes, prueba con Especial:CambiosEnEnlazadas. -- Leoncastro (discusión) 14:25 27 mar 2018 (UTC)[responder]
Me atrevo a decir que el BOT tiene una tasa de error cercana al 40%, eso implica por lógica que acertaría un 60%. Eso como en la teoría del vaso medio lleno o medio vacio se puede ver desde dos óptícas. Desde la óptica de que acierta mucho vandalismo y por ende lo evita o desde la óptica de que falla bastante y por lo tanto evita ediciones que podrían ser correctas. Es evidente que la tasa de error del bot es excesiva pero también que desactivarlo hará que el 100% de los vandalismos que sí era capaz de evitar ahora no se eviten. En todo caso yo sigo confiando en la buena y generalmente poco valorada labor de los que patrullan cambios recientes, además de la efectividad de los filtros de edición. Por lo demás, quizás algún otro compañero sea capaz de correr un bot o de colaborar con Jem en el código de Patrubot para tener algo que no necesariamente haga cientos de reversiones al día pero sí sea capaz de que las que haga sean correctas. Porque quizás el problema de PatruBOT sea ese, que quería abarcar demasiado y al final ha terminado abarcando nada. Saludos. Bernard - Et voilà! 14:27 27 mar 2018 (UTC)[responder]
Desde la página Wikipedia:Mantenimiento/Revisión de errores de PatruBOT saqué la estadística de cuántas reversiones del bot son correctas e incorrectas. De las 236 reversiones reportadas, 153 eran reversiones incorrectas y 83 eran reversiones correctas (un 64% de error). Aun así no lo podemos tomar como definitivo. Si alguien vandaliza una página y el bot lo revierte, lo más probable es que no reporte el error. Esa reversión es correcta, pero como nadie la reporta no quedó plasmada en este porcentaje. No estoy seguro, pero creo que una gran cantidad de las reversiones correctas reportadas eran por temas de referencias, plagios, formato, estilo, cosas que un editor novato no conoce y no se puede decir que sean vandalismo. También se pueden revisar las contribuciones del bot y con ello sacar unos resultados más precisos. Habrá que ver cómo va este tiempo sin el bot, luego puede ser reactivado si vemos que efectivamente el vandalismo es demasiado para ameritar su uso.--Santiago142857 17:17 27 mar 2018 (UTC)[responder]

┌─────────────────────────────┘
Acabo de verlo. Por mi parte agradezco a -jem- el esfuerzo y tiempo invertidos en este bot y en general su colaboración en el asunto, pero le agradezco también de manera muy especial la sensata decisión de detener a PatruBOT. Lo cierto es que podríamos permitirnos tener un bot con esa tasa de errores, o incluso mayor, si (por ejemplo) fuese uno dedicado a corregir errores ortográficos, entonces, no pasa gran cosa si acierta solo el 60% de las veces. El resultado final igual sería positivo. Pero el problema es que PatruBOT no ponía tildes, sino que calificaba a usuarios ocasionales o colaboradores recién llegados de vándalos y les deshacía sin piedad su trabajo, una y otra vez y demasiadas veces sin razón, muchas veces ahuyentándolos del proyecto. Ahora, todos vamos a tener que destinar algunas horas más a los cambios recientes o agregar muchas más páginas a nuestra lista de seguimiento (que tiene el mismo efecto) y ayudar a revertir. Pero también es cierto que con esto liberamos recursos hoy destinados a contestar falsos positivos del bot y a las continuas discusiones que provoca. Gracias, jem, también por tu disposición a evaluar más adelante algún otro algoritmo más apropiado a nuestros fines. Mar del Sur (discusión) 19:45 27 mar 2018 (UTC)[responder]

Se seguirá usando la página que yo creé el día que se reactive el bot? --Леон Поланко говорит вам и слушает вас 20:22 27 mar 2018 (UTC)[responder]
Lo normal sería que sí, pero tampoco vamos a vender la piel del oso antes de cazarlo, este no es el momento de pensar en esto. Y si indicases la página que tus creaste es Wikipedia:Mantenimiento/Revisión de errores de PatruBOT ser5ías más preciso. MONUMENTA Discusión 21:56 27 mar 2018 (UTC)[responder]
@Santiago142857: Lo que habría que hacer es compararlo sobre el total de ediciones de PatruBOT. Si consideramos que Wikipedia:Mantenimiento/Revisión de errores de PatruBOT se refiere al último mes, desde entonces PatruBOT ha realizado 25578 reversiones en artículos, por lo que incluso si el total de 247 informes fueran ediciones erróneas, estaríamos ante una tasa de acierto al revertir del 99%. Sin embargo, lo mismo que hay reportes de errores que están mal, habrá también ediciones correctas que fueron erróneamente revertidas sin que se haya reportado, por lo que no es tan sencillo medir la efectividad del bot… Platonides (discusión) 22:50 27 mar 2018 (UTC)[responder]
@Platonides: Exactamente. La única forma de comprobar la efectividad de PatruBOT es mirando en sus contribuciones. Una locura (862 ediciones por día si querés comprobar todas las del mes en un mes), pero quizás sea la única forma. Aunque no estoy seguro de si nos resultará muy útil saber la efectividad actualmente (aunque revisé las primeras, 26 reversiones correctas contra 2 discutibles, un 92%).--Santiago142857 23:10 27 mar 2018 (UTC)[responder]
La cuestión es con qué está satisfecha la comunidad. PatruBOT realizaba una enorme cantidad de trabajo, pero ello implica también que, por muy exacto que pudiera ser, va a cometer numerosos fallos, simplemente por el gran número de ediciones. ¿Hasta qué punto consideramos que merece la pena su labor o no? (y esto es una cuestión subjetiva, pues seguramente cada uno marque la línea en un sitio distinto) Platonides (discusión) 23:17 27 mar 2018 (UTC)[responder]
Genial. No nos podemos permitir tener un bot con esa tasa de errores pero ahora nos vamos a permitir tener miles de artículos vandalizados sin comprobar por qué no se puede vigilar todo el día. Esta tarde éramos cuatro o cinco y no dábamos abasto, cuando haya mucho mas tráfico será muy complicado y seremos entonces los reversores los que comencemos a errar... Ahora veremos que sale de esto, . --Geom Discusión 23:58 27 mar 2018 (UTC)[responder]

No creo que sea necesario tanto. Yo hice una estadística previa basándome en 100 denuncias de Patrubot en VEC, en un día y la publiqué. ¿Se acuerdan? Esta. Creo que ahora que el bot está detenido hacer una estadística más global es factible. Tomando como base que -jem- anunció las mejoras en la programación el 4/3 en el Café de Técnica, podemos tomar ese día y esa hora como base. No es ni un mes. Descartando las ediciones fuera del espacio principal (ediciones en páginas de discusión, tablones, etc) no creo que sean ni 20.000 ediciones para revisar. Es muchísimo, pero podría ser mucho peor. Es cuestión de ponerse manos a la obra. ¿Habrá alguna forma de conseguir una lista filtrada de esas ediciones? Si no, no quedará de otra que hacerla a mano. Tardará más, pero no lo creo imposible, y menos si el bot está parado. --Saludos. Ganímedes 10:47 28 mar 2018 (UTC)[responder]

Miento: fue el 10/2, con esta edición. Me equivoqué al verificar la edición. No obstante, podemos ponernos un mes de análisis, o tomar todas las ediciones desde entonces. Entiendo que el número se incrementa a casi el doble, pero es lo único que podemos hacer si queremos tener estadísticas fiables. Al menos tenemos la confianza de que no se seguirá incrementando. --Saludos. Ganímedes 10:52 28 mar 2018 (UTC)[responder]

Mientras el bot esté parado es fácil. Se crea una lista de 500 puntos en alguna subpágina, por ejemplo, y quien esté aburrido va añadiendo si "ok", "regulín" o "mal" a cada una de las últimas quinientas ediciones de patrubot.

Hace falta 1) tener activado ese gadget que adjunta un número correlativo a cada edición en un historial o lista de ediciones 2) definir previamente qué es ok, qué es regulín y qué es mal 3) estar aburrido y... 4) tener cuidado con los conflictos de edición. Suerte. strakhov (discusión)

PD. Naturalmente los números son como el algodón: no engañan. Si estaba programado para acertar con un 95% de probabilidad (o lo que fuera), tomando un espacio muestral suficientemente grande... Patrubot errará como mucho en torno a un 5%. Si falla más... es que a algún lumbrera se le fue la mano al etiquetar ediciones dañinas en la campaña aquella. Saludos. strakhov (discusión) 11:12 28 mar 2018 (UTC)[responder]

Yo no estoy aburrida ni tengo mucho tiempo, pero sí tengo interés en estas estadísticas en particular y voy a hacer todo lo posible por obtenerlas. Tal vez podríamos partir al medio y analizar la mitad (las últimas, o las primeras, tanto da). Hablo en plural, pero (ojalá me equivoque) todo pinta que no habrá otros candidatos. Justamente creo que el problema es definir ¿qué está bien? Tal vez en la lista se podría añadir el tipo de edición que ha realizado (revirtió ediciones sin fuentes, retiró vandalismos, revirtió correcciones de ortografía, etc) y luego hacer estadísticas crudas sobre lo que ha hecho. Ya luego que resuelvan otros si fue apropiado o no. --Saludos. Ganímedes 11:10 28 mar 2018 (UTC)[responder]
Supongo que será posible calcular una muestra estadísticamente válida para analizar, que sea representativa de las ediciones y sin necesidad de tomar la totalidad del espacio muestral para no volvernos locos... --Saludos. Ganímedes 11:14 28 mar 2018 (UTC)[responder]

¿podría servir? strakhov (discusión) 11:50 28 mar 2018 (UTC)[responder]

Si tomamos una edición de, por ejemplo, 10 o 15 que hace el bot en espacio principal desde que paró hacia atrás, digamos hasta el 10/2 en que fue publicado el cambio de programación, podríamos tener unas 4100 - 2733 muestras de un total de 41000 ediciones. Supongo que eso sería suficientemente aleatorio y suficientemente representativo como para no caer en sesgos de ningún tipo y sin fórmulas matemáticas, por ahora. Lo que necesitamos es una lista filtrada de ediciones del bot en espacio principal. Creo que haré una petición formal en Bot/s, para que todos tengamos acceso a ella. --Saludos. Ganímedes 12:00 28 mar 2018 (UTC)[responder]
Bueno, Ganí, no se puede evitar la fórmula matemática para obtener una muestra válida, ni el método estadístico para asegurar que el muestreo sea realmente aleatorio. Y aun así habrá errores en la medición, pero estos se podrán acotar y cuantificar. Yo estoy por que si hacemos ese análisis lo hagamos rigurosamente. Tiene razón Strakhov en que, si el bot estaba programado para acertar a algo con un 95% de confianza, lo más probable es que haya errado solo en un 5% en darle a ese algo El único problema que tenemos es que ese algo lamentablemente no ha sido lo que en Wikipedia definimos como vandalismo y que es absolutamente lo único que está permitido revertir sin comentarios (con el botón rápido) de acuerdo con la política correspondiente. A mí más que la estadística (aunque es bueno que veamos todos lo que estaba ocurriendo) me interesa que quede claro ese asunto, porque veo que algunos patrulleros han tomado el mal ejemplo del bot y están revirtiendo sin comentarios ediciones que no son correctas (o que están sin referencias), pero que no son claros vandalismos. Esas ediciones se pueden corregir o deshacer, pero jamás revertir. Mar del Sur (discusión) 13:18 28 mar 2018 (UTC)[responder]
Entiendo. Igualmente he solicitado a los boteros esa lista porque es indispensable para realizar la tarea, más allá del método que elijamos. Y si, el problema de revertir ediciones sin fuentes y a secas lo hemos mencionado desde el primer día. Que el bot debe dedicarse a revertir vandalismo y nada más, también. No obstante, no podemos negar que está haciendo aquello para lo que fue programado. --Saludos. Ganímedes 15:32 28 mar 2018 (UTC)[responder]
Ganímedes Aquí tienes un programa que calcula de manera fiable y fácil el tamaño de la muestra probabilística necesaria para extraer conclusiones útiles. Para una población de 41 000 ediciones de Patrubot (desde que se hizo el último ajuste) con un nivel de confianza del 95 % y un margen de error (intervalo de confianza) de 3 % (es o que mas típicamente se tolera en este tipo de casos), necesitas analizar una muestra de 1040 ediciones. Para seleccionarlas, tienes que sortear los números, asegurando que cada una de las 41 000 ediciones tenga la misma probabilidad de ser analizada. Puede ser con un generador de números aleatorios como este o también sorteando un número x y luego seleccionar cada x ediciones. Si finalmente te animas, yo te ayudo a analizar Mar del Sur (discusión) 08:55 29 mar 2018 (UTC)[responder]
Mar del Sur: De acuerdo a Leoncastro son 39.111 ediciones en espacio principal. --Saludos. Ganímedes 10:08 29 mar 2018 (UTC)[responder]
Se me ocurre que, si analizamos la muestra con el generador de números aleatorios, podríamos crear una lista de números que pasarle a Leoncastro para hacer un listado ya filtrado y sin los inconvenientes actuales del límite del servidor. ¿O será posible configurar al bot para que lo haga? Pregunto desde la más total y absoluta ignorancia (y no temo reconocerlo). --Saludos. Ganímedes 10:17 29 mar 2018 (UTC)[responder]
Si, puede hacerse eso. Con el mismo nivel de confianza y el mismo margen de error, no varía prácticamente el tamaño de muestra necesario sobre un universo de 39 111 ediciones: 1039. Mar del Sur (discusión) 11:17 29 mar 2018 (UTC)[responder]
Wikipedia:Mantenimiento/Revisión de errores de PatruBOT/Análisis. Idealmente cada edición debería ser revisada por dos o más editores. -- Leoncastro (discusión) 14:21 29 mar 2018 (UTC)[responder]
Gracias, Leoncastro. De acuerdo contigo pero en ese caso, ¿deberíamos tener varias copias y trabajar en paralelo o se puede trabajar desde la misma página? --Saludos. Ganímedes 22:48 29 mar 2018 (UTC)[responder]
@Ganímedes, supongo que no será difícil coordinarse. Está dividido en subsecciones de cien ediciones o menos, mientras un usuario analiza una subsección, otro puede analizar algunas de las siguientes, y luego alternarse. No creo que vaya a haber tantos usuarios dispuestos a revisar esas contribuciones como para que no se puedan coordinar sin grandes conflictos. -- Leoncastro (discusión) 22:58 29 mar 2018 (UTC)[responder]
En eso estamos de acuerdo :P --Saludos. Ganímedes 23:13 29 mar 2018 (UTC)[responder]

Igual podemos portar en:User:ClueBot NG para que funcione en esta Wikipedia. Creo que funciona bastante bien en la Wikipedia en inglés. --MarioGom (discusión) 16:51 28 mar 2018 (UTC)[responder]

¿Cómo sería eso? --Saludos. Ganímedes 18:12 28 mar 2018 (UTC)[responder]
Pues creo que lo principal sería recopilar un dataset de ediciones etiquetadas como vandalismo para entrenarlo (usa un algoritmo de aprendizaje automático). Viene con una interfaz web para facilitar esa tarea de forma colaborativa. Voy a investigar los detalles técnicos a ver si es viable. --MarioGom (discusión) 20:11 28 mar 2018 (UTC)[responder]
A primera vista ClueBot me parece una opción con varias ventajas comparativas en su implementación respecto de lo que teníamos acá. Aquí listo algunas:
  1. Open source.
  2. Documentación técnica completa y accesible.
  3. Documentación para usuarios sencilla y bastante explicativa de su modo de funcionamiento (incluida una FAQ)
  4. Botón de detención de emergencia, fácil, directo y operable por cualquier bibliotecario.
  5. Comparativamente, pocos falsos positivos.
  6. Reportes de falsos positivos a un único sitio, directamente desde un enlace en el resumen de edición que deja el bot.
  7. Aparte del entrenamiento inicial, aprovechamiento de los análisis de falsos positivos en una constante mejora de la precisión del bot (aprendizaje automático).
  8. Estadísticas de funcionamiento públicas (con la configuración actual, de una tasa máxima de 0.1% de falsos positivos, el bot es capaz de detectar un 40% del total de vandalismo).
  9. Configuración de parámetros fácilmente ajustable (por ejemplo su precisión)
Eso más o menos. Me parecería interesante averiguar más precisamente la factibilidad de implementación aquí (gracias, MarioGom) y analizar mejor las ventajas y consecuencias que podría tener esta opción para nosotros. :::Hagámoslo con cuidado, sin prisas (no es gracia que salgamos de la olla hirviendo para caer en una sartén con aceite caliente). Por otra parte, un proyecto así sería interesantísimo y sumamente útil, pero solo funciona bien si detrás hay un buen equipo dispuesto a llevarlo a cabo. Pregunto entonces ¿hay voluntarios? Mar del Sur (discusión) 08:05 29 mar 2018 (UTC)[responder]
Fuera de Turismo no tengo mucho tiempo hasta mayo, pero me ofrezco para etiquetar ediciones si es necesario. --Saludos. Ganímedes 10:23 29 mar 2018 (UTC)[responder]
Y mucho ojo con esto, lo esencial no es si se llama PatruBOT, ClueBOT o LoQueSeaBOT, tampoco son tan decisivas las particularidaes de su algoritmo o el lenguaje en que esté escrito. Hay solo dos cuestiones cruciales: 1) la calidad del dataset de ediciones etiquetadas y 2) la administración y control colectivo del bot, tanto para mantenerlo y ajustarlo, como para poner las reglas del juego. Por ejemplo, la estadística de aciertos de ClueBOT es rigurosa actualmente porque (traduzco) «el conjunto de datos de prueba utilizado para generar estas estadísticas es un muestra aleatoria de ediciones, cada una de ellas, revisada por al menos dos humanos, de modo que las estadísticas son precisas.» Mar del Sur (discusión) 11:40 29 mar 2018 (UTC)[responder]
¿Podría ser este el mentado bot comunitario? --Saludos. Ganímedes 11:06 30 mar 2018 (UTC)[responder]
Ayer estuve haciendo algunas pruebas con el código de ClueBot NG. Además del dataset para eswiki, requiere ajustes en el código que está asociados a enwiki y configuración que está asociada al idioma inglés. Sigo trabajando en los cambios necesarios. --MarioGom (discusión) 13:35 30 mar 2018 (UTC)[responder]

┌─────────────────────────────┘
Una pena, pero si da paso a mejorías pues que se haga así. Los reversores tendremos que poner una buena cantidad de esfuerzo y tiempo extra para compensar al bot, recursos que serían más útiles aportando en otras cosas pero bueno... Respecto a ClueBOT, suerte con ello. ~ℳɑrio - (¿Hablemos?) 21:34 2 abr 2018 (UTC)[responder]

Actualizo sobre el tema de adaptar ClueBot NG. Lamentablemente, no llegué muy lejos. Algunas adaptaciones son de cierto calado y requieren ejecutar el bot en un servidor con una réplica de la base de datos de Wikipedia (por ejemplo, en el servidor de tools de Wikimedia). Trataré de retomarlo pronto, pero no me parece viable a corto plazo. Un saludo. --MarioGom (discusión) 13:24 8 abr 2018 (UTC)[responder]
MarioGom, aunque no pueda ser tan rápido, por favor no abandones el tema... ¿qué necesitarías para acceder al servidor de tools? O, alternativamente, hacer una réplica (otra) ¿qué recursos requeriría? ¿alguien más te está ayudando? Mar del Sur (discusión) 13:46 8 abr 2018 (UTC)[responder]
+1. ¿Qué hace falta para que lo podamos mover? Raystorm is here 19:45 8 abr 2018 (UTC)[responder]
No abandono pero ajusto las expectativas ;-) Voy a explorar alguna alternativa, como añadir esta funcionalidad a otro bot en el que estoy trabajando. Seguiré actualizado. --MarioGom (discusión) 07:31 9 abr 2018 (UTC)[responder]

┌─────────────────────────────┘
Si es necesario puedo adaptar mi bot para que TEMPORALMENTE realize la tarea, ya está conectado con el servicio ORES y lo usa habitualmente. Se podría ajustar a para revertir sólamente ediciones con un 99% de posibilidad de ser vandalismo mientras se trabaje en una solución mejor. Pero sería solo temporalmente, no dispongo del tiempo necesario para asumir la responsabilidad de manejar tal bot a largo plazo. ~ℳɑrio - (¿Hablemos?) 23:44 13 abr 2018 (UTC)[responder]

MarioGom y Usuario:MarioFinale (Marios) ;-) Por favor ¡aunad esfuerzos! Tal vez el principal problema de Patru era justamente que su código lo conocía solo una persona y como además, por mucha voluntad, tenía poco tiempo... Una tarea como esta es demasiado importante y debería ser colectiva. Mar del Sur (discusión) 00:00 14 abr 2018 (UTC)[responder]

Puedo sumar fuerza de reversión temporal

Hola: he estado con harto trabajo off-wiki relacionado con Wikipedia, pero ya dispongo de algo de tiempo para abordar este problema. Puedo generar un proyecto colaborativo en labs para que uno o varios usuarios puedan acceder al bot. Mientras tanto, puedo ejecutar con BOT-Superzerocool (u otro nombre si es necesario), las reversiones de ORES usando el parámetro goodfaith bajo el 0.095 de probabilidad de buena fe (es decir, hay una probabilidad inferior al 9,5% de que sea una edición de buena fe), o que su potencial de damaging sea superior al 97%. Esto lo dejaría temporalmente para luego añadir más funciones en la Hackathon de Barcelona. Superzerocool (el buzón de msg) 19:51 18 abr 2018 (UTC)[responder]

Añadiendo un poco, es una versión básica y llena de errores, pero se puede mantener funcionando por un tiempo sin problemas. No hará reportes en vandalismo en curso, pero evitará que las ediciones que cumplan ambos patrones permanezcan mucho tiempo. Superzerocool (el buzón de msg) 19:53 18 abr 2018 (UTC)[responder]
@Superzerocool, por curiosidad, ¿sabes cual es la diferencia en el umbral con respecto a PatruBOT? Por lo que veo, además, otra diferencia es que solo revierte la última acción,[1] sin arrastrar las anteriores. ¿Qué otras diferencias destacables tiene? -- Leoncastro (discusión) 23:05 18 abr 2018 (UTC)[responder]
Hola @Leoncastro: es una implementación chapucera que viene a revertir solo la última edición. Por ahora es para combatir parcialmente las ediciones vandalicas más obvias, mientras solicito el espacio y otras yerbas para ayudar a los que deseen implementar un bot comunitario. Acerca de la sensibilidad, creo que estaba fijada al 0.2 de goodfaith, lo cual debiese entregar un error cada 20 ediciones (según revisé un par de meses atrás) Saludos Superzerocool (el buzón de msg) 00:20 19 abr 2018 (UTC)[responder]
Gracias Superzerocool ¿Y podríamos por favor ajustar aún más la sensibilidad? Un error cada 20 ediciones es mucho. Mejor no pretender abarcar tanto y conformarnos con que el bot ayude a revertir más o menos un 30 o 40% de las ediciones vandálicas, no importa que se le escapen muchas, porque ayuda más si es más seguro. Si hay demasiados falsos positivos el asunto ya sabemos que se torna contraproducente, porque el bot necesita una cuadrilla de humanos que pasen detrás revisando todo lo que hace y respondiendo reclamos. Hagamos poco, pero bueno. Mar del Sur (discusión) 01:00 19 abr 2018 (UTC)[responder]
@Mar del Sur: estoy ajustando varios parámetros, por ejemplo lo indicado por Leoncastro acerca de las reversiones, ya que solo está revirtiendo la última edición (y no es una reversa propiamente tal), y comencé con el ajuste a 0.095 como he indicado (un 9,5% de buena fe), para luego ir ajustando la sensibilidad. Nunca llegaremos al 100% de perfección, pero sí hay que hacer que la tarea de los revisores sea menos complicada. Por ahora, estoy ejecutando el bot mientras estoy activo, pero mi idea es no pasar de esta semana que el bot siga funcionando en el labs de la Fundación Wikimedia. Superzerocool (el buzón de msg) 01:11 19 abr 2018 (UTC)[responder]
@Leoncastro: ya he implementado la reversa como acción en el código. Sigo avanzando en construir algunas cosas más, como dejar el aviso al usuario tras dos ediciones revertidas en el mismo artículo. Te mantengo al tanto. Saludos! Superzerocool (el buzón de msg) 11:32 19 abr 2018 (UTC)[responder]
@Superzerocool: ¡Gracias por tu trabajo! A mí me parecería prioritario destinar esfuerzos especiales a que el bot en ningún caso revierta ediciones sencillamente porque no tienen referencias (como aquí por ejemplo). Una edición sin referencias es solo eso: sin referencias, no es necesariamente una edición vandálica. Si deben deshacerse o pedir referencias es algo que debe ser evaluado por un humano, pero en ningún caso revertido sin comentarios. Mar del Sur (discusión) 13:03 19 abr 2018 (UTC)[responder]
@Mar del Sur: de nada, estoy implementado algo rápido, sencillo e idealmente útil. Acerca de la reversión que me enlazas, la estimación obtenida por ORES en buena fe es de 0.03374 (3,3%), por lo cual se cumplió el umbral mínimo del 9,5% de buena fe. De todas maneras en una futura iteración, y si hay capacidades de voluntarios, podemos trabajar que el bot evite -o minimice- la ocurrencia de estos errores. Por ahora estoy trabajando en habilitar el repositorio en un github (ni idea de porque Phabricator no me quiso hacer commit en git, quizás me he mareado con gerrit) y mover el código a toolforge antes de seguir con otras tareas, como el aviso a usuarios y aviso en VEC. Nuevamente, muchas gracias por tus palabras, que estoy trabajando para hacer que esto funcione correctamente. Saludos Superzerocool (el buzón de msg) 13:41 19 abr 2018 (UTC)[responder]
@Superzerocool, he puesto mi voto y un pequeño análisis aquí. Se agradecería si puedes revisar y sacar conclusiones de los enlaces. Gracias por todo el trabajo. -- Leoncastro (discusión) 16:02 19 abr 2018 (UTC)[responder]
@Leoncastro: he visto el voto, ¡gracias!. He comprobando las ediciones y los puntajes ORES son bajos en 2/5, en las otras 3 se ha activado una combinación que no esperaba (puntaje gf < 0.12 y dm > 0.90), por lo cual ajustaré este último parámetro a dm > 0.95, es decir si es mala fe y es altamente dañina se revierta. Gracias por el mensaje. Saludos Superzerocool (el buzón de msg) 17:21 19 abr 2018 (UTC)[responder]

Cuenta de bot solicitada y en toolforge

Para hacerles una actualización: he subido el código a phabricator (conectado a un github externo) para que cualquier persona pueda auditar el código chapucero que está corriendo el bot actualmente, así como ya está creada la instancia donde podría ejecutarse el bot en toolforge. El bot se llama SeroBOT (nota: Sero = ORES al revés) y solamente debiese ejecutar reversas basadas en ORES. Como he indicado, el código está con licencia MIT y el acceso al toolforge es para cualquiera que desee solicitarlo. Toda ayuda en este campo, ya sea comentarios, críticas o mejoras en el código es bienvenido, así que como co-responsable del desarrollo. Saludos Superzerocool (el buzón de msg) 14:08 19 abr 2018 (UTC)[responder]

Tengo otra pregunta: Cuando criticábamos el funcionamiento deficiente de PatruBOT se nos respondió muchas veces que el problema no era el código del bot sino ORES ¿Se está trabajando, se puede trabajar o se trabajará en mejorar ese etiquetado que, al parecer, es malo? Porque si no es el caso, aparte de los ajustes de sensibilidad que se puedan hacer no vamos a cambiar mucho... Todo eso sin desmerecer la ventaja y el gran potencial que veo en un código que —chapucero o no— ¡es abierto! Mar del Sur (discusión) 16:57 19 abr 2018 (UTC)[responder]
@Mar del Sur: delegar al 100% la responsabilidad en ORES me parece que, en el corto plazo, es una solución que nos ayuda a salir adelante en una tarea que estaba abandonada. Por mi parte, y sin comprometer recursos externos, creo que podría explorar la posibilidad de agregar un poco de aprendizaje automático para que, con los valores de ORES, estimar una reversión, para no depender directamente de los valores de ORES como primer parámetro. Lo segundo que se me ocurre es consultar la opción de una nueva campaña de etiquetado, pero desconozco si el equipo de ML les gustará esa opción. Saludos Superzerocool (el buzón de msg) 17:25 19 abr 2018 (UTC)[responder]
Sobre lo que comenta Mar del Sur, precisamente para eso se tienen dos parámetros (goodfaith y damaging), uno para identificar si una edición se guardó de buena fe (“probablemente está bien, casi seguro que no vandalismo”), y el otro si una edición causa daño (“necesita revisión manual, posiblemente sea vandalismo”). La decisión es obvia cuando ambos apuntan claramente hacia o en contra del vandalismo, con el único problema de decidir el límite o umbral de esa “claridad”. Y si uno apunta “más que claramente” en señalar un vandalismo, pero el otro no está claro o incluso apunta lo contrario, es cuando aparecen los problemas. Por ejemplo, si una edición se detecta en buena fe, pero que causa daño (podría pensarse, por ejemplo, en una edición en la que se modifica una imagen por otra inexistente). Posibles soluciones: opción 1) ignorar la edición, sabiendo que puede ser dañina, o 2) deshacer la edición (sin revertirla). -- Leoncastro (discusión) 18:30 19 abr 2018 (UTC)[responder]
Leoncastro En un caso como el que señalas, la segunda opción que mencionas no tiene ningún sentido. Hay que optar por 1). La edición debe ser ignorada por el bot, aun sabiendo que puede ser incorrecta o hasta dañina y deben ser los patrulleros humanos los que se encarguen después de ella. La única gracia que tiene «deshacer» en vez de «revertir» es que en el resumen de edición se puede explicar por qué se deshace y el editor se entera (o podría, en principio) enterarse de por qué se considera incorrecto lo que ha intentado aportar. Aunque se ha visto por ahí algunos patrulleros (humanos) que usan «deshacer» nada más que para que nadie les reclame mal uso de la herramienta de reversor, ese jamás ha sido el sentido. Si el bot llegase a ser tan inteligente (que no será) como para analizar realmente la edición y explicar en el resumen de edición por qué exactamente esta deshaciendo, vale, pero si no... la verdad es que no le veo asunto: siempre que actúe deberá revertir. Mar del Sur (discusión) 22:03 19 abr 2018 (UTC)[responder]
@Mar del Sur, el sentido que tiene la opción 2 es de no dejar el daño visible en el artículo, sin deshacer también el posible trabajo previo del mismo editor. Yo personalmente cuando patrullo, suelo deshacer cuando veo que no es un vandalismo pero sí es un daño; y, cuando se puede, aprovechar la edición para corregirla. El bot no va a corregir, pero al menos puede deshacer. Con el ejemplo que mencionaba, si un editor bienintencionado intenta fallidamente modificar una imagen, y por lo que sea se le olvida poner su extensión, y por tanto el sistema no la reconoce: el bot regresaría la imagen previa. Lo mismo si agrego un dato a una tabla, y por lo que sea rompo el estado de las columnas y se queda malformada al punto de que no se visualiza: el bot regresaría la versión previa visible. O si modifico una ficha y borro sin querer el cierre de la plantilla, con lo que esta se deja de ver y se muestra solamente su texto: el bot regresará a la versión con la ficha visible. Acepto que sea preferible que dicha labor la haga un humano, pero las opciones que he indicado sí que tienen sentido. -- Leoncastro (discusión) 22:14 19 abr 2018 (UTC)[responder]
@Mar del Sur y Leoncastro: es cierto que hay varias opciones de abordar el tema de cómo proceder: para deshacer tendríamos que evaluar los cambios previos del usuario en el artículo, estimando con ORES si las ediciones son de buena fe o no. Sin embargo, todo depende, como indica Leoncastro, de si el error que gatilla una evaluación negativa de ORES es acumulado (supone reversa) o en esa edición (supone deshacer). Para llegar a ese nivel de detalle se requiere bastante análisis y un buen entrenamiento del bot. Por ahora, en esta iteración, es un bot tonto que aún no logra enviar un mensaje a los usuarios :( Superzerocool (el buzón de msg) 22:22 19 abr 2018 (UTC)[responder]

Mensajes a usuarios

@Superzerocool: Yo la verdad es que estoy muy feliz de que no envíe mensajes a los usuarios, llenando de manera inútil e invasiva páginas y páginas de discusión de IP, muchas veces compartidas o dinámicas ¿para qué, exactamente? Y yo prefiero (y agradezco también) su «humildad»: que sea reconocidamente tonto ;-), que no se las dé de inteligente sin serlo, que deje que su labor se analice y que sea desarrollado por varios. En mi opinión este bot debe revertir únicamente vandalismo claro, puro y duro. Lo demás deben hacerlo humanos o bots especializados en un tipo de error específico. Por ejemplo, creo que es mucho más eficiente y productivo que un bot especializado corrija los errores introducidos en el formato de tablas o de imágenes que señala Leoncastro, pero yo veo eso como labor de mantenimiento separada del patrullaje de cambios recientes destinada a la reversión de vandalismo. Mar del Sur (discusión) 22:46 19 abr 2018 (UTC)[responder]

@Mar del Sur: sé que no hay que invadir tanto a los usuarios con mensajes, pero es un mal necesario para el patrullaje: estoy probando por dejar {{Aviso prueba2}} al usuario cuando hace una segunda edición revertida en menos de 10 minutos en la misma página. He pensado que al vandalismo en curso es a la cuarta reversión en el mismo tiempo independiente de la página editada. Acerca de la revisión humana para cambios en plantillas o tablas es algo que en corto plazo no lo tengo pensado. Saludos Superzerocool (el buzón de msg) 23:31 19 abr 2018 (UTC)[responder]
Bueno, Superzero, yo decía revisión de formatos de tablas, plantillas e imágenes vía bot (pero otro bot, no este, ni tampoco necesariamente uno controlado por ti). Este debe revertir vandalismo, nada más (y cuando haga eso de manera limpia y segura, pues podremos estar muy satisfechos). Sobre cuándo dejar mensajes a anónimos cuántos.... pues no sé. Yo soy extremadamente ahorrativa con ellos. Y no me queda tan claro por qué «son un mal necesario para el patrullaje». A veces sirve, vale... pero así como una regla fija... no lo tengo tan claro, la verdad. Creo que desanima bastante editar cuando tu página de discusión está llena de advertencias extrañas. La gente no lee tanto además, de modo que no ve esa parte donde se le dice
Esta es la página de discusión de un usuario anónimo que aún no ha creado una cuenta o no la usa. Por lo tanto, tenemos que usar su dirección IP numérica para identificarlo. Una dirección IP puede ser compartida por varios usuarios. Si eres un usuario anónimo y crees que se han dirigido a ti con comentarios improcedentes, por favor crea una cuenta o entra para evitar confusiones futuras con otros usuarios anónimos
... o, si la lee, hasta podría ser contraproducente. Es un texto demasiado largo y bastante raro, aunque a nosotros nos parezca clarísimo. No creo que tranquilice a ningún novato, por el contrario: eso de la «posible confusión con otro» es probable que hasta lo inquiete más. Y si este resultado obtienen los usuarios muy experimentados en patrullaje cuando ponen mensajes... pues imagínate el bot, que no sabrá discernir si vale la pena poner la quincuagésima advertencia en la página de la IP de una escuela secundaria o de una ip dinámica que cambia a cada rato.... No sé. Yo preferiría (pero esa soy yo ) que no dejara mensajes en las páginas de las IP y en vez de eso simplemente contara ediciones vandálicas de una misma IP y las incluyera en una lista. Un humano puede ver esa lista y decidir si manda mensajes, bloquea de inmediato o qué. Mar del Sur (discusión) 00:20 20 abr 2018 (UTC)[responder]
Me parece que es correcto lo que dices, probaré sin un aviso a los usuarios anónimos, pero sí con reporte a vandalismo en curso a la cuarta reversión en 10 minutos. Superzerocool (el buzón de msg) 00:28 20 abr 2018 (UTC)[responder]
Sí, creo que eso puede funcionar mejor, gracias Superzerocool Mar del Sur (discusión) 02:43 20 abr 2018 (UTC)[responder]
✓ Hecho El bot ya ha comenzado a reportar a vandalismo en curso a la cuarta reversión en cuatro horas, ya sea usuario registrado o anónimo, y ha dejar un mensaje a usuarios registrados si se registran dos reversiones en el mismo plazo. Estoy monitoreando cómo funciona desde toolforge. Saludos Superzerocool (el buzón de msg) 13:30 20 abr 2018 (UTC)[responder]
@Leoncastro:,@Superzerocool: Pues tal parece que está funcionando bastante bien ¿verdad que sí? Y lo está haciendo calladito, sin invasión desagradable e innecesaria de todos los espacios. ¡Se agradece el buen trabajo! Mar del Sur (discusión) 02:47 21 abr 2018 (UTC)[responder]
Gracias, ahora estoy comenzando a deducir las estimaciones de falsos positivos y un proceso de reporte para analizar cada caso que sea necesario. Creo que trabajaré en ello antes de seguir a pasos más avanzados. Superzerocool (el buzón de msg) 03:02 21 abr 2018 (UTC)[responder]
@Superzerocool, por si sirve de ayuda hice otro análisis de 100 ediciones del bot: 95 acertadas y 5 discutibles.[2][3][4][5][6] Aunque la verdad, en algunos de esos casos, también es discutible la edición del usuario. -- Leoncastro (discusión) 23:32 21 abr 2018 (UTC)[responder]
@Leoncastro: lo vi en la página de discusión de votación del bot y creo que más arriba indiqué mis respuestas. EN ese sentido, creo que haré una herramienta que muestre el log de reversiones a partir de los datos que genera el log de reversiones, con el fin de entender qué está haciendo el bot y a quiénes está revirtiendo (IP, usuarios nuevos, etc.). Saludos Superzerocool (el buzón de msg) 11:42 23 abr 2018 (UTC)[responder]
Estimado Superzerocool, pasaste por alto que puse que «hice otro análisis». Es otro nuevo. Dado que el primero te sirvió para detectar y revisar alguna cosa, he pensado que, tras esa rectificación, un segundo análisis podría ser también de ayuda. -- Leoncastro (discusión) 14:10 23 abr 2018 (UTC)[responder]
@Leoncastro: (sonido ambiente: golpes de látigos), los revisaré con más calma ya que he eliminado la combinatoria que generó el error hace algunos días (ahora está con gf < 0.085 y dm > 0.97). Espero programar la herramienta auxiliar en los próximos días, pero ya he visto feedback en vandalismo en curso y aquí que me va a ayudar a ver si el uso de los dos parámetros aisladamente funcionará o no. Saludos Superzerocool (el buzón de msg) 14:13 23 abr 2018 (UTC)[responder]


Comentarios técnicos

Me alivia ver que alguien más se hizo de tiempo para realizar tarea, encuentro genial el trabajo hasta ahora para mantener una herramienta temporal. De todas formas es bueno señalar un par de cosas:

  • El objetivo del bot debe ser revertir únicamente vandalismos obvios, otras ediciones por muy incorrectas que sean no deberían ser revertidas porque si ni por un bot ni por nadie, hay que dar las debidas justificaciones, es un tema de cortesía básica.
  • Mientras nos basemos en ORES habrán claras limitaciones en la precisión del bot debido a que el sistema en sí no es muy preciso y está estancado (lo que me parece un desperdicio de "machine learning").
  • Si es de código abierto en ese caso es necesario que la versión ejecutándose en Toolforge y la versión del repositorio sea la misma, además de tener un registro de actividad público (Algo sencillo como esto sería suficiente).

Suerte en la proeza, si tengo tiempo un día de estos le echo un vistazo al código :^). ~ℳɑrio - (¿Hablemos?) 15:18 23 abr 2018 (UTC)[responder]

@MarioFinale: gracias por tus comentarios, para responder por partes:
  1. Los vandalismos obvios implicaría determinar que es un vandalismo obvio y qué no, y su clara limitación. Acerca de la cortesía, hay un efecto que indicó Mar del Sur que me parece interesante: llenar las discusiones con plantillas de advertencia (en lo personal, me agrada {{aviso prueba2}}), ya que el usuario IP puede encontrarse que su "yo" del pasado fue un vándalo y no tiene nada que ver con él. Estoy experimentando con denuncia a vandalismo en curso con 4 reversiones en 4 horas, mientras que a los usuarios registrados son 2 ediciones revertidas en el mismo artículo en el mismo plazo (4 horas).
  2. ORES es el servicio que me entrega la estimación: implementar otra capa de aprendizaje posiblemente sea más desperdicio, ya que los parámetros de aprendizaje serían los mismos que ORES, así que no hay ganancia, solo otro fork.
  3. He enlazado mi github porque me he mareado con la inicialización con gerrit, y creo que el bot era más prioritario su funcionamiento en lugar de dejarlo "hermoso". De todas formas, considero que al dejar en phabricator la copia de código (actualmente está configurado como observer), creo que hace el mismo fin que un repositorio en github. Sin lugar a dudas, es un trabajo a futuro que hay que realizar.
  4. Acerca del log, es la próxima tarea que tengo en mente, pero estoy esperando la autorización para comenzar a escribir código de salida: me parece importante que saquemos estadísticas y aprendizajes a partir de las revisiones, y sobre todo, que las personas que tengan dudas acerca de la reversión puedan saber porque el bot ha sido "malo". Actualmente estoy generando 4 archivo de log: general (todas las revisiones hechas por el bot), positivos (todas las reversiones), vec (todos los denunciados en VEC) y discusiones (todos los mensajes dejados en las páginas de discusión), de los cuales haré el análisis de datos (parte del código usan pandas para algunas estimaciones, y lo tengo pensado a futuro extender un poco más por su eficiente trabajo para estadística)
Para finalizar este tronco de mensaje, estoy monitoreando bastante su funcionamiento y estoy elaborando el método de hacer el seguimiento de la edición post-reversión (es fácil, pero toma algo de tiempo de BBDD), ya que con este mecanismo se puede detectar la cantidad de falsos positivos, y con eso existe un argumento para indicarle al equipo de ORES la necesidad -o no- de hacer un entrenamiento adicional. Saludos Superzerocool (el buzón de msg) 15:39 23 abr 2018 (UTC) (pd: separaré la sección a comentarios técnicos, me encanta saber que hay varias discusiones del tema, y que hay gente interesada en dar su feedback)[responder]
@MarioFinale: @Superzerocool:. Yo estoy muy de acuerdo con MarioFinale en cuanto a que SOLO se deben revertir vandalismos obvios. Y no creo que sea problema definir qué es un vandalismo obvio. De hecho, está bastante bien definido aquí: Wikipedia:Vandalismo y en la política Wikipedia:Reversores Si en esta implementación temporal del bot, basada en un ORES estancado, garantizar el cumplimiento de esto significara que hay que ajustar mucho más aún la sensibilidad y que el bot ayude a atajar solo un 30% del vandalismo (y el 70% restante se revierta con manos humanas), pues creo que tenemos que optar por eso. En cuanto a los mensajes, pienso que cualquier suposición de intenciones vandálicas es terrible para un falso positivo (y si hay muchos falsos positivos, los bots no deberían enviar mensajes o ser especialmente cuidadosos son ellos, tanto en su texto como en la frecuencia de envíos). A mí no e agrada (en realidad me parece bastante agresivo) el texto de {{aviso prueba2}}, pero había entendido que solo se está enviando tras un cierto número de ediciones (espero que diferentes) calificadas por el bot como vandálicas ¿verdad? — El comentario anterior sin firmar es obra de Mar del Sur (disc.contribsbloq). --Saludos. Ganímedes 00:29 24 abr 2018 (UTC)[responder]
A la luz de esto, detendré el bot, ya que ORES no detecta vandalismos obvios. Espero atento su definición de vandalismo obvio. Saludos! Superzerocool (el buzón de msg) 02:54 24 abr 2018 (UTC)[responder]
Si me lo permiten, estoy en contra de los apagados de los bots. Aun patrulleros expertos pueden errar alguna reversión, incluso la acciones de algunos bibliotecarios pueden ser agresivos para el usuario. Considero que los bots han ayudado mas de lo que han perjudicados. Mi enorme admiración y respeto a jem y a Superzerocool por tomarse el tiempo de haber programado esos duendes. petrohs (tlazokamati) 04:15 24 abr 2018 (UTC)[responder]
De acuerdo con PetrohsW. Desde que comenzó BOT-Superzerocool, sentí que se optimizó la actividad en cambios recientes, haciendo más sencilla la tarea de patrullaje (lo noté aún más en mi lista de seguimiento). El análisis de cómo repercute eso en los nuevos usuarios es mucho más complejo, pues tendría que medirse con y sin el patrullaje del bot, y también hacer una medición de la percepción. En mi opinión, el trabajo que está haciendo Superzerocool debe de tener más retroalimentación de la comunidad, pero también debe ser reconocido e incentivado. Luis Alvaz (discusión) 04:48 24 abr 2018 (UTC)[responder]
¡No! ¡Por favor! Tampoco creo que debas detener el bot, pienso que la cosa va ahora bastante bien encaminada. Pero veamos, dices que ORES no detecta vandalismos obvios ¿qué detecta entonces exactamente? Para la definición de un vandalismo obvio no hay que esperar nada... es también obvia: edición claramente dañina realizada con el propósito de destruir contenido enciclopédico, por la vía del blanqueo o del reemplazo de párrafos por palabras insultantes o sin sentido. En cambio, puede ser vandalismo, pero no es obvio, el cambio de datos sin referencias. El aporte de bulos o información falsa, sin duda es vandalismo, pero su detección no es obvia (requiere de un análisis más inteligente que lo que actualmente puede hacer un bot). La inclusión de información sin referencias es una edición incorrecta, pero no es vandalismo y es un comportamiento completamente típico entre ĺos novatos que jamás debería revertirse sin comentarios, hay que explicar y enseñar, por eso el tratamiento de esas ediciones no debe estar a cargo de los bots (al menos, no de bots reversores) Mar del Sur (discusión) 10:20 24 abr 2018 (UTC)[responder]
Muy de acuerdo además con lo que comenta Luisalvaz. También yo noté de inmediato este buen comienzo de Superzerocool en mi lista de seguimiento y entregué también mi reconocimiento. Lamentablemente no podemos medir cómo repercuten las reversiones en nuevos usuarios bienintencionados y el ser tratados de vándalos cuando intentan editar Wikipedia. Apenas podemos tener noticia y analizar lo que opina la pequeña porción que reclama. Sobre el resto, solo podemos intuir lo que les pasa y allí nuestras «intuiciones» serán diferentes según que trato tiene o ha tenido cada uno de nosotros con usuarios nuevos. Mi intuición me dice que la medición del impacto es imposible porque tendría que hacerse fuera de Wikipedia: la mayor parte de la gente normal que es tratada de vándalo creo que nunca más intenta editar.Mar del Sur (discusión) 10:46 24 abr 2018 (UTC)[responder]

¿Qué hace el bot? (y qué no hace)

Para vuestra tranquilidad, no detendré el bot. Debo admitir que ha sido algo acelerada y precipitada la decisión, y considerando el bienestar de nuestra Wiki, lo mejor es se ejecute con sus beneficios y problemas. Ahora, para aclarar qué está haciendo el bot y que no hace el bot:

Qué hace el bot
  • El bot toma los valores entrenados de ORES en ediciones de buena fe y potencial de daño (goodfaith y damaging) y a partir de ellos considera qué acción seguir. Los valores de ORES van entre 0.00 y 1.00, indicando un porcentaje de certeza o no del cambio. Por ejemplo, un 0.25 en buena fe, me indica que la edición posee un potencial del 25% de buena fe -muy posible que sea mala fe-, mientras que el mismo 0.25 en potencial de daño me indica que la edición potencialmente no es dañina. Los valores de ORES se basa en un entrenamiento que se hizo -campaña de etiquetado que se hizo el año pasado- y la estimación se obtiene mediante aprendizaje de máquina que es la respuesta a ese entrenamiento.
  • El bot está ajustado -actualmente- a un 0.085 de buena fe y un 0.97 de potencial de daño. Esto quiere decir que debe existir unas probabilidades muy bajas de que se la edición sea de buena fe y que es muy alto su potencial de daño. Entre el 20 y 22 de abril, el bot realizó 1842 reversiones, de las cuales 1834 correspondieron solamente a buena fe, mientras que 8 fueron exclusivamente por el potencial de daño. (El total de ediciones analizadas son 36374, es decir el bot hizo reversa de un 5% de las ediciones de esos dos días)
  • El bot está programado para dejar un mensaje en la página de discusión de un usuario registrado a la segunda reversión en el mismo artículo en un plazo de 4 horas.
  • El bot denuncia a un usuario (anónimo o registrado) si realiza 4 ediciones revertidas en 4 horas. En la denuncia, se indican cuales son las ediciones que se han revertido. Hasta ayer vi 71 denuncias, de las cuales 2 fueron rechazadas por ser cambios de buena fe que fueron mal estimados por ORES.
  • Deja un registro de acciones para hacer auditoría del proceso que está haciendo.
Qué no hace el bot
  • El bot no analiza el contenido del diferencial (diff) buscando los problemas ocasionados, ya que implicaría un entrenamiento adicional a un aprendizaje automático.
  • El bot no es capaz de determinar si hay que realizar una reversa o un deshacer a las ediciones de los usuarios, ya que implicaría lo mismo que arriba.
  • El bot no discrimina a usuario anónimo, nuevo o veterano, por lo cual aplica los mismos criterios a todos los usuarios.(Exceptuando a los bots que no son analizados)
  • El bot no reemplaza al humano en las revisiones, sino que es una herramienta que ayuda a la tarea. Esto quiere decir, que existe un porcentaje de fallo y que nosotros (editores de Wikipedia) debemos tener en cuenta que hay que revertir la reversa cuando sea necesario.
  • El bot no patrulla todos los espacios de nombres, quedando atendo solamente a las páginas de contenidos (principal y anexo).
  • El bot no tendrá respuestas humanas ante los cambios, es decir, no puede discernir si el cambio está correcto o no por temas del contenido que se está escribiendo. (ejemplo: este diferencial, donde la información aportada por la IP parece ser válida).

Espero que con esto quede más claro de lo que hace el bot. Creo que PatruBOT tenía más código y lógica de la que maneja este bot, pero como he indicado, no es un spin-off, sino que viene a ayudar a revertir vandalismo a partir de ORES -y mi ideal sería solo de esa fuente de datos- para reducir la cantidad de vigilantes que debemos tener en Wikipedia para revertir los vandalismos más comunes. Saludos Superzerocool (el buzón de msg) 11:55 24 abr 2018 (UTC)[responder]

Gracias por la explicación Superzerocool. Ante los análisis efectuados por el momento, podemos señalar que 1) el bot revierte el 5 % de las ediciones totales —por lo que indicas arriba—, y 2) el bot acierta aproximadamente el 95 % de los casos que revierte —por mis dos pequeños análisis previos—. Con esto tenemos la conclusión de que un 0.25 % de las ediciones totales pueden ser reversiones automáticas erróneas. Dudo mucho que se pierdan grandes cantidades de posibles editores con tan pequeño margen de error. -- Leoncastro (discusión) 13:33 24 abr 2018 (UTC)[responder]
Bueno, exactamente, con esas cifras podrían ser 91 posibles editores perdidos en dos días ¿es poco eso? No lo sé. Y eso es precisamente lo que tiene que definir la comunidad: qué costo quiere pagar. Sé que si lo pongo así, suena más que si digo "solo el 0,25 %", pero no es un recurso retórico. Es que de verdad con las cifras se pueden provocar muchas impresiones diferentes, según cómo uno las presente e interprete. Los mismos resultados numéricos son graves o menos graves dependiendo del contenido. Si un bot que corrige tildes mal puestos se equivoca un 5% de las veces probablemente no pasa absolutamente nada. Si digo que mi montaña rusa a la que suben diariamente 1000 niños es segura porque solo el 0,25% de los niños que suben muere, es decir apenas 17,5 niños por semana...pues...Lo que quiero decir es que las cifras no significan nada desprovistas de su contenido. Yo creo que el bot de Superzero está funcionando incomparablemente mejor que lo que teníamos, pero también creo que la comunidad debe ayudar a fijar la dirección en la que deberíamos trabajar para optimizarlo. Me parece muy bien, por ejemplo, que analice todas las ediciones de igual manera y no "persiga" a usuarios como hacía el otro, que trabaje sin listas blancas, ni negras y que opere de manera totalmente transparente. Todo eso es estupendo. Mar del Sur (discusión) 16:27 24 abr 2018 (UTC)[responder]
Último dato estadístico a la fecha: 1306 editores diferentes el día 31 de marzo de 2018,[7] que realizaron 16 878 ediciones el mismo día.[8] Se registran una media de 732 usuarios nuevos cada día, lo que equivale a veintitrés mil cada mes.[9] -- Leoncastro (discusión) 17:18 24 abr 2018 (UTC)[responder]

Una petición

Necesito alguien que reúna estas condiciones: Que sepa algo de historia antigua; que sepa traducir del inglés al español; que sea amable y pueda perder un poquitín de su tiempo en traducir los mapas de esta página Asiria. Gracias de antemano. Lourdes, mensajes aquí 19:12 18 abr 2018 (UTC)[responder]

Con gusto lo haría Lourdes, pero creo que excede mis posibilidades. Se trata de trabajar con imágenes, lo que es un poco más complicado. De todos modos, voy a intentarlo. (Con pocas expectativas, la verdad...) --Silviaanac (discusión) 21:16 18 abr 2018 (UTC)[responder]
Lourdes Cardenal, doy con un nivel medio de cada cosa que pides. ¿Cómo te ayudo? --Romulanus (discusión) 21:58 18 abr 2018 (UTC)[responder]
Bien. Ya empecé a trabajar con el primero de los mapas, el que aparece dentro de la ficha (File:Assyrie general.PNG). Si logro completarlo, después me indicarán como subirlo a commons como otra versión del archivo existente. Saludos! --Silviaanac (discusión) 22:22 18 abr 2018 (UTC)[responder]
Lourdes, una consulta. El mapa que estoy traduciendo viene de la fr:wiki. Así que lo que estoy haciendo para asegurarme es buscar allí los nombres de cada ciudad/pueblo y luego buscar el equivalente en es:wiki. Así Tyr se transforma en Tiro, Jérusalem se transforma en Jerusalén, Assyrie en Asiria, Assur en Aššur, etc. La duda aparece con dos ciudades que están señaladas en el mapa con sus nombres históricos. Una de ellas es Arbèle, que actualmente y en castellano se llama Erbil. La otra es Kalkhu, que actualmente se llama Nimrud. Creo que lo más adecuado es utilizar los nombres actuales, para facilitar una posible búsqueda de más información. Quedo a la espera de tu respuesta. Te mando un gran saludo. --Silviaanac (discusión) 02:24 19 abr 2018 (UTC)[responder]
@Silviaanac: lo que tienes que hacer es cambiarle el nombre antes de subirlo, por ejemplo Assyrie general es.PNG, no te olvides poner la plantilla «derivado de» en otras versiones. Jcfidy (discusión) 06:11 19 abr 2018 (UTC)[responder]
Aviso que estoy haciendo las traducciones y solicitando los cambios en el Wikiproyecto:Ilustración (porque no tengo ni idea de modificar mapas) para que no dupliquemos el trabajo. Por cierto, pienso que es mejor poner el nombre más común o actual, salvo que por el contexto sea preferible el contemporáneo. Respecto a Aššur (y el resto de topónimos), la mayoría de las veces se simplifican los signos diacríticos (en este caso, Assur). Un saludo. --Romulanus (discusión) 08:15 19 abr 2018 (UTC)[responder]
Gracias a ambos. Espero no cometer errores, Jcfidy. Ya me dirás. Un saludo cordial.--Silviaanac (discusión) 14:48 19 abr 2018 (UTC)[responder]

Muchísimas gracias a todos los que habéis intervenido. Debo confesar que no tenía muchas esperanzas porque sé que es una petición engorrosa. También creo que gracias a Jcfidy y Romulanus Silvia y yo estamos aprendiendo más cosas. Y ya que preguntais, con los topónimos... el ideal sería el nombre histórico y entre paréntesis el actual, al menos en los lugares concretos de Asiria. Pido mucho, ya lo sé. Me habéis alegrado el día no ya por la traducción sino por la magnífica colaboración desinteresada. Saludos. Lourdes, mensajes aquí 15:13 19 abr 2018 (UTC)[responder] ┌─────────────────────────────┘
@Silviaanac: y @Lourdes Cardenal: lo de traducir los mapas no me importaría hacer pero tengo los dos ordenadores estropeados (es donde tengo los programas de edición de imágenes) y desde el móvil no sé editar imágenes (no sé si habrá alguna app específica). Jcfidy (discusión) 16:11 19 abr 2018 (UTC)[responder]

Su pedido señora Lourdes.:-) Puse entre paréntesis los nombres actuales de las ciudades que no conservan sus nombres antiguos. Además, agregué "Mar Mediterráneo" que no estaba en el original. Le pido a Jcfidy que vea, por favor, el tema de la plantilla "derivado de" que no supe incluir y algún otro error que seguramente cometí al subir la imagen. Un gran saludo a todos. --Silviaanac (discusión) 16:17 19 abr 2018 (UTC)[responder]
✓ Hecho aquí aunque un administrador ya puso los créditos también. Jcfidy (discusión) 16:25 19 abr 2018 (UTC)[responder]
¡Ohhhh!, se me han quedado los ojos como platos. De verdad muchas gracias. Con ese mapa ya nos podemos enterar todos de qué va el texto.
AlterOrient2 es
:-) Comienzo a trabajar con File:AlterOrient2.png. (Oriente Próximo hacia 1400 a. C.). Está en alemán y tiene colores "tristes", así que posiblemente lo cambie bastante. Hasta luego. --Silviaanac (discusión) 17:04 19 abr 2018 (UTC).[responder]
Aquí está. No es que los colores brillen de alegría, pero creo que el aspecto mejoró un poco. En cualquier caso, los nombres están traducidos. Saludos a todos. --Silviaanac (discusión) 22:08 19 abr 2018 (UTC)[responder]
@Jcfidy: por favor, cuando dispongas de un momento, ¿podrás echarle una mirada? No logro terminar de entender las cuestiones de commons. Gracias! --Silviaanac (discusión) 22:38 19 abr 2018 (UTC)[responder]

┌─────────────────────────────┘
@Silvaanac: ya lo hizo Leoncastro. Jcfidy (discusión) 07:01 20 abr 2018 (UTC)[responder]

Lourdes Cardenal, Juan Villalobos ha traducido traducido los mapas en el taller de ilustración. Estos son los enlaces para que los revises. Un saludo. --Romulanus (discusión) 10:02 20 abr 2018 (UTC)[responder]

Juan Villalobos, muchas gracias por tu trabajo que valoro mucho. Ahora a ver si soy capaz de incluirlos bien porque la sección de los imperios en la historia no la escribí yo y tengo que estudiarlo bien (además de buscar fuentes que avalen, ya sabes). Saludos Lourdes, mensajes aquí 17:52 20 abr 2018 (UTC)[responder]

@Lourdes Cardenal: En verdad solo lo encontré, lo hizo @Rowanwindwhistler:. Pero si puedo ayudar, con gusto. Normalmente veo siempre en Wikiproyecto:Ilustración/Taller gráfico/Peticiones. No conocía esta parte del café. Saludos, --Juan Villalobos (discusión) 07:49 23 abr 2018 (UTC)[responder]

Pues gracias a todos. Ha sido fácil poner los mapas traducidos, entre otras cosas yo estaba equivocada y sí que escribí yo todas esas secciones lo que pasa es que era un solo texto y alguien lo dividió con buen criterio. Saludos Lourdes, mensajes aquí 13:32 23 abr 2018 (UTC)[responder]

Artículo Orexina

Leyendo el artículo orexina me he dado cuenta que más de la mitad de la información es obsoleta. Existen datos que el artículo pone en duda, pero que recientes investigaciones lo confirman. Menciona que se hacen investigaciones sobre X o Y, pero esas investigaciones ya terminaron. No menciona la terapia O/H en el artículo (porque no se ha actualizado) ni tampoco se menciona el nuevo fármaco que antagoniza los receptores O/H. El problema aquí es que actualizar los datos requiere eliminar grandes porciones de información, lo que hace saltar las alarmas de reversores, verificadores, bibliotecarios y demás, para luego recibir desde reversiones, hasta amenazas de bloqueo por vandalismo. Uno se queda con la disyuntiva de ¿hago el cambio o dejo que se quede la información como está de obsoleta? Por mi parte, mi equipo y yo estamos al pendiente de la nueva información farmacológica, reposicionamientos de fármacos, nuevas informaciones farmacoterapéuticas y yo misma hago los cambios pertinentes en nuestros artículos; pero cuando se trata de información puesta por otra persona, incluso con malas traducciones, entonces preferimos no hacer nada. La información más "actual" del artículo es de hace 9 años. ¿Cuál es el protocolo aquí? ¿Que se quede la información errónea, o aventurarse a hacer los cambios? Campylobacter (¿Tienes algo racional que decir? ¡Ad Feminem!) 04:40 21 abr 2018 (UTC)[responder]

De ninguna manera, los artículos desactualizados deberían ser actualizados si se puede. Por otra parte —y como observación general—, sería bueno que especificaras que la tuya es una cuenta compartida. 🙝 Miguu ¡Parlamenta! 05:04 21 abr 2018 (UTC)[responder]
OK. Gracias. Haremos una revisión del artículo.
Agrego: la mía no es una cuenta compartida por nadie. Mi equipo de trabajo no entra a esta cuenta. Nadie posee la contraseña. La cuenta de mi ex jefe sí era compartida y, por tanto, ya dejó de usarse debido a que todos los del grupo entraban sin control y a que el titular de la cuenta fue ascendido a un puesto mayor y ya no tiene tanto tiempo para manejarla. Para asegurarse de que nadie entre, cambió su contraseña y yo me vi obligada a revivir la mía. En esta cuenta, mis colegas recaban la información y yo la edito, redacto y la publico. Nada más. Tampoco es empresarial. La empresa para la que laboramos, aunque es farmacéutica, no implica conflicto de intereses. Me gustaría que quede claro eso. Gracias por responder.Campylobacter (¿Tienes algo racional que decir? ¡Ad Feminem!) 06:54 21 abr 2018 (UTC)[responder]
Hola Campylobacter, no encuentro las «amenazas de bloqueo por vandalismo» en tu discusión. ¿Puedes señalar alguna de las que recibiste? Me parece poco ético realizar esa acusación contra todos los «reversores, verificadores, bibliotecarios y demás», y mucho más sin aportar pruebas. Independientemente de eso, si quieres editar un artículo hazlo, referenciando con fuentes fiables el texto que incorporas. Y si alguien deshace tu edición, coméntalo en la discusión para buscar un consenso. -- Leoncastro (discusión) 13:38 21 abr 2018 (UTC)[responder]
Que bueno que lo aclares; yo lo decía porque escribes en plural, pero ya veo. Me alegro de que tu y tus compañeros ayuden actualizando artículos de farmacología, es un tema que pocos editan, supongo que por desconocimiento. Un saludo y sigan así!. 🙝 Miguu ¡Parlamenta! 18:33 22 abr 2018 (UTC)[responder]

Traducción mala e incompleta

Hola. Llegué por casualidad a Planificación de vivienda urbana en países comunistas. La traducción comienza bastante bien y rápidamente va empeorando. Ya en la primera sección aparecen frases como "la mayoría de most recursos había directado", "dañado por el bombardamento" o "el Palacio de Prenza en Bacharest" (se refiere a Casa Presei Libere). A partir de la sección Rumania el texto está en inglés.
¿Qué es lo más adecuado en este caso?. Saludos cordiales. --Silviaanac (discusión) 15:05 25 abr 2018 (UTC)[responder]

Hola Silviaanac, se pueden hacer tres cosas: (a) dejar la plantilla {{traducción incompleta}} en el encabezado del artículo; (b) ocultar las secciones sin traducir; (c) hacer tu misma las ediciones que mejoren o terminen el artículo. Obviamente, por la naturaleza del proyecto, nos encantaría que pudieras seguir la tercera opción :). Saludos Superzerocool (el buzón de msg) 15:13 25 abr 2018 (UTC) (pd: hay más combinatorias, solo indiqué las más usuales)[responder]
Yo el problema que veo es que la tercera opción la puede hacer directamente con cualquier artículo de la wiki en inglés, y es incluso más cómodo, y además sería el creador del artículo, mientras que de ese modo solo le cuentan las ediciones y no la creación. Entonces, dicho esto, ¿por qué querría nadie romperse la cabeza con algo que otro ha hecho en unos segundos, sin apenas molestia, haciendo copy paste desde el traductor google o similar? ¿No sería mejor enviar este tipo de artículos a borrar directamente, ya que lo único que hacen es dar una mala imagen a la enciclopedia? ¿De no ser así, qué política nos impide ponernos a hacer traducciones automáticas de copy pega a todos los que colaboramos por aquí? Saludos. Conuve (discusión) 18:36 25 abr 2018 (UTC)[responder]
La tercera opción es como ha crecido este proyecto; si fuese por un criterio deletionista, este tipo de artículos no existiría. Es cierto que el copiar-pegar o el traductor de contenidos hace ediciones sin mucha revisión, y ante eso no podemos hacer mucho, pero creo que sugerir que DIY es para involucrar personas en el proyecto en lugar de mandar a la basura una contribución. La Wikipedia es un proceso en constante evolución, y es por eso que ese humilde artículo se puede convertir en algo mejor. Dos filosofías de cómo ver este proyecto. Saludos Superzerocool (el buzón de msg) 19:20 25 abr 2018 (UTC)[responder]
Entiendo la opinión de Conuve, pero en lo personal coincido con Superzerocool. De momento, voy a ocultar el texto no traducido y colocar la plantilla {{traducción incompleta}}, de modo que pueda atraer la curiosidad/colaboración de otras personas. También haré algunas mejoras básicas. Muchas gracias. --Silviaanac (discusión) 20:01 25 abr 2018 (UTC)[responder]
Yo no lo veo como un criterio deletionista, sino más bien como algo de sentido común, porque arreglar una traducción copy paste google, de una contribución de alguien que ha hecho eso en 30 segundos, lleva tres veces más trabajo que si haces la traducción directamente del original en inglés u otro idioma. Quizás todo el mundo debería saber esto antes de comenzar a arreglar una de estas traducciones, incluyendo esta información en la plantilla, de modo que se proteja al colaborador dedicado, en lugar de al que se dedica a trabajar mal. En mi opinión, el proyecto habría crecido tres veces más, si los usuarios que consultan la enciclopedia no se encuentran con estas pifias, que en ocasiones, pasan años sin corregir y evidentemente deterioran la opinión de los que solo vienen a consultar y desconocen los procedimientos internos. Conuve (discusión) 00:06 26 abr 2018 (UTC)[responder]
Elegí las dos primeras opciones y avancé un poco con la tercera. :-) Creo que, aún incompleto, el artículo mejoró bastante. Gracias! --Silviaanac (discusión) 02:23 26 abr 2018 (UTC)[responder]

En los casos en que la traducción es un galimatías imposible, directamente coloco {{autotrad}} y si en 30 días no se arregla, se borra. Estoy por la via del medio: es cierto que a veces con un poco de esfuerzo las cosas se arreglan, y lo he hecho en abundancia. Pero a veces es más fácil traducir de cero bien, que arreglar cosas como "motor doble jefe out", lo que sea que signifique. --Saludos. Ganímedes 11:15 26 abr 2018 (UTC)[responder]

@Ganímedes: a eso exactamente me refería, no sabía que con la plantilla esa se borraban si no tenían mejora. Los artículos que puedan arreglarse porque solo tengan algunos defectos de traducción deben editarse para corregirlos, evidentemente. Saludos. Conuve (discusión) 19:24 26 abr 2018 (UTC)[responder]
Finalice la traducción. Por lo menos ahora el artículo está en nuestro idioma, aunque le falte algún ajuste de redacción. Gracias! --Silviaanac (discusión) 19:34 26 abr 2018 (UTC)[responder]
Estoy totalmente de acuerdo con Superzerocool, hay esas opciones y uno puede decidir en cada caso qué hacer. Es cierto, por otra parte, lo que dice Conuve: tampoco se trata de dar la señal «haz cualquier tontería, allí en Wikipedia hay suficientes cronopios eficientísimos que te lo arreglan todo» Pero, en cambio, lo que no me gusta nada del comentario de Conuve es aquella idea de que esto sería una especie de «juego de crear artículos», una lógica en la que siempre sería «lo más cómodo borrar», y «quedar como el creador del artículo» mientras que de otro modo (arreglándolos) «solo le cuentan las ediciones y no la creación» ¿Le «cuentan» para qué? Mar del Sur (discusión) 23:11 26 abr 2018 (UTC)[responder]
Por mi parte, la respuesta inicial de Superzerocool fue exactamente lo que necesitaba en un momento en que (tal vez les haya sucedido alguna vez) me preguntaba "¿Por dónde empiezo?". Ahora bien, visto el tema en términos generales, es verdad lo que han comentado de que algunas personas consideran que "tarea colaborativa" significa "no importa lo que yo haga, luego viene alguien y corrige lo que haga falta". Saludos cordiales.--Silviaanac (discusión) 00:24 27 abr 2018 (UTC)[responder]
@Mar del Sur:, se trata de borrar aquello que está tan mal que probablemente nadie vaya a querer arreglarlo, y que no esté años hecho un desastre, como ha ocurrido tantas veces con traducciones automáticas. Ahora me entero por Ganímedes que por fin, gracias a la plantilla autotrad, se borran, y no quedan aquí haciéndole ningún favor al proyecto, ya que la autotraducción está al alcance de cualquiera, sin necesidad de venir a wikipedia a encontrarse una. Lo de la creación de artículos tienes razón, no deben contar para nada, pero a algunos nos gusta poder mostrarlos por ahí cuando hablamos de wikipedia, consultarlos de vez en cuando, mimarlos, tenerlos en seguimiento, continuar ampliándolos, etc, y todo esto nos anima a seguir contribuyendo, y también a hablar con propiedad cuando defendemos y damos explicaciones de wikipedia a los incrédulos que pululan por ahí. En ningún momento defendí la idea de borrar todo lo que tiene cuatro líneas aquí y allá defectuosas. Saludos. Conuve (discusión) 07:28 27 abr 2018 (UTC)[responder]

Categoría:Personas por origen étnico o nacional

Desenlazando Categoría:Personas por ascendencia étnica o nacional luego del cierre de Wikipedia:Consultas de borrado/Categoría:Personas por ascendencia étnica o nacional me encontré con Categoría:Personas por origen étnico o nacional que incluye entre sus subcategorías a muchas del tipo «descendientes de», las cuales también voy a desenlazar. Pero mi duda viene por el nombre de la categoría, ¿es el correcto? También es posible que tras el desenlace otras categorías asociadas queden vacías. Subcategorías de Categoría:Diásporas (algunas también se están utilizando para «descendientes de») y de «origen étnico o nacional». Las que queden vacías las voy a marcar como tales, aunque su nombre no sugiera inmediatamente una relación con esta consulta. --Metrónomo's truth of the day: «persevera y triunfarás» 23:54 29 abr 2018 (UTC)[responder]