Jump to content

PetScan

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page PetScan and the translation is 99% complete.
Coolest Tool Award 2022 logo
PetScan

2022 Coolest Tool
Award Winner

in the category
Reusable

PetScan es una poderosa herramienta de consulta. En el formulario de envío de PetScan se elabora una consulta. También, echa un vistazo a las razones detrás de esta herramienta.

Introducción

PetScan es una herramienta que permite a los usuarios extraer datos, generar listas de páginas de Wikipedia (y proyectos relacionados) o elementos de Wikidata que coinciden con ciertos criterios, como todas las páginas de una categoría determinada, o todos los elementos con una propiedad determinada y extraer y analizar datos de los proyectos Wikimedia. PetScan también puede combinar listas temporales (llamadas «fuentes») de diferentes maneras para crear una nueva. Las fuentes incluyen:

Páginas de Wiki(m/p)edia

Estas se definen en las pestañas Categorías, Propiedades de la página y Plantillas y enlaces. Puedes consultar páginas en árboles de categorías, con plantillas específicas o enlaces desde/hacia páginas específicas; limitar tus resultados a ciertos espacios de nombres, ediciones de bots/humanos, ediciones recientes/creación de páginas, etc. Estas tres pestañas representan la funcionalidad anterior de CatScan2. El resultado de tu consulta se conserva posteriormente como «fuente de categoría».

Otras fuentes

En esta pestaña, puedes agregar más fuentes, como consultas SPARQL de Wikidata (WDQS) o listas de PagePile. También puedes definir cómo combinar múltiples fuentes; de forma predeterminada, el subconjunto (es decir, solo las páginas que aparecen en todas las fuentes) se devuelve en el resultado final. También puedes especificar a qué wiki deseas que apunte tu lista, por ejemplo, si combinas los resultados de Wikipedia y Wikidata.

Wikidata

En esta pestaña, puedes anotar o filtrar aún más tus resultados, como por ejemplo, devolver sólo elementos de Wikidata que no tengan declaraciones. El uso de cualquiera de estos filtros convertirá tu lista a Wikidata.

Salida

Aquí puedes especificar opciones para tu lista, como por ejemplo, el formato (página web, wiki, PagePile, etc.). También puedes filtrar aún más tus resultados, por ejemplo, con expresiones regulares en títulos de páginas/etiquetas de elementos. También puedes reemplazar la lista de resultados con una lista clasificada de temas faltantes («enlaces rojos»).

Define tu consulta

Los campos que se pueden rellenar en el formulario de consulta son los siguientes:

Campo Significado Valor por defecto Nota
Idioma Selecciona el código de idioma del proyecto, por ejemplo, «es» para español o «en» para inglés. Selecciona «Commons» para Wikimedia Commons "en"
Proyecto Proyecto Wikimedia en el que buscar (wikipedia, wiktionary, wikiversity, etc.) "wikipedia" NOTE: If you choose "Commons," be sure to go to the "Page properties" tab and check the "File" namespace to get useful results.
Profundidad Profundidad de árboles de categoría a buscar. 0 significa no utilizar subcategorías. "0"
Categorías Lista de categorías, una por línea sin la parte «categoría:» Vacío Al agregar '|' y un número se establecerá la profundidad de este árbol de categorías, anulando lo que se eligió en el campo Profundidad. Al especificar una categoría, puedes limitar los resultados de la búsqueda y centrarte en páginas relacionadas con un tema en particular.
Categorías a excluir Lista de categorías como arriba. Solo se aceptarán los artículos que no estén incluidos en estas categorías. Vacío
Combinación Cómo se deben utilizar las categorías anteriores:
  • Lista de categorías: Lista de subcategorías
  • Intersección: Todas las páginas que están en todos los árboles de categorías
  • Unión: Todas las páginas que están al menos en un árbol de categorías
  • Diferencia: Todas las páginas que están en sólo uno de los árboles de categorías
  • Al menos (N): Todas las páginas que están en al menos N árboles de categorías

Las opciones disponibles actualmente son "intersección" o "unión".

"intersección"
Espacios de nombres Los espacios de nombres a utilizar como páginas potenciales Artículos
Redirecciones Ambos
Plantillas Utiliza solo las páginas que
  • Cuadro 1: contiene todas las plantillas dadas
  • Cuadro 2: contiene una de las plantillas dadas
  • Cuadro 3: no contenga ninguna de las plantillas dadas

Introduce una plantilla por línea, sin el prefijo «plantilla:». Cada cuadro puede calificarse seleccionando «Usar páginas de discusión»

Vacío Esta opción sólo parece compatible con las plantillas definidas en el espacio de nombres «plantilla:». No se puede utilizar con plantillas definidas en el espacio de nombres «Usuario:». No se puede utilizar en los espacios de nombres «Creator:» o «Institution:» que se utilizan en Wikimedia Commons.
Enlazado desde
Última edición Mostrar las páginas cuya última edición fue o no realizada por un bot, por un usuario anónimo o está marcada Cualquiera de ellos
Última edición Fecha o período de tiempo de la última edición en la página en el formato YYYYMMDDHHMMSS (se permite formas más cortas) «Solo las páginas creadas durante la ventana de tiempo anterior» te permite buscar la primera edición en su lugar
Tamaño Tamaño del archivo o rango de tamaño en bytes Vacío Permite seleccionar los artículos cuyos archivos son mayores que un límite y/o menores que otro límite
Enlaces Número o rango de enlaces internos en la página Vacío Permite la selección de artículos con muchos o pocos enlaces
Enlaces rojos
Categorías superiores Característica que aún no está disponible.
Ordenar Característica que aún no está disponible, que permitiría establecer un criterio de ordenamiento para los datos de salida.
Lista manual Permite ofrecer una lista de nombres de páginas (con su espacio de nombres como prefijo) o elementos de Wikidata desde el proyecto especificado La parte complicada es especificar los proyectos, los códigos correctos son:
  • Wikipedia en inglés: enwiki
  • Wikisource en alemán: dewikisource o dewikisourcewiki
  • Wikcionario en griego: elwiktionarywiki
  • Wikinoticias en inglés: enwikinews
  • Wikidata: wikidatawiki
Wikidata Obtener Wikidata, en caso de estar disponible.
Formato Formato de salida de los resultados de búsqueda:
HTML: páginas web
CSV: valores entre comillas, separados por comas
TSV: valores separados por tabulaciones
WIKI: como una tabla Wiki
PHP: como un archivo PHP
XML: como un archivo XML
¡Adelante! Presiona esto para ejecutar la consulta que has definido.

Conocimientos

Identificador de PetScan (PSID)

A partir del 04/04/2016, cada consulta que se ejecuta en PetScan se registra (¡de forma anónima!) y se le asigna un identificador numérico único y estable llamado PSID. Puedes utilizar el PSID para

  • ejecutar esta consulta PetScan como entrada en herramientas que admiten PSID (como WD-FIST)
  • completar una «URL corta»: https://petscan.wmflabs.org/?psid=PSID ejecutará la consulta con PSID, con todas sus configuraciones
  • expandir programáticamente en una consulta anterior, «sobrescribiendo» los parámetros: https://petscan.wmflabs.org/?format=wiki&psid=PSID ejecutará la misma consulta que antes, pero el formato de salida será wiki (en lugar del HTML predeterminado, o lo que se eligió originalmente).

Notas:

  • ¡Solo se almacenará la consulta, no sus resultados!
  • Las consultas grandes (por ejemplo, con muchos elementos manuales) no se almacenarán. En ese caso, no se mostrará ningún PSID.
  • Los resultados con una casilla de verificación vacía tienen posibles coincidencias dentro del conjunto de Wikidata.
  • El enlace interwiki petscan: se puede utilizar para generar accesos directos para consultas permanentes, por ejemplo [[petscan:PSID]]
  • las consultas registradas no se deduplican, por lo que se generará un nuevo PSID cada vez, a menos que se llame a un PSID existente sin modificaciones.

Crear elementos de Wikidata para artículos de Wikipedia que aún no tienen uno (función de creador)

  • Configura una consulta que devuelva una lista de páginas de Wikipedia (u otro proyecto que no sea Wikidata) o pega una lista en "Otras fuentes/Lista manual"
  • En la pestaña «Propiedades de la página», debes seleccionar «Redirecciones = No» Esto se hace automáticamente ahora; ¡puedes volver a cambiarlo si realmente quieres redireccionamientos en tu lista!
  • En la pestaña «Wikidata», selecciona «Solo páginas sin item» para la opción «Páginas con elementos».
  • Ejecuta la consulta
  • Tus resultados tendrán elementos adicionales al lado del encabezado «resultados» (a menos que no hayas iniciado sesión en WiDaR, en cuyo caso verás un enlace apropiado en su lugar)
  • Todas las páginas para las que no hay una coincidencia exacta en ninguna etiqueta o alias en Wikidata están marcadas de forma predeterminada.
  • Puedes marcar/desmarcar casillas manualmente ahora, si es necesario.
  • Puedes agregar declaraciones predeterminadas en el cuadro de declaraciones, que se agregarán a todos tus elementos nuevos. Entonces, si solo creas elementos para personas, agrega P31:Q5. Puedes agregar varias declaraciones de esta manera (una por línea). Ten en cuenta que el caso de P/Q debe estar en mayúsculas; de lo contrario, fallará silenciosamente.
  • Puedes agregar descripciones predeterminadas a los artículos nuevos, como Dde:"some description" para una descripción en alemán.
  • Haz clic en el botón verde «Iniciar QS». Esto abrirá una nueva página.
  • Puedes hacer clic en «Ejecutar» para ejecutar un lote en tu navegador, o «Ejecutar en segundo plano» para ejecutarlos desde un servidor Wikimedia. Consulta Ayuda: QuickStatements para obtener más información.


Añadir o quitar declaraciones para elementos de Wikidata

Es posible añadir o quitar declaraciones de elementos de Wikidata con PetScan. Para ello es fundamental elegir «Wikidata» en «Otras fuentes -> Usar wiki». Después de esto aparecerá la caja de comandos al lado del número y permitirá continuar como se describió en la sección anterior.

Referrer

(V2 solamente) Si abres PetScan desde otra herramienta que permite al usuario crear una consulta, puedes pasar los parámetros referrer_url y referrer_name (el valor predeterminado es referrer_url). referrer_url debe tener una cadena {PSID} que se reemplazará con el PSID que ve el usuario. Una vez que se ejecuta una consulta, un cuadro en la parte superior de la página le solicitará al usuario que regrese a la herramienta original, utilizando el referrer_url modificado con PSID.

Ejemplos

Artículos en un Wikiproyecto

PetScan puede ser utilizado para consultar los artículos y anexos pertenecientes a un Wikiproyecto para su posterior análisis o para exportar esta lista (por ejemplo, para crear una lista de seguimiento del Wikiproyecto). En este ejemplo, encontraremos todos los artículos pertenecientes al «Wikiproyecto Videojuegos». Nota: Las instrucciones a continuación difieren de las instrucciones de la página original de PetScan en inglés, debido a la forma en cómo funcionan los Wikiproyectos en Wikipedia en español, mediante el uso de la plantilla PR.

Para realizar esta consulta, desde la página de inicio de PetScan, ve a la pestaña «Categorías» y en la sección «Categoría», añade la categoría principal del Wikiproyecto donde se categorizan los artículos (en este caso, sería «Categoría:Wikiproyecto:Videojuegos/Artículos»). En la misma pestaña, no te olvides de indicar el idioma de Wikipedia (en este caso, «es» para Wikipedia en español). En la pestaña «Propiedades de la página», en la sección «Espacio de nombres», selecciona «Discusión» y «Anexo discusión», que es donde se localiza la plantilla de Wikiproyectos (en este caso, {{PR|Videojuegos}}). En la pestaña «Otras fuentes», en la sección «Espacio de nombres», selecciona «Cambiar a página principal», para que la lista sea de los artículos y anexos y no sus páginas de discusión. Por último, has clic en el botón «¡Adelante!» para ejecutar la consulta.

Aquí está la consulta completa. Cuando se ejecutó el 2 de junio de 2024, la consulta tardó 1,9 segundos en ejecutarse y arrojó 10 080 resultados. La lista aparece debajo del formulario de envío (que permanece en tu pantalla), por lo que debes desplazarte hacia abajo para ver los resultados. Sólo se muestran los primeros 10 000 resultados en HTML, para no bloquear tu navegador; otros formatos tendrán resultados completos (los cuales puedes configurar en la pestaña «Salida», sección «Formato»).

Artículos destacados que necesitan referencias

Los artículos destacados son lo mejor de lo mejor de Wikipedia, pero con el tiempo, los usuarios añaden información que no necesariamente está referenciada, con el riesgo de que pueda peligrar la distinción del artículo. En Wikipedia en español, las afirmaciones o secciones que requieran referencias se marcan con la plantilla Cita requerida. Usando PetScan, es posible saber qué artículos destacados poseen dicha plantilla.

Para realizar esta consulta, desde la página de inicio de PetScan, ve a la pestaña «Plantillas y enlaces» y en la sección «Plantillas», en el cuadro Tiene todas estas plantillas, escribe las plantillas «Artículo destacado» (que es la plantilla utilizada para indicar que un artículo es destacado) y «Cita requerida», separadas por un salto de línea. Por último, has clic en el botón «¡Adelante!» para ejecutar la consulta.

Aquí está la consulta completa. Cuando se ejecutó el 2 de junio de 2024, la consulta tardó 0,5 segundos en ejecutarse y arrojó 172 resultados. La lista aparece debajo del formulario de envío (que permanece en tu pantalla), por lo que debes desplazarte hacia abajo para ver los resultados.

Detección de páginas que tienen una combinación anómala de espacio de nombre y categoría(s)

PetScan se puede utilizar para encontrar páginas que se encuentran en una categoría (o combinación de categorías) que no es apropiada para páginas en un espacio de nombre en particular, por ejemplo, páginas de administración de Wikipedia que se encuentran en una categoría que solo debería contener artículos enciclopédicos. Esto se puede solucionar (por ejemplo, moviendo un artículo al espacio de nombre correcto o editando una discusión para insertar un ":" faltante donde se hace referencia a una categoría). El primer paso en este proceso es identificar (usando PetScan) las categorías que causan una categorización incorrecta (por ejemplo, categorías de administración de Wikipedia que se encuentran en categorías de artículos).

Encontrar fotos subidas a Commons no categorizadas en un idioma determinado

(Basado en Grants:Learning patterns/Treasures or landmines: detecting uncategorized, language-specific uploads in Commons (en inglés). ¡Ve la motivación y la explicación completa allí! ¡Gracias al usuario de Wikimedia User:Spiritia y a otros colaboradores/comentaristas por contribuir con esto! )

Ejecuta una consulta utilizando PetScan con la siguiente configuración:

Language = commons
Project = wikimedia
Depth = 1
Categories = Uncategorized files
Combination = ☑ Subset
Namespaces = ☑ File
Templates : Has all of these templates = <código de tu idioma> 
Format:  ☑ Extended data for files     ☑ File usage data

El código del idioma español es «es»; el código del idioma rumano es «ro». Para encontrar fotos no categorizadas subidas por usuarios que usan el idioma rumano, una versión de la consulta (con salida HTML y sin ejecución automática) es:

https://petscan.wmflabs.org/?language=commons&project=wikimedia&depth=1&categories=Uncategorized files&ns[6]=1&templates_yes=ro&ext_image_data=1&file_usage_data=1

Cuando la consulta se ejecutó el 2 de junio de 2024, tardó 9 segundos en ejecutarse y arrojó 972 fotos no categorizadas.

Notas:

  1. El campo «Idioma» no se utiliza para seleccionar el idioma deseado; el código del idioma deseado se establece en la pestaña «Plantilla», en el cuadro «Tiene todas estas plantillas».
  2. El código de idioma distingue entre mayúsculas y minúsculas en la consulta. Por ejemplo, utiliza «ro» en lugar de «RO».
  3. Para generar los resultados, se eligió «Formato: ☑ Wiki», en lugar de la salida predeterminada HTML.

¡Que lo disfrutes! ¡Gracias de nuevo a User:Spiritia especialmente!

Elementos sin declaraciones

La opción «No tiene declaraciones» (de la pestaña «Wikidata», sección «Usa elementos/propiedades») se puede utilizar para encontrar, por ejemplo, elementos sin declaraciones para una categoría en Wikipedia (muestra: es:Categoría:España)

Pasos para importar datos de la plantilla Bio de la Wikipedia en italiano a Wikidata, algunos con PetScan.

Obtener los enlaces de sitio para un determinado proyecto a partir de una consulta SPARQL

  • Indica el proyecto en la pestaña «Categorías». Por ejemplo, de para «Idioma» y wikipedia en «Proyecto» para utilizar la edición en alemán de Wikipedia.
  • En «Otras fuentes» introduce tu consulta SPARQL.
  • Asegúrate de seleccionar «Desde categorías» en las opciones «Usar wiki»
  • Has clic en «Adelante»

Esto podría ser útil para obtener la cantidad de visitas de un conjunto específico de páginas, en función de una consulta SPARQL. Puedes guardar esto en un Pagepile (consulta la pestaña «Salida»), luego ingresa esa ID de Pagepile en Massviews Analysis (selecciona 'Page Pile' en el menú desplegable «Fuente»).

Obtener una lista de elementos de Wikidata con exclusiones basada en una consulta SPARQL

Supongamos que tienes una lista de personas con ID de Wikidata (QIDs) a las que deseas agregar una ocupación (P106) de «diseñador de joyas» (Q2519376), tal vez con una herramienta como QuickStatements. Sin embargo, no deseas agregar esta ocupación a elementos que ya tienen esa ocupación. A continuación se explica cómo hacerlo con PetScan:

  • Ten tu lista de QIDs en un archivo de texto, con cada QID en una nueva línea
  • En la pestaña «Otras fuentes», pega este texto en el campo llamado «Lista manual»
  • En el campo «Usar wiki» ingresa la cadena wikidatawiki
  • En el campo «SPARQL» ingresa tu consulta SPARQL. En este ejemplo, esta consulta devolverá como resultado todos los humanos que tienen una ocupación de «diseñador de joyas»:
    select ?item where { ?item wdt:P31 wd:Q5; wdt:P106 wd:Q2519376. }
  • Finalmente, debes hacer una exclusión, por lo que en el campo «Combinación» añade el texto manual NOT sparql para obtener todos los QID de la «lista manual», pero sin los elementos de la consulta SPARQL.
  • Has clic en «Adelante»

Añade tu ejemplo aquí...

Informes de errores, solicitudes de funciones, código fuente

Véase también

Enlaces externos