Hemos publicado nuestro trabajo de generalización y validación de la medida de ranking a partir de datos enciclopédicos de Wikidata y Wikipedia en la revista Ibersid de la Universidad de Zaragoza. El artículo está disponible al mismo tiempo en inglés y español.
En este artículo se presenta el modelo Wiki3DRank, que combina datos cuantitativos extraídos en tiempo real de Wikidata y Wikipedia para obtener un ranking de objetos de conocimiento a través de un valor cuantitativo que mida la relevancia de un objeto frente a otros en un determinado dominio. El modelo se basa en la distribución de los objetos de conocimiento en un espacio vectorial cuyas componentes se basan en tres variables principales: número de declaraciones en Wikidata sobre un ítem, número de artículos en las diferentes ediciones de Wikipedia y extensión en número de palabras de dichos artículos. Estas variables se asocian al nivel de descripción de los ítems de Wikidata, la difusión de los objetos de conocimiento asociados a los mismos en las ediciones de Wikipedia de diferentes idiomas y el grado de elaboración editorial de los correspondientes artículos de Wikipedia. Para demostrar la viabilidad del modelo se analizan una serie de casos de uso sobre diversos dominios: libros, películas, catedrales, terremotos, ríos y elementos químicos.
A partir de los resultados obtenidos es posible concluir que Wiki3DRank es una herramienta que permite medir la relevancia de objetos de conocimientos en el contexto de un dominio de conocimiento. Se muestra el funcionamiento de una herramienta de código abierto que permite el cálculo en línea de Wiki3DRank. Los resultados obtenidos sugieren que el modelo propuesto puede aplicarse para diferentes contextos y dominios, que pueden introducirse elementos de ponderación y es posible extender el modelo mediante la introducción de nuevos componentes basados en otras características de los datos enciclopédicos de los objetos de conocimiento, al mismo tiempo que se mantiene el sistema de cálculo vectorial de base.
Pastor Sánchez, J.-A., Saorín, T., & Baños-Moreno, M.-J. (2024). Wiki3DRank: un modelo para medir la relevancia de objetos de conocimiento mediante datos cuantitativos de Wikidata y Wikipedia. Ibersid: Revista De Sistemas De información Y documentación, 18(1), 55–70. Recuperado a partir de https://www.ibersid.eu/ojs/index.php/ibersid/article/view/4967
Revista Ibersid, 2024
Representación de Wiki3DRank como un vector.
También está disponible la aplicación para realizar los cálculos de conjuntos de items, obteniendo el valor de cada item, la medida de centralidad del conjunto y el valor máximo.