Intercity relationships between 293 Chinese cities quantified based on toponym co-occurrence

Fiche du document

Date

8 janvier 2024

Discipline
Type de document
Périmètre
Langue
Identifiant
Relations

Ce document est lié à :
info:eu-repo/semantics/reference/issn/1278-3366

Organisation

OpenEdition

Licences

info:eu-repo/semantics/openAccess , https://creativecommons.org/licenses/by/4.0/


Résumé En Fr Es

This dataset presents relationships between 293 Chinese cities, derived using a toponym co-occurrence method. By employing this toponym co-occurrence analysis method, the strength of an intercity relationship is determined by the frequency at which both city names appear on the same webpage. The data was sourced from the Common Crawl web archive's 2019 April Corpus, which contains approximately 2.5 billion web pages. The primary aim of this dataset is to provide a fresh perspective on intercity relationships, thereby facilitating studies on city network analysis. The dataset not only encourages further research into comparing this innovative city relationship with other established networks but is also a showcase that presents a straightforward methodology that can be applied to other archives within Common Crawl. As such, it paves the way for longitudinal studies that probe the evolution of city networks.

Cet ensemble de données présente les relations entre 293 villes chinoises, établies à l'aide d'une méthode de co-occurrence des toponymes. Cette méthode évalue la solidité des liens interurbains en mesurant la fréquence à laquelle les noms de deux villes apparaissent conjointement sur une page web. Les données proviennent du corpus d’avril 2019 des archives web Common Crawl, qui contiennent environ 2,5 milliards de pages web. L'objectif principal de cet ensemble de données est de fournir une nouvelle perspective sur les relations inter urbaines, facilitant ainsi les études sur l'analyse des réseaux de villes. L'objectif principal de cet ensemble de données est d'offrir une perspective inédite sur les relations entre villes, facilitant ainsi les recherches sur l'analyse des réseaux urbains. Il stimule non seulement la poursuite des recherches visant à comparer cette relation innovante entre villes avec d'autres réseaux établis, mais sert également de démonstration en présentant une méthodologie simple pouvant être appliquée à d'autres archives au sein de Common Crawl. Cela ouvre ainsi la voie à des analyses longitudinales sur l'évolution des réseaux de villes.

Este conjunto de datos presenta las relaciones entre 293 ciudades chinas, establecidas mediante un método de coocurrencia de topónimos. Al emplear este método de análisis, la fuerza de una relación interurbana está determinada por la frecuencia con la que ambos nombres de ciudades aparecen en la misma página web. Los datos fueron obtenidos del corpus de abril del año 2019 a partir del archivo web Common Crawl, que contiene aproximadamente 2.500 billones de páginas web. El objetivo principal de este conjunto de datos es proporcionar una nueva perspectiva sobre las relaciones interurbanas, facilitando así estudios referentes al análisis de redes de ciudades. El conjunto de datos no solo fomenta una mayor investigación para comparar esta relación innovadora entre ciudades con otras de redes establecidas, sino que también se constituye en una metodología sencilla que podría ser aplicada a otros archivos de Common Crawl. Lo anterior abre el camino para estudios longitudinales que analicen la evolución de las redes de ciudades.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en