Ces dernières années ont vu la prolifération tant des « données » accessibles que des outils pour les analyser. Le développement d’internet offre une masse d’informations potentiellement infinie ; la disponibilité croissante de bases de données importantes (directement ou après un travail de compilation) ; et les différentes transformations technologique (accessibilité, capacité de traitement) font que des masses d’informations sont désormais à portée de clic. Par ailleurs, une partie des interactions sociales a désormais lieu sur internet, et leur observation exige de recourir à des outils informatiques. Data - Sciences Sociales se propose de mettre en avant les potentialités et l’actualité des recherches sur le maniement informatisé de données en sciences sociales, et de permettre leur appropriation par le plus grand nombre.
Jeudi et vendredi dernier avaient lieu à l'INED les journées Science XXL. Réunissant des chercheurs de toutes presque toutes les sciences humaines sociales (économie, géographie, sociologie, histoire, science politique, démographie, histoire et philosophie des sciences), l'objectif était de se dema...
— Billet écrit avec Florent Bédécarrats Ce texte vise à présenter l’écriture en RMarkdown, une alternative à Word qui possède de nombreux avantages, dans un contexte actuel complexe pour l’édition scientifique. RMarkdown est une syntaxe, avec laquelle on peut écrire des textes structurés et les tran...
Science XXL Ce que l'abondance et la diversité des données font aux sciences sociales Journées d'étude organisées par Arnaud Bringé, Anne Lambert et Étienne Ollion avec le soutien de l'INED et du laboratoire SAGE (Université de Strasbourg) Inscription gratuite mais obligatoire sur le site de l'INED...
Faisant écho au Prix Nobel d’économie attribué à Angus Deaton, en reconnaissance notamment de ses travaux sur les enquêtes de conditions de vie des ménages, nous mettons aujourd’hui en ligne un document de travail sur ce sujet, qui sera l’occasion de trois billets sur notre blog. Cet article expliqu...
Aujourd'hui, en Amérique du nord, c'est Thanksgiving... L'occasion d'un peu de code de saison. library(ggplot2) Turkey - read.csv("https://dl.dropboxusercontent.com/u/83325995/tkplot.csv") ggplot(data = Turkey) + geom_tile(aes(x = Happy, y = Thanksgiving, fill=Turkey.Colors, width=1))+ scale_fill_id...
Nous relayons ici un appel à communication pour un dossier coordonné par N. Baya-Laffitte et B. Benbouzid, à paraître dans la revue Sociologie et Sociétés. -------- Mike Savage et Roger Burrows annoncent en 2007 dans la revue Sociology une crise à venir pour la sociologie empirique. Les deux profess...
Le carnet Data relaie cet appel à communication pour des journées d'études qui se tiendront les 16 et 17 mars 2017, à l'INED (version PDF). Données de l'Internet, données administratives, données de capteurs, fichiers de gestion (du personnel, d’adhérents, d’anciens élèves), etc.... le volume d’info...
Les expressions régulières sont des outils très puissants et commodes pour manipuler du texte, mais il faut bien reconnaître qu’on peut parfois se noyer dans leur syntaxe ésotérique. Heureusement il existe des petits logiciels, gratuits pour la plupart, qui permettent de visualiser la correspondance...
Faut-il partager ses données de recherche ? La tendance va en tout cas clairement dans ce sens. Les chercheuses sont de plus en plus nombreuses à mettre les données en ligne sur leur site. Les plateformes qui recensent ces données naissent régulièrement, d’autres s’enrichissent à toute vitesse, et d...
Les big data sont à la mode. Dans les médias comme dans le débat public, le terme est évoqué de manière récurrente. Des entreprises dédiées au traitement de ces masses d’informations sont créées chaque jour, d’autres réorganisent radicalement leurs activités autour de la gestion de ces données. À l...
Les modifications apportées après publication sont indiquées en bleu Intitulé Digital Paper. A Manual for Research and Writing with Library and Internet Material, le dernier ouvrage d'Andrew Abbott est en fait bien plus qu'un manuel. Il s'agit au moins autant d'une réflexion sur les conditions de pr...
Les expressions régulières sont un outil extrêmement utile pour réaliser des opérations complexes de recherche-remplacer sur des grandes quantités de texte, qui nous semble d’intérêt général pour tous les chercheurs en sciences sociales. On en présente ici le principe, la syntaxe et comment les util...
L’analyse quantitative de contenus connaît un renouvellement aussi récent que spectaculaire. Longtemps considéré par certains comme une technique mineure, la lexicométrie revient ainsi sur le devant de la scène. La numérisation automatique de nombreux textes comme les capacités de traitement ont don...
En cette fin d’année, deux journées d’études sont organisées sur les big data. L’une, qui s’est tenue la semaine dernière à l’ENSAE, portait sur les enjeux éthiques que pose l’usage de ces vastes ensembles de données. L’autre, intitulée « big data, entreprises et sciences sociales », aura lieu le 2...
En sociologie, les questionnaires dispensés via internet ont généralement mauvaise presse. À juste titre souvent : déposer un questionnaire sur un site et attendre ne permet qu’une sélection très modérée des répondants. Ceux qui répondent ont un biais (connexion à internet, disponibilité temporelle...
La multiplication des informations disponibles en ligne a peut-être eu un effet relativement inattendu : le retour en grâce d’analyses de réseau bi-mode. Une partie significative de données disponibles en ligne facilement sont en effet des listes « d’individus » appartenant à des « groupes » (entrep...
Billet co-écrit avec Marie Bergström Saint-Valentin oblige, on n’échappe pas aux reportages sur les sites de rencontre. Cette année, la tendance semble être aux sites extraconjugaux, qui proposent aux personnes en couple de trouver un autre partenaire « en toute discrétion ». Responsable des sites c...
Spécialiste de sociologie des sciences, Yves Gingras propose dans son dernier ouvrage une réflexion sur l’évaluation de la recherche. Publié aux éditions Raisons d’Agir, l’ouvrage se présente comme une nouvelle contribution critique aux débats très contemporains sur le sujet. Après d’autres, l’aute...
Dans le billet précédent, on avait discuté de l'intérêt du « cloud computing » pour les sciences sociales. La conclusion était qu'il peut parfois être utile d'avoir recours à la location de serveurs pour disposer d'une puissance de calcul décuplée. Si je l'ai utilisé dans le cas d'une vaste opérati...
La légende veut qu’une année, au moment des fêtes de fin d’année, Amazon ait connu un problème technique. Proche de leurs limites depuis plusieurs heures, les serveurs auraient rendu l’âme de manière inopportune, faisant perdre des sommes considérables à l’entreprise de Seattle. Pour éviter que cett...
Les ajouts et modifications apportés suite à la publication du billet sont indiqués par ce surlignage jaune. Voilà maintenant plus de deux ans, la Revue d’Histoire Moderne et Contemporaine a consacré un dossier aux pratiques numériques des chercheurs. L’article de Nicolas Delalande et de Julien Vinc...
Le blog reprend après quelques mois de pause, tout en continuant à travailler les questions de bibliométrie abordées précédemment. Il s’agit toujours, à partir d’une étude en cours, de questionner ce qu’une bonne connaissance des données bibliométrique peut être et peut permettre de faire, en tant q...
En attendant la reprise de ce blog (très prochaine), voilà l'annonce d'une conférence qui s'annonce vraiment intéressante. Les sources nativement numériques pour la recherche en histoire et patrimoine : pratiques et méthodes. Elle se tiendra au CNAM, le 9 décembre 2013. Les sciences humaines et soci...
Étrange devenir que celui de la sociométrie appliquée à l'étude des sciences. Initialement conçue comme une manière d'appréhender le travail des chercheurs et les relations qu'ils nouent, la méthode a connu un regain d'intérêt ces dernières années avec le développement d'indicateurs orientés vers l'...
En dépit de critiques récurrentes, on trouve des informations très utiles sur l’encyclopédie en ligne Wikipédia. Et, à condition de savoir les lire (i.e. de pratiquer la critique des sources), elle peut constituer une mine d’or pour les chercheurs. D’aileurs, vous pourriez y contribuer, ou contribue...