Vous pouvez faire un don au Programming Historian

Index des leçons

Nos leçons sont organisées en fonction des phases essentielles du processus de recherche, mais aussi en fonction de sujets généraux. Utilisez les boutons pour filtrer les leçons par catégories. Si vous ne pouvez pas trouver la compétence, la technologie ou l’outil que vous recherchez, faites-le nous savoir s’il-vous-plaît!

réinitialiser pour voir toutes les leçons (32)
  • trier par date de publication
  • trier par difficulté

Filtrage par: Toutes les leçons date

  • Heather Froehlich

    Analyse de corpus avec AntConc

    L’analyse de corpus est un type d’analyse textuelle qui permet de faire des comparaisons d’objets textuels à grande échelle (la fameuse “lecture à distance” (distant reading)).

    analyzing distant-reading 2019-06-19 1
  • Matthew J. Lavin

    Analyse de documents avec TF-IDF

    Cette leçon présente une méthode de traitement automatique des langues et de recherche d’informations nommée Term Frequency - Inverse Document Frequency (tf-idf). Elle en expose les fondations et introduit à l’occasion des questions et des concepts liés à l’analyse de textes.

    analyzing distant-reading 2022-06-27 2
  • Taryn Dewar

    Analyser des données tabulaires avec R

    Cette leçon montre comment analyser rapidement de grands jeux de données tabulaires, pour rendre la recherche plus rapide et plus efficace.

    transforming data-manipulation r 2023-09-29 1
  • John R. Ladd, Jessica Otis, Christopher N. Warren, et Scott Weingart

    Analyse de réseau avec Python

    Cette leçon présente différents indicateurs de réseau et la manière de les interpréter lorsque l’on travaille avec des données relationnelles en sciences humaines et sociales. Vous apprendrez à utiliser la bibliothèque Python NetworkX pour calculer et interpréter ces indicateurs.

    analyzing network-analysis 2024-04-26 2
  • Nicolas Frerebeau et Brice Lebrun

    Calibrer des âges radiocarbone avec R

    Cette leçon vous apprend à calibrer des âges radiocarbone avec R. Après un rappel sur le principe du radiocarbone et les enjeux de la calibration, cette leçon explique pas à pas comment réaliser la calibration d’un ensemble de dates et comment explorer et présenter les résultats.

    analyzing data-manipulation r data-visualization 2021-03-24 2
  • Doug Knox

    Comprendre les expressions régulières

    Dans cette leçon, nous allons voir une utilisation avancée de la fonction rechercher-remplacer d’un logiciel de traitement de texte dans le but d’exploiter la structure d’un court document historique, qui n’est en essence rien d’autre qu’un tableau en prose.

    transforming data-manipulation 2020-01-15 2
  • William J. Turkel et Adam Crymble

    Comprendre les pages web et le HTML

    Cette leçon propose une introduction au langage HTML et à la structuration des pages web.

    presenting python 2019-07-06 2
  • Agustín Cosovschi

    Des sources aux données, concevoir une base de données en sciences humaines et sociales avec nodegoat

    Cette leçon permet de prendre en main le logiciel nodegoat pour construire une base de données relationnelle dans le cadre d’une recherche en sciences humaines.

    transforming data-manipulation 2024-02-29 1
  • Sarah Simpkin

    Débuter avec Markdown

    Cette leçon est une introduction à Markdown, une syntaxe en texte brut pour le formatage de documents. Vous allez découvrir pourquoi l’utiliser, comment formater des fichiers Markdown et comment prévisualiser de tels fichiers sur le web.

    presenting data-management 2020-04-10 1
  • William J. Turkel et Adam Crymble

    Décomptes d'occurrences de mots en Python

    Compter les occurrences de mots spécifiques dans une liste peut constituer une source de données utiles. Cette leçon vous apprendra comment compter ces occurrences facilement en Python.

    analyzing python 2023-03-08 2
  • Miriam Posner

    Démarrer avec Omeka Classic

    Omeka.net permet de créer un site web facilement afin de valoriser une collection de contenus. Cette leçon explique comment créer un site Omeka, le configurer, y ajouter des extensions et des contenus, et organiser ces contenus en collections.

    presenting website 2024-03-19 1
  • Matteo Romanello et Simon Hengchen

    Détecter la réutilisation de texte avec Passim

    Dans cette leçon, vous serez initié à la détection automatique de la réutilisation des textes avec la bibliothèque Passim. Vous apprendrez comment installer et exécuter Passim et ses dépendances, comment préparer vos textes en tant que fichiers d’entrée adaptés à l’utilisation de Passim et, enfin, comment traiter la sortie générée par Passim pour effectuer des analyses de base.

    transforming data-manipulation 2021-09-10 3
  • William J. Turkel et Adam Crymble

    Du HTML à une liste de mots (partie 1)

    Dans cette leçon en deux parties, nous allons utiliser les compétences acquises dans la leçon « Télécharger des pages web avec Python », et voir comment supprimer les balises HTML de la page de la transcription du procès-verbal de Benjamin Bowsey en 1780 dans le but de créer un texte propre et réutilisable. Nous réaliserons cette tâche en utilisant les opérateurs et méthodes de chaines de caractères propres à Python, ainsi que nos compétences relatives à la lecture attentive. Nous introduirons ensuite les concepts de boucles et d’instructions conditionnelles afin de répéter notre processus de traitement et de tester certaines conditions nous permettant de séparer le contenu des balises HTML. Pour finir, nous convertirons les données obtenues et enregistrées sous la forme d’un texte sans balises HTML en une liste de mots qui pourra par la suite être triée, indexée et investie lors d’analyses statistiques.

    transforming python 2023-09-13 2
  • William J. Turkel et Adam Crymble

    Du HTML à une liste de mots (partie 2)

    Dans cette leçon, nous allons implémenter l’algorithme découvert dans la leçon « Du HTML à une liste de mots, partie 1 », afin d’apprendre à découper une chaine de caractères en une liste de mots.

    transforming python 2023-11-09 2
  • Jon Crump

    Générer un jeu de données structuré à partir d’un texte océrisé

    Ce tutoriel présente des stratégies pour traiter la sortie OCR brute issue d’un texte scanné, l’analyser afin d’isoler et de corriger les éléments essentiels des métadonnées, et générer un ensemble de données structuré (un dictionnaire Python) à partir de celle-ci.

    transforming data-manipulation 2021-11-19 3
  • Fred Gibbs

    Installation de bibliothèques Python avec pip

    Il existe de nombreuses manières d’installer des bibliothèques Python externes; cette leçon explique l’une des méthodes les plus courantes utilisant pip.

    acquiring get-ready python 2021-01-06 1
  • William J. Turkel et Adam Crymble

    Installer un environnement de développement intégré pour Python (Windows)

    Cette leçon vous montrera comment installer un environnement de développement pour Python sur un ordinateur exécutant le système d’exploitation Windows.

    transforming get-ready python 2020-07-13 1
  • William J. Turkel et Adam Crymble

    Installer un environnement de développement intégré pour Python (Linux)

    Cette leçon vous montrera comment installer un environnement de développement pour Python sur un ordinateur exécutant le système d’exploitation Linux.

    transforming get-ready python 2021-10-06 1
  • Ian Milligan et James Baker

    Introduction à l'interface en ligne de commande Bash et Zsh

    Cette leçon vous apprendra comment entrer des commandes dans une interface en ligne de commande, plutôt qu’à travers une interface graphique. Les interfaces en ligne de commande présentent des avantages pour les utilisateurs qui ont besoin de plus de précision dans leur travail. Elles permettent de détailler le lancement de certains programmes, en autorisant l’ajout d’argument pour spécifier exactement la façon dont vous voulez que votre programme se lance. De plus, il est possible de les automatiser facilement en créant des scripts, qui peuvent être considérés comme des recettes (une suite d’instructions précises) reposant sur des commandes au format textuel.

    transforming data-manipulation get-ready 2024-04-24 1
  • Shawn Graham

    Une introduction aux Bots Twitter avec Tracery

    Cette leçon explique comment créer de simples bots Twitter à l’aide de la grammaire Tracery et du service Cheap Bots Done Quick. Tracery est interopérable avec plusieurs langages de programmation et peut être intégrée dans des sites web, des jeux ou des bots.

    presenting api 2020-05-09 2
  • Vincent Paillusson

    Introduction à Heurist

    Ce tutoriel présente l’utilisation d’Heurist, un logiciel de gestion de base de données dédié aux sciences humaines et sociales. En s’appuyant sur un jeu de données de sites de fouilles archéologiques, il illustre le fonctionnement d’Heurist et ses fonctionnalités.

    transforming data-manipulation mapping 2022-04-01 2
  • François Dominic Laramée

    Introduction à la stylométrie en Python

    Ce tutoriel vous apprendra comment appliquer diverses méthodes stylométriques pour déterminer les auteurs de textes disputés. Trois méthodes sont abordées: les courbes caractéristiques de composition de Mendenhall, la méthode du khi carré de Kilgariff et, enfin, la méthode du Delta de John Burrows.

    analyzing distant-reading 2019-05-03 2
  • Quinn Dombrowski, Tassie Gniady, et David Kloster

    Introduction aux carnets Jupyter

    Les carnets Jupyter proposent un environnement dans lequel il est possible de combiner librement le code informatique et le texte en langage naturel. Cette leçon explique comment installer le logiciel Jupyter Notebook, comment créer et exécuter des carnets Jupyter, et dans quels contextes ces carnets peuvent se révéler particulièrement utiles.

    presenting python website 2020-10-21 1
  • William J. Turkel et Adam Crymble

    Introduction à Python et installation

    Cette première leçon de notre section traitant des sources en ligne a pour but de vous préparer, vous et votre ordinateur, à commencer à programmer. Nous allons nous concentrer sur l’installation de l’environnement de développement requis, qui est gratuit et fiable. Puis nous vous aiderons à compléter un premier essai avec un programme simple qui donnera des résultats immédiats.

    transforming python get-ready 2020-07-30 1
  • William J. Turkel et Adam Crymble

    Manipuler des chaînes de caractères en Python

    Cette leçon constitue une brève introduction aux techniques de manipulation des chaînes de caractères en Python.

    transforming python 2020-04-02 2
  • Seth van Hooland, Ruben Verborgh, et Max De Wilde

    Nettoyer ses données avec OpenRefine

    Ce tutoriel se concentre sur la façon dont les chercheurs et chercheuses peuvent évaluer et agir sur l’exactitude des données.

    transforming data-manipulation 2019-04-10 2
  • James Baker

    Préserver ses données de recherche

    Cette leçon donne des pistes aux historiens et aux historiennes pour documenter, structurer et pérenniser leurs données de recherche.

    sustaining data-management 2020-01-16 1
  • Dennis Tenen et Grant Wythoff

    Rédaction durable avec Pandoc et Markdown

    Cette leçon vous apprendra les notions de base de Markdown, une syntaxe de balisage facile à lire et écrire, ainsi que Pandoc, un outil en ligne de commande qui permet de convertir du texte brut en différents types de fichiers bien formatés: PDF, .docx, HTML, LaTeX, diaporama, et plus encore.

    sustaining website data-management 2020-09-09 2
  • William J. Turkel et Adam Crymble

    Réutilisation de code et modularité

    Un programme informatique peut vite devenir un très long fichier et ainsi devenir peu commode à maintenir, notamment quand aucune stratégie n’a été mise en place afin de contrôler cette complexité. Cette leçon sera l’occasion de vous expliquer comment réutiliser des parties de votre code à l’aide de l’écriture de fonctions, mais aussi comment organiser un programme en modules, de manière à rendre celui-ci plus concis et plus facile à débugger.

    transforming python 2023-02-16 2
  • William J. Turkel et Adam Crymble

    Télécharger des pages web avec Python

    Cette leçon présente les URL et explique comment utiliser Python pour télécharger et sauvegarder le contenu d’une page Web sur votre poste de travail.

    acquiring python 2021-06-10 2
  • Chahan Vidal-Gorène

    La reconnaissance automatique d'écriture à l'épreuve des langues peu dotées

    Ce tutoriel a pour but de décrire les bonnes pratiques pour la création d’ensembles de données et la spécialisation des modèles en fonction d’un projet HTR (Handwritten Text Recognition) ou OCR (Optical Character Recognition) sur des documents qui n’utilisent pas l’alphabet latin et donc pour lesquels il n’existe pas ou très peu de données d’entraînement déjà disponibles. Le tutoriel a ainsi pour but de montrer des approches de minimal computing (ou d’investissement technique minimal) pour l’analyse de collections numériques à grande échelle pour des langues peu dotées. Notre tutoriel se concentrera sur un exemple en grec ancien, puis proposera une ouverture sur le traitement d’écritures arabes maghrébines manuscrites.

    acquiring machine-learning data-manipulation 2023-01-30 3
  • William J. Turkel et Adam Crymble

    Travailler avec des fichiers texte en Python

    Cette leçon vous explique comment manipuler des fichiers texte en Python.

    transforming python 2019-07-01 2