
Programme

Détail des formations et des sessions
Les articles, résumés et présentations ne reflètent pas la position de l’Insee et n’engagent que leurs auteurs.
Les articles du programme sont actuellement en cours d’intégration.
Masterclass : Apprentissage statistique
- Apprentissage statistique par méthodes ensemblistes à base d’arbres : introduction, algorithmes, interprétabilité et cas d’usage de la statistique publique (pdf, 99,5 Ko) : Sébastien DA VEIGA (Crest ; Ensai).
Atelier 1 (Collecte multimode) et atelier 2 (Confidentialité des données)
- Atelier 1 : concevoir et exploiter une enquête multimode : questionnements méthodologiques en amont et approches statistiques en aval (pdf, 122 Ko) : Thomas MERLY-ALPA (Insee, DSDS), Christine FLUXA et Simon QUANTIN (Insee, DMCSI) ;
- Atelier 2 : diffuser sans divulguer : l’art de partager les données confidentielles (odt, 286 Ko) : Clara BAUDRY et Julien JAMME (Insee, DMCSI).
Conférence d’ouverture : Statistique et intelligence artificielle : et si l’on remettait la décision au centre ?
- Statistique et intelligence artificielle : et si l’on remettait la décision au centre ? (pdf, 104 Ko) : Christine CHOIRAT (Office Fédéral de la statistique et université de Genève).
Session 1 : Inégalités professionnelles
Présidente de session Emilie RAYNAUD
(Insee)
- Écarts de salaire entre femmes et hommes : effets de sélection et décomposition : Benjamin PIPAUD (Insee, DIRA)
- Chaînes hiérarchiques et inégalités femmes/hommes : une analyse des flux de mobilités internes à partir de données administratives : Claire ALAIS, Mathieu CHABAUD (Insee, DEE)
- Normes de genre et inégalités professionnelles liées à la parentalité : que nous apprennent les trajectoires des immigrés.es et descendan.e.s d’immigrés.e.s : Dominique MEURS (Université Paris Nanterre), Pierre PORA (Insee)
Session 2 : Échantillonnage – partie 1
Président de session Emmanuel GROS
(Insee)
- Enquêter des établissements à partir d’un échantillon indirect : quelles implications ? Le cas de l’enquête familles et employeurs : Paul COCHET , Julie LENOIR , Amandine STEPHAN , Lou TALLANDIER (Ined, Service des enquêtes et sondages), Roméo FONTAINE , Ariane PAILHE, Delphine REMILLON (Ined, UR9 Démographie économique)
- Analyse et amélioration de la stratégie de coordination des tirages d’échantillons de la Depp : Adrien FERNANDEZ, Violette MARMION, Hugo ROGIE (Depp)
- Élaboration du plan de sondage et utilisation de données bancaires et téléphoniques dans le cadre de la nouvelle enquête sur la mesure des dépenses des voyageurs et visiteurs étrangers en France : Enzo CAMBONI, Sarita DE ALBUQUERQUE, Félix PRADELLE, François ROBIN (Banque de France)
Session 3 : Codification automatique – partie 1
Président de session Gaspard FEREY
(Insee)
- La statistique sur les causes de décès : Pierre BOULET , Elise COUDIN , Fanny GODET, Aude ROBERT (Inserm)
- Entraînement de modèles ML pour la codification à partir de petits jeux de données : Julien GUAY , Yves COLTIER (Insee)
- Changement de nomenclature statistique à l’ère du machine learning : réentraînement basé sur les LLM (Large Language Models) pour la révision de la NAF : Thomas Faria (Insee, DMCSI) , Nathan Randriamanana (Insee, DSE)
Session 4 : Protocole des enquêtes multimode
Président de session Aurélien DAUBAIRE
(Insee)
- Un panorama des enquêtes multimodes depuis 2020 en France : quels protocoles, quels modes, quels taux de réponse ? : Thomas MERLY-ALPA (Insee, DSDS)
- Harmoniser et standardiser les processus d’enquête en mettant en place la filière : Laurent BARBET (Insee, DSE), Gwennaëlle BRILHAULT, Sandra GALLIZZI (Insee, DMCSI), Thomas MERLY-ALPA (Insee, DSDS)
- Smartphone au cœur de la collecte multimode : retours d’expérience et méthodes opérationnelles pour enquêtes complexes : Jamal ACHALHI, Gaëlle DABET, Cécile DONADILLE, Zora MAZARI (Céreq, Équipe ingénierie et gestion d’enquêtes), Mohamed BEN HALIMA (La Voix du Client, Service public)
- Protocole multi-mode pour l’enquête budget de famille : plus de choix, plus de répondants ? : Claire-Lise DUBOST , Simon MOREAU (Insee, DSDS)
- Simplifier sans sacrifier : la participation équivalente entre un protocole monomode internet et un protocole multimode séquentiel téléphone-internet : Géraldine CHARRANCE , Amandine STEPHAN (Ined, Service des enquêtes et sondages)
Session 5 : Apprentissage statistique
Président de session Sébastien DA VEIGA
(Ensai)
- Améliorer le post-traitement des champs libres dans les enquêtes : évaluation d’approches de classification automatique pour les réponses textuelles courtes : Mélina HILLION (Insee, DMCSI), Ceren INAN (SMSSI)
- Statbot : chatbot statistique au deploiement automatise et propulse par VLLM : Lancelot MARTI , Jonas MORIN , Raphaël DE FONDEVILLE (Office fédéral de la statistique)
- Analyse textuelle de documents longs : cas des accords d’entreprise : Rania FAHIM , Conrad THIOUNN (Dares)
- Une nouvelle méthode statistique pour traiter les données agrégées, et son application à l’étude du report de voix entre les deux tours d’une élection : Nicolas CHOPIN (Ensae)
- Utilisation des images satellites pour améliorer le repérage des logements à Mayotte : Maëlys BERNARD (Insee, DSDS), Raya BEROVA (Insee, DMCSI) , Thomas FARIA (Insee, SSP Lab)
Session 6 : Microsimulations
Présidente de session Marine GUILLERM
(Insee)
- Réforme(s) de l’assurance maladie : quels effets redistributifs ? : Alexandre FAUCHON (Drees)
- Le modèle Prométheus de microsimulation de la facture énergétique des ménages : Alexandre GODZINSKI, Tristan LOISEL, Elise MARTIN, Mathilde NIAY , Quentin NICOD , Lucie NEIRAC, Caroline PINTON, Bruno QUILLE, Laouen RYO LE ROUX ( Crest)
- Modélisation des comportements de départ à la retraite des fonctionnaires d’état : Julie BELPAUME , Marine EMORINE, Maëlle FONTAINE (Service des Retraites de l’État)
- Évaluer l’effet des réformes socio-fiscales concernant les étudiants selon le niveau de vie de leurs parents : Camille DUFOUR (Insee, DSDS), Litti ESTEBAN , Benjamin MARTEAU , Lauriane RAMUZAT (Drees)
- Estimation de distribution de salaire horaire par Kernel Matching et implémentation de variation de salaire minimum dans un modèle de micro-simulation socio-fiscal : Audin Roger (Drees, Université Paris 1)
- Micro‐simulation des départs en retraite des enseignants des universités : modélisation des comportements puis projections au‐delà de 2025 : Titouan LAURENT (SDES), Louis MEURIC (SIES)
- Les départs en retraite des enseignants des universités : estimations des comportements et projections : Louis MEURIC (Sies), Titouan LAURENT (Ensai)
Session 7 : Détection et correction des effets de mode – partie 1
Président de session Patrick SILLARD
(ENSG)
- Estimer un effet de mesure en présence de non-réponse non ignorable : une approche économétrique avec un proto : Simon QUANTIN , Loreline COURT (Insee, DMCSI)
- Une étude de l’effet du mode de collecte dans l’enquête de recensement de la population suisse : Lionel Qualité (Office fédéral de la statistique)
- Détection et analyse des effets de mesure dans l’enquête vécu et ressenti en matière de sécurité (VRS) : application à l’enquête thématique 2023 santé et victimation : Danaé ODIN-STEINER (SSMSI)
- Effets de mode et agrégation des données : approches méthodologiques appliquées a l’enquête ERFI 2 : Guillaume CARETTE (Ined)
Session 8 : Diffusion des données
Président de session Nicolas SAGNES
(Insee)
- Créer un fichier de production et de recherche conforme aux consignes du RGPD : les errements de la pratique : Laurent TOULEMON, Milan BOUCHET-VALAT, Szilvia LESTYÁN (Ined), Julie BARON, Julie LENOIR (Inria)
- La fabrique des fichiers de production et de recherche a l’Ined : Julie LENOIR , Julie BARON (Ined)
- Le format parquet pour la diffusion de données: un choix technique au service des utilisateurs : Lino Galiana (Insee, DMCSI), Cédric Bobinec (Insee, Pôle ODL)
- Anonymisation des données diffusées en open data par le CEPIDC ou comment déplacer des cercueils: Fanny GODET , Yann AUBINEAU (Inserm)
Session 9 : Comptabilité Nationale et modèles économiques
Présidente de session Marie LECLAIR
(Insee)
- Comptes nationaux distribués : méthode, perspectives et prolongements : Mathias ANDRÉ, Thomas RENAUD, Sébastien ROUX (Insee, Dese)
- Mesure de l’empreinte carbone de la France de 1990 à 2024 : Sylvain LARRIEU (Insee, Dese), Manuel BAUDE (SDES)
- Le partage volume-prix des services non-marchands : le cas de l’éducation : Jérémy FOULIARD , Mats LE FLOCH , Pauline MENDRAS (Insee, Dese)
- Produire les comptes de la santé avec les données du système national des données de santé : Vincent REDURON, Clément DELECOURT (Drees)
- Luxury for All: A Macroeconomic Theory of Public Provision : Charles Labrousse (Insee), Yann Perdereau (Paris School of Economics)
Session 10 : Détection et correction des erreurs – partie 1
Présidente de session Catherine VERMANDELE
(Université Libre de Bruxelles)
- La statistique a-t-elle tout compris ? Une expérimentation de la mesure du temps de travail : Mikael BEATRIZ , Louis-Alexandre ERB (Dares)
- What’s wrong with survey-based top wealth shares? evidence from housing wealth of french households : Olivier MESLIN (Insee, DMCSI)
- Biais liés à l’ordre des modalités de réponse sur une liste de techniques médicales : enseignements et réflexions à partir d’une enquête sur l’assistance médicale à la procréation (AMP) : Alba MAIQUES , Élisabeth MORAND , Virginie ROZÉE (Ined), Élise DE LA ROCHEBROCHARD (Ined; Inserm)
- Les tests utilisateurs : un outil indispensable pour la conception des instruments de collecte : Christine FLUXA (Insee)
Session 11 : Evaluation d’impact
Présidente de session Pauline GIVORD
(Insee)
- L’effet des augmentations de prix du tabac sur les ventes, les recettes fiscales et les revenus des buralistes en France : Mélina HILLION (Insee, DMCSI)
- La méthode des contrôles synthétiques avec données désagrégées, le cas de l’incidence économique des transports urbains : Jean LAVALLEE (École normale supérieure Paris-Saclay)
- Impact de la mise en place de tests cystite sur la délivrance d’antibiotiques en pharmacie : Pierre-Louis BITHOREL , Odran BONNET (DREES)
- Imputations de la non-réponse dans le cadre de séries temporelles : analyse comparative de différentes méthodes de forecasting / nowcasting : Léa CHABANON, Reinaldo DOS SANTOS (DGDDI)
Session 12 : Estimation et calcul de précision
- Président de session Vincent LOONIS
(Insee) - Estimations de parts modales des déplacements à l’échelle territoriale : David LEMARCHAND (Insee, Direction régionale Centre-Val de Loire)
- Comparaison de différents scénarios de calage pour l’enquête SRCV : Robin Chatelot , Maxime Bergeat (Insee, DSDS)
- Estimation de la précision dans l’enquête formation tout au long de la vie à Mayotte par utilisation du package Gustave : Romain LOISEAU , Joachim TIMOTÉO (Insee, Direction interrégionale de La Réunion-Mayotte)
Session de présentations rapides 1
Président de session Pascal ARDILLY
(Insee)
- Le ménage : comment passer du concept statistique à sa définition opérationnelle ? : Hélène CHAPUT (INSEE, DMCSI), Thomas MERLY-ALPA (Insee, DSDS)
- Le protocole multimode séquentiel de l’enquête logement 2023-2024 : retour d’expérience : Camille DUFOUR, Aurélie GOIN (Insee, DSDS)
- Une application smartphone pour l’enquête budget de famille : valider un nouvel outil de collecte par des tests d’utilisabilité : Simon MOREAU(Insee, DSDS), Julia DIRAND, Christine FLUXA(Insee, DMCSI)
- Analyse de l’évolution d’un panel probabiliste : retour sur une deveniez du dispositif « étude longitudinale par internet pour les sciences sociales » (ELIPSS) : Blazej PALAT, Alexia RICARD (Centre de Données Socio-Politiques)
- L’enquête urgences : une collecte de 24 h en immersion dans tous les services des urgences de France, par les personnels eux-mêmes : Elvire DEMOLY, Bénédicte BOISGUERIN (Drees), Carla BIANCHI (La Provence), Fabien TOUTLEMONDE (Insee, DSDS)
- Enquête sur les candidats aux concours de la fonction publique : enrichissement de données administratives par des données d’enquête : Dimitri LEMAIRE, Gabrielle REDON (DGAFP)
- Utilisation d’une application GPS pour mesurer la mobilité des personnes : enjeux et mise en œuvre d’une première expérimentation sur l’agglomération toulousaine : Barbara CHRISTIAN, Fabrice HASIAK, Maria TEBAR(Cerema), Jimmy ARMOOGUM(UGE-Ifsttar)
- Les trajectoires budgétaires des communes nouvelles : comparaison avec leurs « proches voisines » : Benoit de LAPASSE, Julien DESCLODURE (DGSL)
- Construction d’échantillons équilibrés avec remise : Jean RUBIN (Insee, DEE ; Ensai), Guillaume CHAUVET (Ensai)
- 10 ans d’utilisation du catalogue Quetelet-Progedo : Frédérique GROS, Nicolas SAUGER, Erik ZOLOTOUKHINE (CNRS)
- La commission des sondages, gardien du temple des sondages électoraux en France : Marc CHRISTINE (Insee), Sarah TAYLOR (Université Paris 1 Panthéon-Sorbonne)
Session 13 : Conférence spéciale 1
Président de session Olivier LEFEBVRE
(Insee)
- Collecter et diffuser des données sensibles : questions et exemples : Olivier LEFEBVRE , Kévin MILIN (Insee), Eric RANCOURT (Statistique Canada) , Albane GOURDOL (Ined), Samuel GIVOIS (SSMSI)
Session 14 : Séries temporelles
Présidente de session Ketty ATTAL
(DGDDI)
- Détection d’anomalies dans des séries chronologiques et mise en œuvre en R : Jean PALATE (Retraité de la Banque Nationale de Belgique)
- Algorithmes de désaisonnalisation de données journalières : une comparaison empirique : Anna SMYK, Tanguy BARTHELEMY (Insee, DMCSI)
- Et si l’on publait la tendance-cycle ? : Alain QUARTIER-LA-TENTE (DGFiP)
- Ajustement saisonnier et thermosensibilité des consommations d’énergie : Marie BRUGUET (LEDa; SDES), Arthur THOMAS (LEDa), Ronan LE SAOUT (Université Rennes; Ensai; Crest)
- Méthodes de nowcasting pour la production de statistiques officielles : tour d’horizon des outils disponibles dans Jdemetra+ : Corentin LEMASSON (Banque nationale de Belgique)
- Imputations de la non-réponse dans le cadre de séries temporelles : analyse comparative de différentes méthodes de forecasting / nowcasting : Léa CHABANON, Reinaldo DOS SANTOS (DGDDI)
Session 15 : Inventaire forestier
Président de session Yves TILLE
(Université de Neuchâtel)
- Estimateurs de régression généralisés pour les plans d’échantillonnage continus avec des données auxiliaires exhaustives : Radim ADOLT (Institut tchèque de gestion forestière), Guillaume CHAUVET ( IRMAR-UMR 6625), Olivier BOURIAUD (Université Stefan cel Mare, Roumanie), Minna PULKKINEN (Laboratoire d’inventaire forestier)
- A new sampling framework for spatial survey: two-stage two-phase sampling : rinh H.K. DUONG (Laboratoire d’Inventaire Forestier), Olivier BOURIAUD (University of Suceava Roumanie), Guillaume CHAUVET (ENSAI)
- Propriétés asymptotiques pour des plans de sondage en population continue avec application à des enquêtes environnementales : Guillaume CHAUVET (Université Rennes; Ensai; CNRS), Minna Pulkkinen (IGN)
- Lien entre sondages spatiaux à partir de placettes et processus ponctuels : Philippe BRION (IRMAR)
Session 16 : Informatique pour la statistique
Président de session Martin CHEVALIER
(Insee)
- Lost in translation : quels langages pour la statistique et la datascience : Pierre LAMARCHE (Insee, DSI), Romain LESUR (Insee, DMCSI)
- Mettre les technologies cloud au service de la production statistique : Romain AVOUAC (Insee, DSDS), Thomas FARIA (Insee, DMCSI), Frédéric COMTE (Insee, DSI)
- La reproductibilité au service de la recherche et de la mise en production de projets statistiques : où en sommes-nous ? où allons-nous ? : Lino GALIANA (Insee, DMCSI), Romain AVOUAC (Insee, DSDS)
- Automatisation de la production des infos rapides justice à la charte graphique du SSER au format PDF à l’aide d’un outil combinant Rmarkdown et Pagedown : Fanny ALLARD, Adam MARSAL (Ministère de la Justice)
Session 17 : Limiter la non-réponse dans les enquêtes
Présidente de session Dominique FRANCOZ
(Insee)
- Comment concilier confiance des enquêtés et recueil d’informations identifiantes : le problème de csnisation des données collectées par enquête : Christine FLUXA, Sandrine PENANT (Insee, DMCSI)
- Mesurer l’effet des relances dans un protocole internet : une analyse quasi-expérimentale à partir de l’enquête familles 2025 : Pierre PORA (Insee, DSDS)
- Quel meilleur système d’incentive en 2025 ? élements de preuve à partir de l’enquête européenne share : Thomas RENAUD (Université Paris Dauphine), Clément COLLIN, Yves FRADIER (Verian)
Session 18 : Indicateurs statistiques
Président de session Nicolas CHOPIN
(Ensae)
- Classification sur distance de Wasserstein de distributions quantiles de coûts spécifiques de production agricole : Dominique DESBOIS (UMR Paris Saclay)
- Décomposition de l’indice d’entropie normalisée pour l’étude de la ségrégation : (Insee, Dese)
- Estimer l’indice de Herfindahl-Hirschman à partir de données agrégées : méthode, propriétés statistiques et exemple d’application : Laurent PIET, Joanne JEGOU (INRAE)
Session 19 : Intégration de données – partie 1
Président de session Olivier HAAG
(Insee)
- Statistiques basées sur des données administratives : quelques principes généraux : Heidi KOUMARIANOS (Insee, DSDS), Pascal RIVIÈRE (Insee, IG)
- Mise en œuvre des sources conjoncturelles pour un suivi de l’emploi des établissements industriels dans les territoires : Laurette CRETIN, Hervé BACHERE (Insee, Direction régionale Occitanie)
- Combiner une nouvelle source administrative avec l’ERFS pour étudier le caractère redistributif d’une prestation : Inès RAMAHANDRY , Nicolas PALIOD (Drees)
Session 20 : Risque environnemental
Présidente de session Béatrice MICHALLAND
(Sdes)
- Construction d’une base de données sur les émissions carbone et pollutions atmosphériques des entreprises : Raphaël LAFROGNE-JOUSSIER , Mats LE FLOCH , Pauline MENDRAS ,Corentin TREVIEN (Insee, Dese)
- Assesing the impact of agricultural practices on water biodiversity : Inès Moutachaker, Felipe Penafiel (Insee)
- Exposure of households and their property assets to present and future climate hazards in france: a multi-risk study : André MATHIAS, Inès MOUTACHAKER, Sacha NASS, Julie SIXOU (Insee, DESE)
- Algorithmes d’affectation d’un échantillon de logements entre différents enquêteurs : Marc CHRISTINE (Insee), Louise DE FERRAN, Rémi BARRAUD, Paul BOISSEAU, Luigi ROMAIN, Dorian TESSIER (Mines Paris-PSL)
Session 21 : Enquêtes auprès de populations particulières
Présidente de session Géraldine CHARRANCE
(Ined)
- L’enquête santé de la PJJ : avancer malgré les embûches :Yves FRADIER , Clément COLLIN, Claire DARRIGADE (Verian), Pierrine ALY (CCMSA), Lorenn CONTINI (OFDT), Catherine EMBERSIN-KYPRIANOU (ORS Île-de-France)
- Enquêter des populations « fragiles » dans un environnement particulier. retour d’expérience de l’enquête autonomie de la Drees : Nadège COUVERT , Marie REY, Louise MBAYE (Drees), Marine NOUCHI , Valérie BLINEAU , Christophe DAVID , Louise MBAYE , Audrey-Rose SCHNEIDER (Ipsos)
- Échantillonnage de l’enquête sans domicile 2025 : Olivier GUIN (Drees), Emmanuel GROS , Julien NICOLAS (Insee, DMCSI)
- Voice of Ukraine : de l’enquête en ligne a un échange direct : Yves FRADIER, Oriane DARRES (Verian)
Session 22 : Détection et correction des effets de mode – partie 2
Présidente de session Gwennaëlle BRILHAULT
(Insee)
- Est-il pertinent d’estimer un effet de mesure par appariement d’enquêtés sous des modes de collecte différents ? : Simon QUANTIN , Loreline COURT (Insee, DMCSI)
- La correction des effets de collecte : l’enquête sur la justice en France : Mathieu BRUNEL, Arthur LEPAN (SSM Justice)
- Évaluation de l’existence et de l’impact d’effets de mesure dans une enquête multimode : le cas du baromètre de santé publique France : Axelle QUIVIGER, Noémie SOULLIER, Jean-Baptiste RICHARD, Leïla SABONI, Maria EL-HADDAD (Santé Publique France)
- Des conditions de travail sensibles aux effets de mode ? estimation à partir de l’enquête Tracov2 : Mikael BEATRIZ (DEPP), Louis ERB, Aude LAPINTE (Dares)
Session 23 : Statistique spatiale
Président de session Olivier MESLIN
(Insee)
- Méthode d’estimation de l’accès aux aménités environnementales en milieu urbain : Solène COLIN (Insee, DDAR), Isabelle DELHOMME, Christelle MANCEAU (Insee, Direction régionale Pays de la Loire), Marlène KRASZEWSKI (Commissariat général au développement durable)
- Suivi de la fragmentation des milieux naturels terrestres en France depuis 1990 : Anthony COULMIN, Irénée JOASSARD (MTEBNICN; CGDD; SDES)
- Utilisation des données fiscales pour identifier des quartiers pauvres et des quartiers aisés en milieu urbain : Kim ANTUNEZ (Insee, DSDS), Alexandre DAMPERON (Insee, DDAR)
- Typologie du développement durable territorial au Maroc analyse multivariée : Zouhair LAHRIZI (Haut Commissariat au Plan Maroc)
- Algorithmes d’affectation d’un échantillon de logements entre différents enquêteurs : Marc CHRISTINE (Insee),Louise DE FERRAN, Rémi BARRAUD, Paul BOISSEAU, Luigi ROMAIN, Dorian TESSIER (Mines Paris-PSL)
Session 24 : Correction de la non-réponse
Président de session Simon QUANTIN
(Insee)
- Correction de la non-réponse dans un contexte multimode séquentiel: test de différentes méthodes par simulation : Aurélien BROUILLAUD , Khaled LARBI , Emmanuel GROS (Insee, DMCSI), Olivier GUIN (Drees)
- Combinaison et correction de la non-réponse d’un échantillon multimode et monomode : Khaled LARBI (Insee; DMCSI)
- Correction de la non-réponse totale dans l’ENL 2023-2024, collectée selon un protocole multimode : Flore CORNUET , Camille DUFOUR (Insee, DSDS)
- Évaluation du préjudice dû aux escroqueries et aux fraudes aux moyens de paiement : Laurent DUVERNET (Insee: DMCSI; SMSSI)
- Taux de réponse et mécanisme de réponse : application aux deux dernières enquêtes globales de transport : Jimmy ARMOOGUM, Cédric GARCIA (AME; MODIS), Barbara CHRISTIAN, Fabrice HASIAK (Céréma), Mathieu JOYAU, Simon LE CORGNE,Marie ARBOUET (Île-de-France mobilité)
Session 25 : Autour de Résil
Président de session Olivier LEFEBVRE
(Insee)
- La production de l’univers de référence Résil : de l’alimentation du répertoire à la mise en œuvre d’un modèle de signes de vie : Romain AVOUAC, Aurélien LAVERGNE (Insee, DSDS)
- Processus d’identification des individus pour Résil : Manon EVAIN (Insee, Direction régionale Bretagne), Julien PRAMIL (Insee, DMCSI)
- Identification du champ des individus en communautés dans les données administratives via l’analyse spatiale : Nicolas ANDREANI (Insee, DSDS)
Session 26 : Échantillonnage – partie 2
Président de session Jean-Pierre RENFER
(OFS)
- Un programme R d’allocation à objectifs multiples utilisant l’optimisation convexe, application aux enquêtes entreprises : Raphaël Jauslin , Lionel Qualité , Clément Chevalier (Office fédéral de la statistique)
- Plan de sondage de l’enquête associations : un cas d’usage de l’algorithme de Bethel pour concilier plusieurs variables d’intérêt : Vincent BONNEFOY (Insee, DR Pays de la Loire)
- Existence et applications d’échantillons de population finie exactement équilibrés : Yves TILLÉ (Université de Neuchâtel, Suisse), Louis-Paul RIVEST (Université Laval, Canada)
Session 27 : Confidentialité – partie 1
Président de session Laurent BROCHET
(Insee)
- Lomas : une plateforme pour l’analyse confidentielle de données : Damien AYMON , Dan-Thuy LAM , Lancelot MARTI , Pauline MAURY-LARIBIÈRE , Christine CHOIRAT , Raphaël DE FONDEVILLE (Office Fédéral de la Statistique)
- Tabular data protection with the R-package GaussSuppression: from algorithm to application : Øyvind LANGSRUD (Statistics Norway)
- Analyse automatique des métadonnées pour la protection des données tabulées : Clara BAUDRY (Insee, DMCSI)
- Floutage de données respectant des contraintes de calage sur des totaux, moyennes ou distribution : Marc CHRISTINE (Insee)
Session de présentations rapides 2
Président de session Marc CHRISTINE
(Ancien Insee)
- Imputation des lieux de commission des infractions dans les bases statistiques de la délinquance : Fanny SIMOES, Antonin BRIAND (SSMSI)
- Fidelipro : estimation et valorisation des sociétés détenues par des personnes physiques parmi les résidents fiscaux français : Aurélie CASAROTTI, Aliette CHEPTITSKI(Insee, DSDS), Alice FOUCHER, Elise DION, Gabrielle SAGOT(Insee, DESE)
- Utilisation de l’intelligence artificielle générative pour la construction d’indicateurs : l’exemple du recours a l’activité partielle pour catastrophes naturelles : Oana CALAVREZO, Stéphanie TERRASSE, Kim NOEL (Unédic)
- Extraction automatique des quantités de stupéfiants, dans les résumés de procédure enregistrés par les forces de sécurité intérieure, à l’aide de modèles légers : Mathias ROBERT (SMSSI)
- Identifier et classer les causes de décès en automatisant le traitement des certificats en langage naturel : Aude ROBERT, Elisa ZAMBETTA, Niri RAZAKAMANANA, Elise COUDIN (Inserm)
- Biais algorithmique : Yara ABU AWAD, Christine CHOIRAT (Office fédéral de la statistique Suisse)
- Combiner clustering hiérarchique et spectral pour la détection d’anomalies dans des graphes : application aux réseaux sociaux : Sophie PERRIN (ERIC ; LIRIS), Cyril PEROSINO (LIRIS ; Alberture), Stephane CHRETIEN (ERIC), Hamida SEBA (LIRIS)
- Machine learning pour extraire des données de textes non structurés : une application aux annonces de restructurations d’entreprises publiées au Bodacc : Sébastien BIJU-DUVAL (Insee, DSE)
- Comparaison des performances financières des PME dromiennes et hexagonales à l’aide de la méthode de propensity score matching : Maurice BILIONIERE, Philippe CLARENC, Zinaïda SALIBEKYAN-ROSAIN ( Insee, Direction interrégionale Antilles-Guyane)
- Modélisation de la délinquance enregistrée à l’échelle communale : Kevin MILIN (Insee, DDAR)
- La prise en compte du climat dans les comptes nationaux : Sylvain Larrieu, Sébastien Roux (Insee, DESE)
- Geography versus income: the heterogeneous effects of carbon taxation : Charles LABROUSSE (Insee, DESE ; Paris School of Economics), Yann PERDEREAU (Paris School of Economics)
- Plus vite, plus frais, plus fin : l’analyse de la délinquance pendant les JOP : Brice EDAN, Brandon SAINTILAN, Gwennaël SOLARD (SSMSI)
Session 28 : Conférence spéciale 2
Président de session Éric LESAGE
(Insee)
- Non-réponse et sélection non aléatoire : peut-on maintenir la production d’estimations valides : Eric RANCOURT (Statistique Canada)
Session 29 : Confidentialité – partie 2
Président de session Vianney COSTEMALLE
(Drees)
- Du suppressif au perturbatif, comment paramétrer les méthodes de bruitage ? une première démarche utilisant la méthode des clés aléatoires : Julien JAMME (Insee, DMCSI)
- Générer un jeu de données synthétiques: comparaison de méthodes au regard de l’arbitrage risque – utilité : Julien JAMME (Insee, DMCSI), Julien HELFENSTEIN (Université Paris-Scalay)
- Sondages et confidentialité différentielle : Daniel BONNÉRY (Insee, DMCSI; Crest; Ensae), Julien JAMME , Frédéric MINODIER (Insee; DMCSI)
Session 30 : Intégration de données – partie 2
Présidente de session Heïdi KOUMARIANOS
(Insee)
- Appariement du recensement et des déclarations fiscales ; le salaire des frontaliers au Luxembourg : Lionel VIGLINO (Insee, DDAR), Grégory HAMEZ (Université de Lorraine)
- Comparaison des bases de données Teruti et OCS-GE pour l’occupation du sol : Antoine LESAUVAGEe (Ministère de l’Agriculture et la Souveraineté Alimentaire)
- Méthodologie d’appariement entre les données administratives des forces de sécurité intérieure et de la justice : Antonin BRIAND , Nicolas CLAUDE , Laurianne SALEMBIER (SMSSI), Malik KOUBI , Yara MAKDESSI , Nicolas RAZAFINDRATSIMA (SSER)
Session 31 : Population, plan de sondage
Présidente de session Pascale BREUIL
(Insee)
- Comment choisir entre échantillonner des logements ou des individus dans un contexte multimode ? : Hélène CHAPUT, Emmanuel GROS (Insee, DMCSI), Thomas MERLY-ALPA (Insee, DSDS)
- Construire une population statistique sur mesure : un cas pratique : Guillaume CHANTELOUP (Sies)
- Pratiques culturales en arboriculture et viticulture 2024 ou comment concilier des enquêtés tees différentes : Michael LEVI-VALENSIN, Damien BABET (Ministère de l’Agriculture)
- Méthodologie de constitution d’une base de sondage : gestion des hors-champ dans les enquêtes du Cereq et impacts sur les coûts : Emilie GAUBERT, Quentin NICOD, Juliette PONCEAU (Céreq)
Session 32 : Détection et correction des erreurs – partie 2
Président de session Fabien GUGGEMOS
(Dares)
- Redressement des heures travaillées dans les déclarations sociales nominatives : Clotilde NIETGE (Dares)
- Détection des répondants suspects dans une enquêté en ligne : Diane MAILLOT TCHOFO, Fabienne LE SAGER , Louis MAREC (Médiamétrie), Tom DEVYNCK (Médiamétrie; Toulouse School of Economics)
- Application de coefficients correctifs sur les données du commerce extérieur : modélisation des révisions des déclarations faites par les entreprises interrogées : Stéphanie BONESCHI (DGDDI)
- Identification de doublons dans une base de données administrative volumineuse : Sébastien LI-THIAO-TÉ (Dares)
Session 33 : Codification automatique – partie 2
Présidente de session Mélina HILLION
(Insee)
- Recoder du texte libre dans les enquêtes à partir de modèles LLM plus frugaux, ouverts et hébergés localement : application à l’enquête urgences : Milena Suarez Castillo, Elvire Demoly (Drees)
- Mise en place d’un nouveau service (ophidien) de codification à l’Insee : Yves COLTIER, Julien GUAY (Insee, DMCSI)
- Fasttext, tout juste en production et déjà obsolète ? défis et enjeux de la modernisation de la codification automatique via l’exemple de l’APE : Meilame TAYEBJEE (Insee, DMCSI), Cédric COURALET (Insee, DMCSI), Julien PRAMIL (Insee, DMCSI), Nathan RANDRIAMANANA (Insee, DSE)
Session de clôture (table ronde) : Maintenir la confiance des utilisateurs des données de statistique publique
Animatrice Céline ZANA ROUQUETTE
(Insee)
- Table ronde : maintenir la confiance des utilisateurs des données de statistique publique : quels enjeux autour des méthodes ? (pdf, 101 Ko) : Bertrand DU MARAIS (Président du Cnis, Conseiller d’État), Maylis COUPET (Directrice de l’Ensae), Frédérique LETUÉ (Présidente du groupe « Enseignement de la statistique » à la SFDS ; Maître de conférence à l’Université de Grenoble), Jean-Marc BÉGUIN (Inspecteur général de l’Insee honoraire, ancien Directeur des statistiques d’entreprises à l’Insee), Jean-Marc VITTORI (Éditorialiste aux « Échos »).
- Diaporama de la session de clôture (pdf, 1 Mo)