OSINT & IA Literacy — Référentiel (3 niveaux)OSINT & AI Literacy — Framework (3 levels)

Structure inspirée d’OSINT Literacy (7 domaines). Niveaux : N1 AwarenessN2 Usage pragmatique / ManagementN3 Knowledge / Création & adaptation d’outils.Structure inspired by OSINT Literacy (7 domains). Levels: L1 AwarenessL2 Pragmatic use / ManagementL3 Knowledge / Tool creation & adaptation.

🔎1) Collecte & RechercheGathering & Search
N1 / L1 — Awareness AwarenessAwareness
  • Requêtes avancéesAdvanced queriesOpérateurs (Operators ( site:, filetype:, "phrase", OR, -term) · filtres temporelstime filters. OSINT↗
  • Cartographie des sourcesSource mappingRegistres publics, archivesPublic registers, archives, social/web. Wayback↗
ExemplesExamples
  • Cibler un PDF réglementaire :Target a regulatory PDF: site:.gouv.fr filetype:pdf
N2 / L2 — Usage pragmatiquePragmatic use
  • RSS/API + archivagearchiving — Wayback, archive.today (URL, date, hash). RSS↗
  • Compliance‑by‑design — RGPD/TOS/robots.txt.
N3 / L3 — KnowledgeKnowledge
  • Scraping robusteRobust scraping — backoff, rotation IP, CAPTCHA; logs. Scraping↗
  • Datasets — datasheets, provenance, anonymisation.
Cas d’école / ExemplesCase studies / Examples
  • Recherche réglementaire cibléeopérateurs avancés pour trouver un PDF administratif et versionner l’archive (Wayback/Archive.today).advanced operators to find a gov PDF and version the capture (Wayback/Archive.today).
  • Veille multi‑sourcesflux RSS sur comptes officiels + chaînes YouTube d’institutions; archivage quotidien avec horodatage et hash.RSS from official accounts + institutional YouTube; daily archiving with timestamps and hashes.
  • Scraping respectueuxannuaire public paginé avec délais, rotation d’IP et journal d’exécution.public registry with polite delays, IP rotation and run logs.
🧪2) Vérification & AuthentificationVerification & Authentication
N1 / L1 — Awareness Awareness
  • Vérifs manuellesManual checks — reverse image, EXIF EXIF↗, météo/ombres, géoloc.
  • Indices vs preuves — journal des incertitudes.
N2 / L2 — Pragmatic use
  • Protocoles anti‑erreur — peer‑review, reproduction, avis contradictoire.
  • Tests détecteurs IA — compression/recadrage/bruit (FP/FN).
N3 / L3 — Knowledge
  • Provenance & phash/dhash — seuils, collisions.
  • Banque de cas — cas réels/synthétiques.
Cas d’école / ExemplesCase studies / Examples
  • Vérif vidéo localeInVID pour extraire miniatures, météo historique pour vérifier l’ombre; comparaison avec Street View.InVID to extract thumbnails, historical weather for shadow checks; cross‑check with Street View.
  • Détecteur d’images IAtests compression/recadrage suivant la méthodologie Bellingcat; FP/FN consignés.compression/cropping tests per Bellingcat methodology; FP/FN logged.
  • pHash/dHashsuivi de variantes réutilisées d’une même image sur différentes plateformes.tracking re‑used variants of the same image across platforms.
📊3) Analyse & SynthèseAnalysis & Synthesis
N1 / L1 — Awareness Awareness
  • Chronologies & cartes — timelines; cartes simples.
  • Biais & hypothèses — limites explicites.
N2 / L2 — Pragmatic use
  • Cartographie relationnelle — graph sourcé.
  • LLM comme aide — résumés avec vérif humaine.
N3 / L3 — Knowledge
  • Notebooks reproductibles — hash, env. figé.
  • Vision & 3D — photogrammétrie .
Cas d’école / ExemplesCase studies / Examples
  • Timeline d’événementsreconstitution d’une journée à partir de posts publics (horodatage, fuseaux, sources citables).rebuild a day from public posts (timestamps, time zones, citable sources).
  • Graphe de comptescartographier des interactions entre comptes X/Twitter en distinguant relation assertée/suggérée.map interactions across X/Twitter accounts; distinguish asserted vs suggested ties.
  • Notebook reproductiblemesurer l’évolution d’un hashtag; données figées, environnement épinglé.track a hashtag’s evolution; frozen data, pinned environment.
🤖4) IA Literacy & Médias synthétiquesSynthetic Media
N1 / L1 — Awareness Awareness
  • Familles de modèles — LLM, diffusion, vision, TTS; limites.
  • Indices de médias synthétiques — incohérences physiques.
N2 / L2 — Pragmatic use
  • Pipelines contrôlés — humain‑dans‑la‑boucle, traçabilité.
  • Évaluer détecteurs — bancs de tests.
N3 / L3 — Knowledge
  • Adapter/entraîner — NER/OCR/VLM; jeux synthétiques.
  • Provenance & filigranes — chaîne de transformation.
Cas d’école / ExemplesCase studies / Examples
  • Pipeline résumé→revueLLM propose une synthèse de 50 posts, relecture humaine avec citations et corrections.LLM drafts a summary of 50 posts, human review adds citations and fixes.
  • Évaluation de détecteursbanc de 30 images (réelles/synthétiques), variantes compressées, rapport FP/FN.30‑image bench (real/synthetic), compressed variants, FP/FN report.
  • Triple Chaser (FA)données synthétiques pour entraîner un détecteur d’objets; documentation de la provenance.synthetic data to train an object detector; documented provenance.
🛡️5) Éthique, Légalité & OPSECEthics, Legality & OPSEC
N1 / L1 — Awareness Awareness
  • Hygiène numérique — VPN, navigateurs durcis.
  • Bases juridiques — RGPD, droit d’auteur, TOS.
N2 / L2 — Pragmatic use
  • Évaluation des risques — matrice + mesures.
  • Anonymisation & minimisation — rétention limitée.
N3 / L3 — Knowledge
  • Politiques internes — IA/données/publication responsable.
  • OPSEC avancée — threat modeling, exercices.
Cas d’école / ExemplesCase studies / Examples
  • DPIA simplifiéeévaluation d’un petit scraping (base légale, minimisation, rétention, TOS/robots).lightweight DPIA for small scraping (legal basis, minimization, retention, TOS/robots).
  • OPSEC enquêteprofils navigateurs séparés, VPN, compartimentation d’identités.separate browser profiles, VPN, identity compartments.
  • Politique IA internerègles de prompts, données sensibles, journal de transformation.prompt rules, sensitive‑data handling, transformation logs.
🗂️6) Gouvernance & ManagementGovernance & Management
N1 / L1 — Awareness Awareness
  • Cycle d’enquête — étapes, rôles, jalons.
  • Boîte à outils — panorama, coûts, limites.
N2 / L2 — Pragmatic use
  • Playbooks & SOP — nommage, hash, timestamps.
  • Pilotage qualité — précision/rappel, FP/FN.
N3 / L3 — Knowledge
  • Veille & benchmark — critères publics.
  • Formation & diffusion — plan de montée en compétences.
Cas d’école / ExemplesCase studies / Examples
  • SOP vidéoschéma de nommage, capture d’écran + hash + EXIF, log d’acquisition.file‑naming, screenshot + hash + EXIF, acquisition log.
  • Tableau de bord qualitémétriques pour un module (précision/rappel), seuils et revue trimestrielle.metrics for a module (precision/recall), thresholds and quarterly review.
  • Benchmark outilscomparatif trimestriel avec critères publics et décisions tracées.quarterly tool comparison with public criteria and tracked decisions.
📝7) Publication & CollaborationPublication & Collaboration
N1 / L1 — Awareness Awareness
  • Rédaction sourcée — limites explicites; archives.
  • Collaboration — versions; peer‑review.
N2 / L2 — Pragmatic use
  • Gabarits & annexes probatoires — EXIF, hash, journaux.
  • Publication web accessible — HTML statique; a11y.
N3 / L3 — Knowledge
  • Visualisations avancées — timelines interactives, 3D.
  • Pérennisation & open archives — packs de diffusion.
Cas d’école / ExemplesCase studies / Examples
  • Rapport 1 page + annexesliens d’archives, captures, hash; section limites et degré de confiance.archive links, captures, hashes; limits and confidence statement.
  • Mini‑site d’enquêteHTML statique imprimable, accessibilité de base; version PDF jointe.print‑friendly static HTML with basic a11y; attached PDF version.
  • Pack de diffusionZIP avec sources, READMEs, checksum; dépôt ouvert/DOI.ZIP with sources, READMEs, checksums; open repo/DOI.
LexiqueGlossary

Survolez les termes ⓘ (infobulles). Recherchez ci‑dessous.Hover ⓘ terms (tooltips). Use the search below.

Accessibilité (a11y)
Pratiques d’accessibilité web de base. / Basic web accessibility practices.
Annexes probatoires
Captures/EXIF/hash/journaux qui étayent. / Attachments substantiating findings.
Anonymisation / Minimisation
Réduire les données personnelles au nécessaire. / Reduce personal data to the minimum.
Archive web
Captures datées de pages (permalink). / Timestamped web snapshots.
Biais de confirmation
Privilégier les infos qui confirment. / Favoring confirming evidence.
Cartographie relationnelle
Graphe d’entités et de liens sourcés. / Sourced entity–relationship graph.
Chaîne de provenance
Trace des transformations. / Transformation trace.
Checklist / SOP
Procédure standard réplicable. / Repeatable procedure.
Confidence score
Niveau d’assurance d’une conclusion. / Certainty level.
Datasheet
Fiche de dataset (provenance, licence, limites). / Dataset documentation.
Données synthétiques
Données artificielles pour entraîner/tester. / Artificial training/testing data.
DPIA
Analyse d’impact vie privée. / Privacy impact assessment.
EXIF
Métadonnées image (appareil/date/GPS). / Image metadata.
FP / FN
Faux positif / Faux négatif. / False positive / False negative.
Filigrane
Marque d’origine/modif. / Origin/edit signal.
Géolocalisation
Déduire un lieu par indices. / Infer location by clues.
Hash
Empreinte d’intégrité cryptographique. / Cryptographic checksum.
Horodatage
Enregistrement fiable de date/heure. / Reliable timestamp.
Human‑in‑the‑loop
Revue humaine dans le pipeline. / Human review step.
Hypothèse / Journal
Pistes et alternatives suivies. / Tracked hypotheses.
LLM
Modèle de langage génératif. / Large language model.
Modèle de diffusion
Génération par débruitage. / Denoising generation.
NER / OCR / VLM
Entités nommées / Reconnaissance texte / Vision‑langage. / Named entities / OCR / Vision‑language.
OPSEC
Sécurité opérationnelle. / Operational security.
Orthophoto
Image aérienne métrique redressée. / Geometrically corrected aerial.
Pareidolie
Voir des motifs inexistants. / Seeing nonexistent patterns.
Photogrammétrie
Reconstruction 3D depuis 2D. / 3D from multiple 2D images.
pHash / dHash
Hachage perceptuel d’images. / Perceptual image hashing.
Pipeline
Enchaînement d’étapes outillées. / Tool‑chained steps.
Précision / Rappel
Métriques de qualité. / Precision / Recall.
Provenance (médias)
Historique de source/outils/transformations. / Media history.
Re‑identification
Réassocier des données « anonymisées ». / Link back to individuals.
Recherche inversée
Retrouver ancêtres/occurrences d’image. / Find prior image uses.
Red team
Simulation d’adversaire. / Adversarial simulation.
RGPD / GDPR
Règlement européen sur les données. / EU data protection.
Robots.txt / TOS
Accès automatisé / conditions d’usage. / Automated access / terms.
Seed
Valeur de reproductibilité. / Random seed.
Street View
Indices visuels de lieu. / Visual location cues.
WAI‑ARIA
Attributs d’accessibilité web. / Web accessibility.
Watermarking d’IA
Marquage de contenu généré. / AI‑generated marks.
Bibliographie (avec liens)Bibliography (with links)

Mention : Projet MatrioscIA – IHEMI. Olivier Le Deuff, Thais Barbosa de Almeida, Rayya Roumanos. 2025. Licence CC BY.