Méthodologie · AI-Readiness Score

En 30 secondes

On analyse chaque entreprise française PME/ETI sur 6 axes d'AI-readiness, on les combine en un composite 0-100 pondéré selon une thèse ICP (freelance IA / automation / agents).

Le processus est un pipeline en 3 passes : scoring rapide (P1), enrichissement profond avec recherche web et X (P2), rédaction du dossier (P3). Quand plusieurs signaux concernent la même boîte sur 14 jours, on les fusionne dans un dossier unique pour montrer la vélocité.

Chaque pain cité est tagué observed (source citée) ou inferred (déduction multi-signaux) — jamais speculative.

Les 6 axes

Axe	Poids	Description
Budget	25%	Probabilité que l'entreprise dispose d'un budget pour une mission IA freelance (1-25 k€ typique, +25 k€ exception). Calculé depuis levées, stade investisseurs, taille effectifs.
Tech	15%	Maturité de la stack. Un mix legacy + moderne est souvent le terrain le plus fertile pour une mission IA externe.
Team	10%	Espace pour une mission externe. Une grosse équipe tech interne réduit la fenêtre, sans la fermer.
Pain	25%	Douleur opérationnelle identifiée. Détectée dans offres d'emploi, posts LinkedIn, reviews G2/Capterra.
Culture	5%	Ouverture à payer de l'externe. Signal faible, utile en cas d'égalité.
Timing	20%	Fenêtre d'achat. Dates pivot < 60 jours, saison budgétaire, hiring velocity.

Pourquoi ces poids ?

Cette pondération est opinionnée : elle reflète la thèse d'un freelance / consultant IA qui cherche des PME/ETI avec un pain ACTIONNABLE et un BUDGET pour payer.

Pain + Budget = 50 % — sans observation d'un pain ET sans moyens de payer, le reste n'a aucun intérêt.
Timing 20 % — même un bon pain + budget, s'ils ne signent pas dans 12 semaines, le dossier vaut moins.
Tech 15 % — informatif mais secondaire (une entreprise legacy avec du pain est une meilleure cible qu'une IA-native sans pain).
Team 10 % — une grosse équipe tech n'empêche pas forcément une mission externe, mais limite la scope.
Culture 5 % — signal faible, utile en cas d'égalité.

Cette pondération est fixée par ICP. Pour un autre profil (ex : freelance data engineering pur), les poids devraient changer.

Composite final

composite = Σ (axe_score × poids) / 100
         = 0.25·pain + 0.25·budget + 0.20·timing
           + 0.15·tech + 0.10·team + 0.05·culture

Arrondi à l'entier, borné 0-100.

Plusieurs signaux sur une même boîte = un seul dossier

Une scale-up qui lève + recrute 3 Data Eng + post un message fondateur sur X dans les 14 mêmes jours, ça fait 1 boîte chaude, pas 5 cards à dédoublonner à la main.

Quand on scrape un nouveau signal pour une boîte qui a déjà un dossier ouvert dans la fenêtre des 14 derniers jours, on fusionne : le timeline du dossier accumule les signaux, le score se recalibre, mais on n'ouvre pas un doublon. Le dossier porte alors une vélocité (nombre de signaux 30j sur la même boîte).

Conséquence pratique :

Pas de feed pollué par 6 cards sur la même scale-up.
La vélocité devient un signal de chaleur : une boîte qui multiplie les signaux récents est en mouvement.
Le tri par vélocité (réservé au Club) sort en haut les boîtes en pleine accélération.

Comment on évite d'inventer des douleurs

Chaque pain_vector dans un dossier porte un evidence_level obligatoire :

🟢 observed — fait cité dans une source avec quote directe + URL. Ex : « Le CTO dit sur LinkedIn 'on passe 30 % du temps data en ETL bricolé' ».
🟡 inferred — déduction raisonnable de 2+ signaux observés. Ex : « 2 recrutements data + Series A récente + concurrence IA-native ⇒ probable besoin de scoring probabiliste ». La raison de déduction est toujours explicitée.
❌ speculative — jamais dans les pain_vectors. Isolé dans une section « Hypothèses à valider » avec how_to_validate.

Pourquoi c'est important. On a eu des dossiers (avant le 22 avril 2026) qui citaient « conformité RGPD (cookies, consentements) » comme pain, alors qu'un bandeau cookies est obligatoire CNIL depuis 2020 et n'est jamais un signal d'AI-readiness. On a renforcé les prompts P2 et P3 avec une liste explicite de SIGNAUX NULS (cookies, mentions légales, DPO basique, WCAG niveau 1) à ne jamais citer comme pain, et un grep anti-biais post-génération flag les dossiers contaminés.

Source cliquable par douleur

Chaque pain identifié dans le dossier porte un bouton source qui ouvre l'origine du signal — France Travail, LinkedIn Jobs, Maddyness, MyFrenchStartup, etc. — pas une URL brute, un libellé humain. Vous pouvez vérifier le texte d'origine en un clic.

France uniquement

Intent Room cible exclusivement les PME/ETI françaises. Très en amont du processus, on demande à l'IA d'identifier le pays du siège. Si elle n'est pas sûre à plus de 70 %, elle ne tranche pas — et par défaut on considère que la boîte n'est pas éligible.

Quand le pays détecté n'est pas la France, le signal est archivé immédiatement sous l'étiquette « hors zone ». On ne lance ni l'analyse du site, ni la recherche web, ni les autres appels d'IA — ce qui économise ~50–80 s de calcul par signal hors zone, et une dizaine d'appels au modèle.

Avant ce filtre, on avait des dossiers fantômes en base (Verdane / Norvège, Artemis Sourcing / Tunisie…) qui passaient toute la chaîne d'enrichissement avant d'être rejetés par une vérification finale. Le filtre amont rend le tri visible et instantané.

Intermédiaires (recruteurs, ESN, cabinets de conseil)

Une partie significative du scrap vient de cabinets qui ne sont pas eux-mêmes des prospects : recruteurs (Michael Page, Hays, Lynx RH…), ESN & cabinets de conseil (Capgemini, Sopra Steria, Talan, ALTEN…), Big 4 (EY, Deloitte, KPMG, PwC), staffing marketplaces (Malt, Comet…).

L'IA qualifieuse identifie le type d'intermédiaire (cabinet de recrutement, ESN, Big 4, marketplace) et note si le client final est masqué ou partiellement visible. Le signal est alors archivé sous l'étiquette correspondante.

On ne tente pas de retrouver le client final masqué. Une analyse des derniers signaux intermédiaires montre que 0 % des posts nomment explicitement le client, et seulement ~40 % donnent un descriptif (taille + secteur + ville) trop flou pour être exploitable comme prospect. Le coût d'un appel d'IA supplémentaire pour tenter l'extraction n'est donc pas justifié.

Conséquence : un poste ouvert chez un cabinet de recrutement n'apparaîtra pas sur votre feed comme dossier prospect. Ces signaux servent uniquement à l'analytics (qualité de la source, drop-off du funnel). Si vous cherchez à prospecter les cabinets eux-mêmes, ce n'est pas notre angle — Intent Room cible les boîtes finales, pas les intermédiaires.

Les 3 étapes d'analyse d'un dossier

Signal brut (scrapé sur LinkedIn, France Travail, etc.)
    ↓
┌────────────────────────────────────────────┐
│ Filtres amont                              │
│ • Doublon déjà vu → ignoré                 │
│ • Pays = France ? sinon archivé            │
│ • Intermédiaire (recruteur, ESN…) ?        │
│   → archivé                                │
│ • Boîte non-prospectable ? → archivée      │
└────────────────────────────────────────────┘
    ↓
┌────────────────────────────────────────────┐
│ Étape 1 — Scoring rapide                   │
│ • Calcul arithmétique sur les données      │
│ • Une IA ajuste chaque axe                 │
│ • Score composite 0-100 pondéré            │
│ • Verdict final : prospectable ou non      │
└────────────────────────────────────────────┘
    ↓
┌────────────────────────────────────────────┐
│ Étape 2 — Enrichissement profond           │
│ • Agent + recherche web + X                │
│ • 5-15 sources citées                      │
│ • Fondateurs, levées, concurrents          │
│ • Sourcing strict de chaque douleur        │
└────────────────────────────────────────────┘
    ↓
┌────────────────────────────────────────────┐
│ Étape 3 — Rédaction du dossier             │
│ • Synthèse structurée                      │
│ • Outreach personnalisé email + LinkedIn   │
│ • Vérification anti-biais                  │
└────────────────────────────────────────────┘

Pourquoi tous les dossiers sont enrichis à fond

Au départ, on avait deux niveaux d'analyse : un mode complet (recherche web, 5-15 sources citées, outreach personnalisé) déclenché seulement si le score franchissait un seuil ou s'il y avait une levée de fonds récente, et un mode rapide (sans recherche web, douleurs tirées du signal lui-même et des infos déjà en base) pour le reste.

L'idée du double niveau était d'éviter de cramer du calcul sur les signaux moyens. On a convergé vers le mode complet pour tous pour trois raisons :

Les dossiers en mode rapide ne convertissaient pas. Sans recherche web, les douleurs restaient en surface, l'outreach perdait en personnalisation. Ils encombraient le feed sans générer de prises de contact.
Le coût du mode complet a chuté. Lecture du site + extraction structurée en parallèle + détection des compétences ≈ 0,10 € par dossier. À ce prix-là, payer pour la version riche est un no-brainer.
Les filtres amont (France uniquement, intermédiaires, taille prospectable) jettent déjà ~50 % du scrap dès l'arrivée du signal. Les signaux qui survivent valent l'enrichissement complet — ce sont des vraies PME/ETI françaises directement prospectables.

Note historique : le mode rapide est désactivé depuis le 27 avril 2026, après migration des derniers dossiers concernés vers le mode complet.

Étape 1 — Scoring rapide

On fait d'abord un scoring arithmétique sur les données structurées : taille d'effectif, levée récente, stack détectée, date du signal. Ça donne un score de base 0-100 par axe.

Ensuite, une IA légère lit le texte du signal et ajuste chaque axe d'un delta de -15 à +60 avec une raison courte. Par exemple : « investisseur CVC corporate stratégique : +30 sur Budget, raison = OCIRP apporte distribution assurance ». Si aucune raison forte, delta = 0. À cette étape, on tranche aussi sur la prospectabilité du signal — un signal jugé non exploitable à ce stade (recruteur masqué passé entre les mailles, rôle qui n'a aucun lien avec l'IA, etc.) est archivé avant qu'on engage le coût d'enrichissement de l'étape 2.

Étape 2 — Enrichissement profond

L'agent effectue plusieurs recherches obligatoires :

Identité & fondateurs — LinkedIn, parcours, ex-employeurs.
Concurrents IA-natifs — au moins 3 pure-players du secteur.
Pattern de distribution — canaux, partenaires stratégiques.
Warm intros — alumni communs, ex-collègues, investisseurs croisés.
Timing — fenêtre optimale (0-12 semaines), risques après.

Étape 3 — Rédaction du dossier

On génère le dossier final : synthèse structurée + kit outreach prêt à envoyer (email + LinkedIn, 100 % personnalisés).

Une vérification anti-biais post-génération cherche les schémas suspects (cookies cités comme douleur, conformité RGPD listée comme un signal d'achat, etc.). Si un match est trouvé, le dossier est marqué pour relecture humaine avant publication.

Boîtes non-prospectables exclues

Avant qu'un dossier atterrisse dans votre feed, on vérifie qu'un freelance pourrait raisonnablement signer une mission avec cette entreprise : taille adaptée, secteur ouvert au prestataire externe, géo accessible. Les entreprises classées non exploitables (multinationale CAC 40 à 50 000 collaborateurs, administration publique pure, gros laboratoires de recherche, hôpitaux, etc.) restent en base pour les statistiques mais ne sortent jamais sur le feed. Ça évite de vous proposer des cibles que personne ne signera.

Estimation du budget mission

⚠️ Posture assumée : conservatrice. Les budgets affichés sont volontairement sous-estimés par rapport au plafond marché. Voir ci-dessous pourquoi et comment.

Chaque dossier affiche un budget estimé pour la mission (ex : « 8-15 k€ »). Cette estimation ne sort pas d'une intuition LLM. Elle vient d'une grille de 15 patterns marché calibrée sur le vrai marché freelance IA France 2026.

Comment on procède

Le LLM choisit le pattern parmi les 15 disponibles (audit IA, POC simple, POC complexe, RAG chatbot interne, agent LLM autonome, agent multi-complex, pipeline ELT / data platform, automation workflow no-code, HubSpot / CRM AI automation, BI reporting, scoring ML prédictif, compliance réglementaire (CSRD / DORA), architecture IA, staff augmentation senior, formation IA équipe). Si rien ne colle, fallback sur audit_strategy_ia.
Le serveur aligne le budget sur le benchmark de ce pattern (budget_min_eur / budget_max_eur / days_typical). Le LLM peut moduler ±25 % selon la taille de la boîte (TPE → bas du range, ETI → haut), mais jamais au-delà de 1,5× le plafond du pattern (hard cap).
Affichage : la fourchette min–max est affichée avec le pattern, les sources cliquables et un badge « 🛡️ bet conservateur ».

C'est le serveur qui aligne, pas le LLM, donc pas d'hallucination de prix.

Pourquoi la posture conservatrice

Les fourchettes publiques des plateformes (Plateya, YouFeel, Malt) incluent agences + cabinets + grands comptes. Un freelance solo ciblant TPE/PME ne pratique pas ces tarifs : il va chercher 500-700 €/j, pas 1 500-2 000 €/j.

On a donc pris la réalité TPE/PME freelance solo comme source, validée par :

• France Num (gouv.fr) — budget moyen projet IA PME 3-8 k€
• Bpifrance Diag Data IA — 7 500 € HT reste à charge après aide 25%
• Codeur — chatbot basique 500-2 000 €, e-commerce 5-12 k€
• Synoptia — automation 10h/sem 3-5 k€, TJM 350-650 €
• Onyri Strategy — prédiction/classification PME 8-35 k€
• Tensoria — coût projet IA PME 500-50 k€ selon complexité

Exemples de recalibration :

Pattern	Public	Notre fourchette
Audit stratégique IA	3-8 k€	2-5 k€ (typ. 3 k€)
POC IA simple	5-15 k€	2,5-7 k€ (typ. 4,5 k€)
RAG chatbot interne	10-25 k€	3,5-9 k€ (typ. 6 k€)
Agent IA autonome	20-50 k€	6-15 k€ (typ. 10 k€)
Compliance CSRD/DORA	25-60 k€	10-25 k€ (typ. 16 k€)
Automation workflow	5-15 k€	1,8-6 k€ (typ. 3,5 k€)
Pipeline ELT	10-28 k€	4-11 k€ (typ. 7 k€)

Un freelance senior notoire avec clients ETI peut pratiquer +50 % voire plus. Un POC TPE cadré peut tomber −30 %.

Philosophie

Mieux vaut sous-promettre et voir la réalité surperformer, que sur-estimer et décevoir. C'est ce qui crédibilise toute la méthodologie. Quand un freelance signe à 28 k€ une mission qu'on estimait 15-22 k€, il retient qu'on est honnêtes. Si on avait affiché 35-50 k€ et qu'il signe à 28, il retient qu'on enjolive.

Actualisation

La grille est revue tous les 3 mois. La date de dernière révision est affichée sur chaque dossier. Le plan long-terme est de remplacer les benchmarks publics par les vraies données de ventes captées via les missions signées.

Rolling window — pourquoi on retire les vieux signaux

Un signal détecté il y a 6 mois n'a plus la même valeur :

La personne contactée a pu embaucher en interne.
Le pain aigu a pu être résolu avec une solution temporaire.
Le budget trimestriel a pu migrer ailleurs.
Un concurrent a pu signer entretemps.

On applique donc un rolling filter sur le pipeline marketing :

Si l'IA a détecté une timing window dans le dossier (ex : window_end_weeks: 8) → on respecte cette fenêtre spécifique.
Sinon fallback : 90 jours depuis signal_date.

Au-delà de la fenêtre, le dossier passe en status expired automatiquement (+30j grace period). Il reste accessible individuellement mais n'est plus compté dans le headline pipeline. Conséquence assumée : le chiffre agrégé peut descendre si on ne scrape pas régulièrement. C'est honnête — un pipeline vieillissant perd de la valeur.

Buy_probability : signal séparé, pas multiplicateur

On affiche la buy_probability (0-100) comme signal qualitatif indépendant, pas comme multiplicateur du budget. Multiplier deux estimations floues donne une fausse précision. Vous voyez le budget marché d'un côté, la probabilité d'achat de l'autre, vous décidez. (Le tri par probabilité d'achat est aussi disponible sur le dashboard pour les membres Club.)

Niveau de qualité (tier)

Chaque dossier porte un tier interne (A → E) qui résume sa qualité globale, calculé par fonction SQL déterministe à partir du composite et du nombre de pains observés. C'est un repère de tri, pas un prix : avec le Club (18 €/mois HT), tous les dossiers (tier A à D) sont accessibles sans surcoût.

Tier	Règle
A	composite ≥ 80 OU 3+ observed pains
B	composite 70-79
C	composite 60-69
D	composite 50-59 ET 2+ observed pains
E	tous les autres cas → non publié

Pourquoi l'override « 3+ observed pains → tier A » ?

Un dossier à composite 66 avec 3 pains observés sources à l'appui vaut davantage qu'un dossier à composite 75 avec 0 observation (que des inférences). Le nombre de pains observés est un meilleur prédicteur d'achat que le composite brut.

Pourquoi l'override « < 50 + < 2 observed → non publié » ?

Publier un dossier bas composite avec que des inférences reviendrait à vendre du bruit. On archive ces dossiers et on ne les montre pas aux utilisateurs. Ils restent en DB pour analyse statistique.

Limites assumées

Pour être honnête avec l'utilisateur, voici ce qu'on ne garantit pas :

Le composite n'est pas un score de probabilité d'achat. C'est une estimation de readiness. Un dossier à 75 peut ne pas acheter si la personne de contact est mal choisie. C'est pour ça qu'on fournit un Decision Unit complet.
Les warm intros identifiées ne sont pas vérifiées humainement. Elles sont déduites de signaux publics (LinkedIn, écoles communes, historique VC). À valider avant d'envoyer un message.
Les buy_probability sur les pain_vectors sont des estimates, pas des probabilités actuarielles.
Les scores peuvent dériver dans le temps. Une entreprise à tier A en avril peut tomber à tier C en juillet si sa fenêtre timing s'est fermée. Le produced_at est affiché sur chaque dossier — au-delà de 6 semaines, relancez un nouveau scan.
Le pipeline rate les signaux qui ne passent pas par les sources scrapées (certains job boards, posts LinkedIn privés, communications investisseurs non publiques). On traite ce qu'on peut détecter.

FAQ

Pourquoi pas 0-10 comme la plupart des scores ?

0-100 permet de différencier 62 vs 68, ce qui compte pour le tier C/D. 0-10 aurait fait perdre de la granularité.

Vous utilisez quoi pour faire ça ?

Une combinaison de modèles propriétaires et d'agents capables de recherche web et X en temps réel. Le détail technique évolue régulièrement ; le contrat avec l'utilisateur, lui, reste stable : evidence tagging strict, prix alignés sur la grille marché, pas d'hallucination.

Comment vous gérez les intermédiaires (cabinets de recrutement, ESN, Big 4, marketplaces) ?

Le pipeline détecte le type d'intermédiaire et archive le signal sans l'envoyer au feed. On ne tente pas de retrouver le client final masqué — l'analyse des derniers signaux montre que 0 % des posts nomment explicitement le client, et seulement ~40 % donnent un descriptif trop flou pour être exploitable. Voir la section Intermédiaires pour le détail.

Pourquoi une levée déclenche toujours un dossier Premium, même à composite bas ?

Une levée est un signal de timing tellement fort (cash frais + obligation de déployer) que ça vaut la peine d'investir dans la recherche profonde, même si les autres axes sont moyens.

Je peux challenger un score ?

Oui. Chaque dossier expose le P1 raw par axe, le delta P2, et la raison. Si vous pensez que c'est off, contactez-nous avec l'ID du dossier.

Versions

v1 (2026-04-18) — pipeline initial sans evidence tagging.
v2 (2026-04-22) — ajout evidence_level (observed/inferred/speculative), anti-bias compliance, tier D unlockable avec 2+ observed.
v3 (2026-04-23) — détection dynamique d'intermédiaires (real_employer), tier A unlockable avec 3+ observed.
v4 (2026-04-25) — Multi-signal merge sur fenêtre 14 jours · pricing aligné sur grille 15 patterns marché (hard cap 1,5×) · pipeline 3 passes split Premium / Fast (toute levée déclenche Premium) · contactability filter · source cliquable par pain · tier devient niveau de qualité interne (Club 18 €/mois HT = accès illimité tier A→D).
v5 (2026-04-27) — Pipeline Premium-only (la voie Fast est retirée, tous les signaux qui passent les filtres amont vont en enrichissement profond) · ajout d'un gate FR explicite en amont (Grok renvoie country_iso, on archive les non-FR avant Crawl4AI/extracteurs pour économiser le compute) · clarification du traitement des intermédiaires (recruteurs / ESN / Big 4 / staffing marketplaces) : archivage direct sans tentative d'identifier le client masqué (analyse data : 0 % des posts nomment le client final).

Contact : aymen@intentroom.ai · Intent Room · Dernière mise à jour : 2026-04-27

Méthodologie AI-Readiness Score