Tinyclues : donnez du sens social à vos données

Un gars à mon boulot m’a parlé d’une petite startup, Tinyclues, qui avait eu une idée pas mal : donner du sens social à vos données. En gros, si j’ai bien compris, si vous êtes une boite qui possède une certaine base de clients (ou de mails), vous la donnez à Tinyclues, et cette boite va être capable de déduire un certain nombre de choses à partir des données que vous leur avez confié. Par exemple, vous donnez une grande quantité d’emails à Tinyclues, et en fonction du pattern utilisé par l’email, la boite va être capable de savoir quel pouvoir d’achat, en gros, dispose chaque compte. Ainsi, kevin_le_bogoss_du_93@hotmail.fr aura certainement un pouvoir d’achat moins élevé que charles-edouard.dupont@gmail.com. Et donc les emails via CRM pour cibler cet acheteurs seront potentiellement différent !

Plutôt que des explications foues de ma part, mieux vaut une bonne démonstration de la part du co-fondateur de l’entreprise :

Alors, pour être tout à fait franc, ça faisait plus d’un mois que cet embryon de billet traînait dans mes brouillons. Et puis, c’est à la faveur d’une news sur les prénoms et leur potentielle réussite au bac, sortie par Baptiste Coulmont, que je me suis dis qu’il serait fort-à-propos de publier mon billet. Car son étude a fait les gros titres de tous les journaux : LeMonde, Le NouvelObs, Le Point, 20minutes, 24Matins, etc. Certains allant jusqu’à dire que le journalisme de données avait été trop loin, et qu’il ne fallait pas sortir de telles études, car cela risquait de stigmatiser certains élèves en fonction de leur prénom. En même temps, on peut se demander si une telle étude est bien légale en France, car il me semble qu’il est interdit de faire des statistiques sur des critères ethniques. Et je trouve des traces de cela sur le net, avec un certain article 63, cf Wikipédia ici qui dit :

Le projet de loi relative à la maîtrise de l’immigration, à l’intégration et à l’asile prévoyait une disposition permettant le dénombrement des groupes ethniques. Cette disposition a suscité une opposition importante. Ainsi, le 25 et 26 octobre 2007, le Conseil constitutionnel a été saisi, les 25 et 26 octobre 2007 respectivement, par plus de soixante députés et par plus de soixante sénateurs7. Dans sa décision du 15 novembre 20078,9,10,11,12,13, il a conclu :

  • à la non-conformité de l’article 63 (concernant la réalisation de traitements de données à caractère personnel faisant « apparaître, directement ou indirectement, les origines raciales ou ethniques ») :
    • cet article a été adopté à l’issue d’une procédure irrégulière, étant issu d’un amendement sans lien avec l’objet du texte déposé sur le bureau de la première assemblée saisie (texte qui portait essentiellement sur le regroupement familial, sur l’asile et sur l’immigration pour motifs professionnels ;
    • sur le fond, le Conseil ajoute que « si les traitements nécessaires à la conduite d’études sur la mesure de la diversité des origines des personnes, de la discrimination et de l’intégration peuvent porter sur des données objectives, ils ne sauraient, sans méconnaître le principe énoncé par l’article 1er de la Constitution, reposer sur l’origine ethnique ou la race »

À la suite de cette censure du Conseil constitutionnel, l’INED et l’INSEE ont décidé de retirer leur question sur la couleur de la peau6.

Voilà voilà. Donc je ne sais pas si la sortie de l’étude de Baptiste Coulmont va relancer un débat là dessus, et si il sera considéré que le prénom fait partie des données ethniques, mais il est possible qu’à l’avenir, ce genre de « recoupements » fasse l’objet d’une loi, voire même soient interdits, qui sait… et donc menace leur exploitation pour des besoins de ciblage marketing et publicitaire.

4 réflexions sur « Tinyclues : donnez du sens social à vos données »

  1. J’ai eu l’occasion de voir la présentation de D. Bessis. Ils travaillent essentiellement sur des algorithmes de classification et de regression. Pour résumer ils font entrer toutes les données dans des modèles mathématiques pour faire ce qu’on regroupe sous le terme de « Machine Learning ». Les champs d’applications sont multiples, les principaux étant par exemple de pouvoir prévoir la manière de laquelle un phénomène va évoluer, soit de clusteriser par exemple des populations pour trouver des groupes aux comportements similaires, ou bien de pouvoir recommander à certains individus des produits en fonctions de comportements d’achats. 35% du Chiffre d’affaires d’Amazon est généré par leur système de recommandations : vous devriez acheter tel livre, car les gens qui ont acheté les mêmes ouvrages que vous ont aussi aimé celui-là. Par contre ces modèles mathématiques sont à manipuler avec précaution car ont peu rapidement amplifier le phénomène et plus parvenir à diversifier la consommation. Par exemple Netflix met une dose de hasard en complément de son modèle mathématique, pour ouvrir le scope des films regardés par ses clients.
    Aujourd’hui, chez Affini-Tech nous misons sur le transfert de technologies développées par les scientifiques (et nos scientifiques français sont vraiment bons) vers monde du business, afin de créer réellement de la valeur dans la valorisation des données.

    RépondreRépondre
  2. @Vincent Heuschling: C’est TinyClues qui fait le moteur de recommandation de Amazon ? Je t’avoue que ça m’étonne que ce soit pas Amazon qui développe ça en interne, tellement ils sont bons.

    Par contre, y’a aussi un autre mouvement dans l’ecommerce qui se développe, et qui tourne autour de la recommandation. C’est la recommandation un peu à la hausse. Exemple :

    vous avez acheté telle TV Samsung de 30″ à 200€. Seriez-vous intéressé par acheter plutôt telle autre TV Philips de 35″ à 205€ ?

    Et du coup, par un moteur de recommandation, tu hausses petit à petit le montant du panier client.

    RépondreRépondre
  3. Il fallait comprendre dans « leur système de recommandation » : « le système de recommandation d’Amazon ». Désolé pour le manque de clarté du message.

    Pour répondre au second point, ce ne sont que des outils au services de stratégies marketing et commerciales. Les réponses apportées ne sont que le fruits de critères qui sont pondérés pour fournir des options en regard de la politique commerciale. L’homme garde même un peu de controle sur la machine ! La « recommandation à la hausse » n’est pas une reco « crowdsourcée », mais plutôt l’application d’un scénario commercial visant à l’upsell. Ce qu’on recommande ici n’est pas le fait de l’observation des achats d’autres consommateurs.

    RépondreRépondre
  4. @Vincent Heuschling: je pense qu’au contraire, tu peux calquer l’upsell sur du crowdsourcing. E gros, tu « orientes » les résultats du crowsourcing pour voir à quel profil correspond ton acheteur, et du coup lui montrer quels items pourraient lui correspondre (et tu as filtré les items juste avant pour ne lui afficher que les items un peu plus cher). Après, ne reste plus qu’à faire un petit algo de comparaison pour montrer quels sont les arguments en faveur du switch vers l’article plus cher 🙂

    RépondreRépondre

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.