Retour au haut de page


Le quadricolore du Podcast

Avant Propos


Podcastéo propose un classement des podcasts français et une estimation de leur audience.

Le classement intègre des éléments quantitatifs et qualitatifs :

  • la fréquence de publication
  • une estimation de l’audience
  • les avis iTunes
  • la présence sur les réseaux sociaux
  • l’appartenance à un network (l’affiliation)

L’estimation de l’audience provient d’un modèle de régression linéaire multiple qui est encore en cours de développement (#machinelearning #bigdata #whynot).

Podcasteo, c'est aussi un réseau. 18 podcasts indépendants qui se sont associés dans le cadre d’un réseau d’entraide. Cette structure va permettre aux producteurs d'émissions de développer des projets communs et de gagner en visibilité.

L’objectif du classement et de l’estimation de l’audience est de donner une image de la popularité des différents podcasts recensés. Ils sont les fruits de formules et d'algorithmes, et se basent sur des données libres d'accès (ex.: nombres de followers, avis iTunes, …).

Podcastéo, c’est aussi la réalisation spontanée d’une idée émise lors d’un épisode de l’Ecole des FAQ

Notre classement sera mis à jour chaque 1er du mois en attendant une automatisation du calcul.

Nous savons que notre liste n'est pas exhaustive, nous sommes toujours en beta mais n'hésitez pas à nous transmettre vos suggestions de podcasts dans le formulaire ci-dessous pour nous aider dans notre recensement.

Enfin, nous ne sommes que des personnes aimant les podcasts, les nouvelles technos et les mathématiques. Ni plus, ni moins.

Ecoutes = Ecoute moyenne d'un épisode de podcast, 30 jours après sa publication

Score Podcastéo = Quadrigramme obtenu par le podcast au regard de son audience, sa fréquence, son nombre d'avis iTunes et son influence sur les réseaux sociaux.

Avis iTunes = Nombre d'avis iTunes * log (âge du podcast en année-1)

Réseau sociaux = Total des followers TW de l'émission + Total de likes FB de l'émission + 1/3 des followers TW de l'animateur

Légende


legend

Classement de Décembre 2017

Chiffres relevés le 29 novembre 2017


FAQ


Pourquoi faire un classement? C’est nul les classements.

Au commencement nous avons juste voulu prédire nos audiences. Les cerveaux de l’équipe se sont lancés dans la construction d’un modèle prédictif. Et pour mettre au point ce modèle, ils ont analysé ce qu’ils avaient sous la main : les autres podcasts du PIF via plusieurs sources de données.

Une fois le modèle en place, nous avions sous la main un moyen de donner une note de popularité à un podcast en fonction de divers critères (son audience, son classement iTunes, son influence sur les réseaux sociaux et la notoriété de son éditeur).

Tout ça est expliqué plus en détail dans le Hors-Série #1 de l’Ecole des FAQ.


Pourquoi faites vous une estimations du nombre d’écoutes au lieu de regarder directement les audiences des podcasts ?

Il y a 3 problèmes avec les audiences des podcasts.

Le premier problème c’est la définition de l’audience : Est-ce le nombre d’écoutes par épisodes? le nombre total d’écoutes? le nombre d’abonnés? le nombre de fans sur les réseaux sociaux? Et qu’est-ce qu’une écoute : le téléchargement de l’épisode? Le lancement du stream? L’écoute complète? L’écoute partielle ?

Le 2ème problème est la source des données d’audience : tous les podcasts ne sont pas hébergés sur la même plateforme. Certains sont sur soundcloud, d’autres ont leurs propres serveurs, il existe de nombreux services d’hébergements. La majorité des podcasts du PIF sont référencés sur iTunes mais pas tous. Et le nombre d’écoutes ou d’abonnés n’est pas forcément rendu public par les plateformes d’hébergement et de référencement.

Le 3e problème est le fiabilité des sources : certaines plateformes sont vérolées par des bots spammeurs ou des vendeurs de fausses écoutes.

On a donc choisi de se baser sur d’autres critères pour essayer de calculer une estimation du nombre d’écoutes pour 1 épisode, 30 jours après sa sortie.


Pourquoi je ne trouve pas mon podcast préféré ?

On est une petite structure et le modèle est toujours en BETA. Certaines tâches sont automatisés mais la découverte de podcasts et leur intégration au modèle restent manuels.

Chaque podcast a ses propres particularités et parfois ajouter un nouveau podcast à la liste implique d’ajuster le modèle.

On préfère donc pour l’instant se concentrer sur les podcasts qui nous sont proposés via le formulaire, nous les ajouterons tous petit à petit.

Naturellement, une fois sorti de BETA nous essaierons d’être le plus exhaustif possible.


Vous dites qu’il faut passer par le formulaire, mais mon podcast est dans votre classement sans que je l’ai demandé.

Deux possibilités : soit il était dans la liste initiale, soit il a été suggéré par un fan.

Pour construire le modèle nous sommes partis d’une liste de 25 podcasts aux profils différents parmi ceux que nous écoutons (des anciens, des nouveaux, des très connus, des moins connus, etc). Nous agrandissons la liste et affinons le modèle chaque mois en ajoutant une dizaine de podcasts à la fois. Le formulaire est là pour canaliser les suggestions, tout podcast proposé via le formulaire arrivera dans tôt ou tard dans la liste.


Vous avouez vous-même que vous n'avez pas de données fiables !

C’est vrai qu’il n’existe pas de source unique, neutre et reconnue qui fournit le nombre d’écoutes ou le nombre de téléchargements de tous les podcasts existants. C’est bien pour ça que l’on passe par un modèle pour estimer le nombre d’écoutes. Mais dans le calcul du score les autres variables ne sont pas des estimations.

Pour le moment, nous précisons que nous sommes en BETA et que nous affinons nos formules régulièrement (pour ceux que ça intéresse : le R2 est actuellement de 0.98).


Est-ce qu'un tel classement est pertinent ?

Peut-être, peut-être pas. C’est avant tout le résultat d’une petite expérience qu’on a fait dans notre coin et dont nous avons trouvé le résultat intéressant à partager.


Contact



Changelog


Décembre 2017

  • Ajout des podcasts qui ont republié ce mois-ci.
  • Retrait des podcasts sans publication depuis 4 mois.
  • Ajout des podcasts en ayant fait la demande depuis la dernière mise à jour.

Novembre 2017

  • Fin de l'automatisation des calculs et de l'affichage des résultats sur le site.
  • Changement de la structure des vignettes pour une navigation plus facile.
  • Ajout d'un critère de progression qui est calculé sur l'évolution des comptes twitter et facebook des podcasts.
  • Ajout des podcasts qui ont republié ce mois-ci.
  • Retrait des podcasts sans publication depuis 4 mois.
  • Ajout des podcasts en ayant fait la demande depuis la dernière mise à jour.

Octobre 2017

  • Changement du calcul de la périodicité. Maintenant les fréquences de publication suivent la règle suivante: Décompte du nombre d'épisodes publiés sur les 30 derniers jours, si 0 alors décompte du nombre d'épisodes publiés sur les 120 derniers jours ramenés à nue moyenne mensuelle, si 0 alors sortie du classement.
  • Ajout des podcasts qui ont republié ce mois-ci.
  • Retrait des podcasts sans publication depuis 4 mois.
  • Début de l'automatisation du script d'affichage de la page web avec une version dynamique qui nous permet de générer automatiquement le script depuis notre base de données.
  • Ajout des podcasts en ayant fait la demande depuis la dernière mise à jour.

Septembre 2017

  • Renforcement du calcul du modèle avec les confirmations de certains podcasts.
  • Retrait des podcasts sans publication depuis 4 mois.
  • Correction du facteur d'affiliation pour les podcasts du network Geekzone.
  • Ajout des podcasts en ayant fait la demande depuis la dernière mise à jour.

Aout 2017

  • Changement de modèle avec l'utilisation de 4 modèles prédictifs au lieu d'un.
  • Envoi de messages de confirmation pour les podcasts ayant plus de 1000 écoutes pour faire valider les fourchettes.
  • Changement de l'affichage des vignettes en image complète à tableau html.
  • Correction du facteur d'affiliation pour les podcasts du network RadioKawa.
  • Ajout des podcasts en ayant fait la demande depuis la dernière mise à jour.

Juillet 2017

  • Changement du logo et ajout de la notion de BETA.
  • Changement du mode de présentation des audiences et des autres facteurs ayant un rôle dans le score Podcastéo (qui est maintenant un trigramme). Nous avons fait ce choix pour des raisons de qualité de nos estimations qui ne sont pas assez précises aujourd'hui pour donner un chiffre exact à 10% près.
  • Correction des facteurs d'estimation d'audience via de nouvelles données fiabilisées pour se rapprocher du critère de qualité souhaité.
  • Ajout des podcasts de FrenchSpin suite à une décision du comité d'éthique Podcastéo.
  • Correction du facteur d'affiliation pour les podcasts du network RadioKawa.
  • Ajout des podcasts en ayant fait la demande depuis la dernière mise à jour.
  • L'à propos devient l'avant propos.
  • Ajout des échelles pour comprendre les notes.
  • Ajout d'une FAQ pour répondre aux questions les plus couramments posées
  • Création d'un compte twitter dédié.

Juin 2017

  • Ajout d'un facteur de dégénérance du nombre d'avis iTunes en fonction de l'âge via un logarithme. Cela est non impactant pour les podcasts de moins de 3 ans.
  • Ajout des podcasts de Slate, RadioKawa et BingeAudio pour faire fonctionner l'affiliation des podcasts de ces réseaux et ainsi corriger leurs estimations.
  • Changement de la présentation des audiences : auparavant en audience mensuelle cumulée, maintenant en audience par épisode 30 jours après la diffusion de l'épisode.
  • Modification mineure des facteurs du modèle.
  • Ajout des podcasts ayant été demandés.
  • Création de la section "Changelog".