Retour au haut de page


Le quadricolore du Podcast

Avant Propos


Podcastéo propose un classement des podcasts français et une estimation de leur audience.

Le classement intègre des éléments quantitatifs et qualitatifs :

  • la fréquence de publication
  • une estimation de l’audience
  • les avis iTunes
  • la présence sur les réseaux sociaux
  • l’appartenance à un network (l’affiliation)

L’estimation de l’audience provient d’un modèle de régression linéaire multiple qui est encore en cours de développement (#machinelearning #bigdata #whynot).

L’objectif du classement et de l’estimation de l’audience est de donner une image de la popularité des différents podcasts recensés. Ils sont les fruits de formules et d'algorithmes, et se basent sur des données libres d'accès (ex.: nombres de followers, avis iTunes, …).

Podcastéo, c’est aussi la réalisation spontanée d’une idée émise lors d’un épisode de l’Ecole des FAQ

Notre classement sera mis à jour chaque 1er du mois en attendant une automatisation du calcul.

Nous savons que notre liste n'est pas exhaustive, nous sommes toujours en beta mais n'hésitez pas à nous transmettre vos suggestions de podcasts dans le formulaire ci-dessous pour nous aider dans notre recensement.

Enfin, nous ne sommes que des personnes aimant les podcasts, les nouvelles technos et les mathématiques. Ni plus, ni moins.

Ecoutes = Ecoute moyenne d'un épisode de podcast, 30 jours après sa publication

Score Podcastéo = Quadrigramme obtenu par le podcast au regard de son audience, sa fréquence, son nombre d'avis iTunes et son influence sur les réseaux sociaux.

Avis iTunes = Nombre d'avis iTunes * log (âge du podcast en année-1)

Réseau sociaux = Total des followers TW de l'émission + Total de likes FB de l'émission + 1/3 des followers TW de l'animateur

Légende


Estimations d'audience

A : Au dessus de 35'000

B : Entre 25'000 et 35'000

C : Entre 20'000 et 25'000

D : Entre 17'000 et 20'000

E : Entre 13'000 et 17'000

F : Entre 10'000 et 13'000

G : Entre 7'000 et 10'000

H : Entre 4'000 et 7'000

I : Entre 2'000 et 4'000

J: Entre 1'000 et 2'000

K : Entre 300 et 1'000

L : Entre 1 et 300


Fréquence

A : Plus de 2 par semaine

B : Hebdomadaire

C : Bimensuel

D : Mensuel

E : Bimestriel

F : Trimestriel

G : Non périodique


Avis iTunes

A : Au dessus de 800

B : Entre 600 et 800

C : Entre 400 et 600

D : Entre 200 et 400

E : Entre 100 et 200

F : Entre 80 et 100

G : Entre 50 et 80

H : Entre 20 et 50

I : Entre 10 et 20

J: Entre 1 et 10


Réseaux sociaux

A : Au dessus de 20'000

B : Entre 15'000 et 20'000

C : Entre 10'000 et 15'000

D : Entre 5'000 et 10'000

E : Entre 2'500 et 5'000

F : Entre 1'500 et 2'500

G : Entre 1'000 et 1'500

H : Entre 400 et 1'000

I : Entre 100 et 400

J: Entre 1 et 100

Classement d'Octobre 2017

Chiffres relevés le 29 septembre 2017


FAQ


Pourquoi faire un classement? C’est nul les classements.

Au commencement nous avons juste voulu prédire nos audiences. Les cerveaux de l’équipe se sont lancés dans la construction d’un modèle prédictif. Et pour mettre au point ce modèle, ils ont analysé ce qu’ils avaient sous la main : les autres podcasts du PIF via plusieurs sources de données.

Une fois le modèle en place, nous avions sous la main un moyen de donner une note de popularité à un podcast en fonction de divers critères (son audience, son classement iTunes, son influence sur les réseaux sociaux et la notoriété de son éditeur).

Tout ça est expliqué plus en détail dans le Hors-Série #1 de l’Ecole des FAQ.


Pourquoi faites vous une estimations du nombre d’écoutes au lieu de regarder directement les audiences des podcasts ?

Il y a 3 problèmes avec les audiences des podcasts.

Le premier problème c’est la définition de l’audience : Est-ce le nombre d’écoutes par épisodes? le nombre total d’écoutes? le nombre d’abonnés? le nombre de fans sur les réseaux sociaux? Et qu’est-ce qu’une écoute : le téléchargement de l’épisode? Le lancement du stream? L’écoute complète? L’écoute partielle ?

Le 2ème problème est la source des données d’audience : tous les podcasts ne sont pas hébergés sur la même plateforme. Certains sont sur soundcloud, d’autres ont leurs propres serveurs, il existe de nombreux services d’hébergements. La majorité des podcasts du PIF sont référencés sur iTunes mais pas tous. Et le nombre d’écoutes ou d’abonnés n’est pas forcément rendu public par les plateformes d’hébergement et de référencement.

Le 3e problème est le fiabilité des sources : certaines plateformes sont vérolées par des bots spammeurs ou des vendeurs de fausses écoutes.

On a donc choisi de se baser sur d’autres critères pour essayer de calculer une estimation du nombre d’écoutes pour 1 épisode, 30 jours après sa sortie.


Pourquoi je ne trouve pas mon podcast préféré ?

On est une petite structure et le modèle est toujours en BETA. Certaines tâches sont automatisés mais la découverte de podcasts et leur intégration au modèle restent manuels.

Chaque podcast a ses propres particularités et parfois ajouter un nouveau podcast à la liste implique d’ajuster le modèle.

On préfère donc pour l’instant se concentrer sur les podcasts qui nous sont proposés via le formulaire, nous les ajouterons tous petit à petit.

Naturellement, une fois sorti de BETA nous essaierons d’être le plus exhaustif possible.


Vous dites qu’il faut passer par le formulaire, mais mon podcast est dans votre classement sans que je l’ai demandé.

Deux possibilités : soit il était dans la liste initiale, soit il a été suggéré par un fan.

Pour construire le modèle nous sommes partis d’une liste de 25 podcasts aux profils différents parmi ceux que nous écoutons (des anciens, des nouveaux, des très connus, des moins connus, etc). Nous agrandissons la liste et affinons le modèle chaque mois en ajoutant une dizaine de podcasts à la fois. Le formulaire est là pour canaliser les suggestions, tout podcast proposé via le formulaire arrivera dans tôt ou tard dans la liste.


Vous avouez vous-même que vous n'avez pas de données fiables !

C’est vrai qu’il n’existe pas de source unique, neutre et reconnue qui fournit le nombre d’écoutes ou le nombre de téléchargements de tous les podcasts existants. C’est bien pour ça que l’on passe par un modèle pour estimer le nombre d’écoutes. Mais dans le calcul du score les autres variables ne sont pas des estimations.

Pour le moment, nous précisons que nous sommes en BETA et que nous affinons nos formules régulièrement (pour ceux que ça intéresse : le R2 est actuellement de 0.98).


Est-ce qu'un tel classement est pertinent ?

Peut-être, peut-être pas. C’est avant tout le résultat d’une petite expérience qu’on a fait dans notre coin et dont nous avons trouvé le résultat intéressant à partager.


Contact



Changelog


Octobre 2017

  • Changement du calcul de la périodicité. Maintenant les fréquences de publication suivent la règle suivante: Décompte du nombre d'épisodes publiés sur les 30 derniers jours, si 0 alors décompte du nombre d'épisodes publiés sur les 120 derniers jours ramenés à nue moyenne mensuelle, si 0 alors sortie du classement.
  • Ajout des podcasts qui ont republié ce mois-ci
  • Retrait des podcasts sans publication depuis 4 mois.
  • Début de l'automatisation du script d'affichage de la page web avec ue version dynamique qui nous permet de générer automatiquement le script depuis notre base de données
  • Ajout des podcasts en ayant fait la demande depuis la dernière mise à jour.

Septembre 2017

  • Renforcement du calcul du modèle avec les confirmations de certains podcasts.
  • Retrait des podcasts sans publication depuis 4 mois.
  • Correction du facteur d'affiliation pour les podcasts du network Geekzone.
  • Ajout des podcasts en ayant fait la demande depuis la dernière mise à jour.

Aout 2017

  • Changement de modèle avec l'utilisation de 4 modèles prédictifs au lieu d'un.
  • Envoi de messages de confirmation pour les podcasts ayant plus de 1000 écoutes pour faire valider les fourchettes.
  • Changement de l'affichage des vignettes en image complète à tableau html.
  • Correction du facteur d'affiliation pour les podcasts du network RadioKawa.
  • Ajout des podcasts en ayant fait la demande depuis la dernière mise à jour.

Juillet 2017

  • Changement du logo et ajout de la notion de BETA.
  • Changement du mode de présentation des audiences et des autres facteurs ayant un rôle dans le score Podcastéo (qui est maintenant un trigramme). Nous avons fait ce choix pour des raisons de qualité de nos estimations qui ne sont pas assez précises aujourd'hui pour donner un chiffre exact à 10% près.
  • Correction des facteurs d'estimation d'audience via de nouvelles données fiabilisées pour se rapprocher du critère de qualité souhaité.
  • Ajout des podcasts de FrenchSpin suite à une décision du comité d'éthique Podcastéo.
  • Correction du facteur d'affiliation pour les podcasts du network RadioKawa.
  • Ajout des podcasts en ayant fait la demande depuis la dernière mise à jour.
  • L'à propos devient l'avant propos.
  • Ajout des échelles pour comprendre les notes.
  • Ajout d'une FAQ pour répondre aux questions les plus couramments posées
  • Création d'un compte twitter dédié.

Juin 2017

  • Ajout d'un facteur de dégénérance du nombre d'avis iTunes en fonction de l'âge via un logarithme. Cela est non impactant pour les podcasts de moins de 3 ans.
  • Ajout des podcasts de Slate, RadioKawa et BingeAudio pour faire fonctionner l'affiliation des podcasts de ces réseaux et ainsi corriger leurs estimations.
  • Changement de la présentation des audiences : auparavant en audience mensuelle cumulée, maintenant en audience par épisode 30 jours après la diffusion de l'épisode.
  • Modification mineure des facteurs du modèle.
  • Ajout des podcasts ayant été demandés.
  • Création de la section "Changelog".