Youtube rajoute des sous-titres automatiques pour toutes les vidéos

On peut certainement dire que Youtube est l’une des plus grandes réussites du Web 2.0, cependant lorsque vous êtes malentendant, le site perd fortement de son intérêt. A partir d’aujourd’hui, ce ne sera plus le cas. En effet Google va mettre en place le sous-titrage automatique des vidéos (en langue anglaise) de Youtube. Jusqu’à présent les vidéos concernées ne pouvaient être qu’émises par un partenaire préalablement désigné par Youtube. Celles-ci étaient analysées par un logiciel de reconnaissance vocale mis en place par Google.

Il y aura quelques 700 millions de personnes qui soufreront de problème de surdités d’ici 2015, alors que parallèlement le contenu du web migre vers toujours plus de contenu multimédias, dont la vidéo. Et c’est justement dans le cadre de ce futur paradoxe que Google veut se positionner en rendant ce type de contenu plus accessible aux malentendants. Grâce à la technologie déployée par le géant de l’internet, les vidéos peuvent être sous-titrées dans plus de 50 langues.

Il est certain qu’il y aura un petit temps de latence avant que toutes les vidéos soient disponibles avec sous-titres, car il faut bien mettre cet effort face au rythme d’upload que connait actuellement Youtube. Le rapport par minute de contenu envoyé sur Youtube, est aujourd’hui de 20 minutes par minute.

Dès que l’option sera disponible, il vous suffira à n’importe quel moment de votre visionnage d’activer la transcription en cliquant sur le lien correspondant. Bien sûr la reconnaissance des mots n’est pas complètement au point et des erreurs persistent, surtout si les voix sont peu audibles. Mais qu’à cela ne tienne, Google a pensé à tout, car il sera très facile de télécharger la transcription pour la corriger.

Voici les recommandations de Google pour que votre vidéo soit bien retranscrite :

  • Dans un premier temps, seul les vidéos en langue anglaise seront transcrites automatiquement. Les autres langues arriveront par la suite.
  • Les voix doivent être audibles et les mots bien articulés, si vous voulez que le logiciel les identifie. Les vidéos qui possèdent un fond sonores trop important ne pourront être transcrites. (Cela réduit largement le champ de vidéos aux discours politiques, interventions organisées ou encore court métrage.

Ce billet est une traduction personne d’un billet de ReadWriteWeb.

Edit de Louis : Pour moi, l’humanisme de Google n’est pas très important… et je persiste à croire que Youtube reste un terrain de test pour la reconnaissance vocale qui doit être « mise en production » au sein de Google Voice, afin de savoir transcrire les conversations de ceux qui n’ont pas (pas encore ?) de problèmes auditifs, et ainsi leur associer des termes, des goûts, et… des publicités. Donc point d’humanisme, mais un calcul, qui, je le reconnais tout à fait, apportera son lot de bonnes choses pour l’utilisateur (je suis de ceux qui attendent le plus l’arrivée de Google Voice pour la langue Française).

Pour le reste, je pense que ce système n’est autre qu’un système d’amélioration de l’algorithme par « correction humaine », exactement comme ce qui avait été mis en place sur Google Translate, où l’on pouvait (et l’on peut toujours) améliorer la traduction proposée par Google, et ainsi (on l’imagine), améliorer progressivement les réponses apportées par l’algorithme.