Veiller la voix : une tendance lourde en intelligence économique

Depuis quelques années, la voix est de plus en plus prisée afin de commander nos smartphones ou nos assistants vocaux, mais également pour avoir accès à des informations de plus en plus larges. La journée mondiale de la radio, ce lundi 13 février, nous permet de faire le point sur cette forte inclination, qui touche aussi le secteur de la veille.

La tendance est sociétale et elle agit depuis plusieurs années comme une lame de fond : de plus en plus d’organisations se mettent en quête du son – voire de la radio – afin de parfaire leur veille. Il faut dire que le marché de la reconnaissance vocale est, tous secteurs et toutes activités continues, en plein essor. Evalué à quelque 10,7 Mds $ US en 2020 (9,87 Mds €), il devrait atteindre 27,15 Mds $ US à l’échéance 2026 (25,04 Mds €), avec un taux de croissance annuel de près de 17% (Source : Mordor Intelligence).


Des sources orales captées grâce au Speech to Text

Dans le champ de l’intelligence économique, de plus en plus d’organisations sont en demande de solutions de veille capables de surveiller à la fois des contenus audio et des sources vidéo. Conférences, discours, podcasts, webinaires, ateliers, réunions… Les solutions de veille les plus qualitatives et les plus expérimentées du marché s’attachent à capter ces sources d’information multiples et parfois très qualitatives, afin de les transformer en textes.

Technologie de pointe développée spécifiquement, le Speech to Text permet tout particulièrement d’opérer une veille remarquable sur Youtube, véritable vitrine pour la quasi-totalité des organisations. Il est également très prisé par les documentalistes (lorsqu’il y en a au sein des entreprises) ainsi que par les structures scientifiques. Car les contenus sont légion, y-compris sur certains réseaux sociaux), pour consolider des connaissances parfois très pointues, pour ne pas dire de niche.


De nouvelles étapes à franchir

Telle qu’elle se présente aujourd’hui, la conversion de la parole en textes n’en est toutefois qu’à ses premiers balbutiements. En l’espèce, nous observons que le temps de la maturité est à venir. D’ici là, quelques caps demeurent encore à franchir. Nous pouvons en retenir au moins deux.

Le premier est d’ordre juridique, et nous renvoie au RGPD, le Règlement Général sur la Protection des Données. La voix de chacun d’entre nous constitue en effet une donnée biométrique. Elle permet de reconnaître le locuteur, et à ce titre elle se trouve protégée par plusieurs législations de protection des données. Pour le dire autrement, tout contrôle et toute exploitation de ces données se trouvent strictement encadrés, générant parfois la suspicion des personnes dont les informations sont collectées (par exemple dans le cadre d’un webinaire ou d’une conférence).

Le second cap qu’il conviendra de franchir à l’avenir est plus directement lié à la veille économique qui s’opère parmi les informations issues des médias radios – et singulièrement des podcasts. Certes, ces derniers (de plus en plus nombreux sur les plateformes de nos radios, à l’image de Radio France) constituent des sources précieuses, parce que souvent centrées sur des enjeux pointus. Il convient toutefois de savoir qu’à ce jour de nombreux médias refusent que leurs podcasts se trouvent captés. Pour que cela soit le cas, il faut passer par Youtube… si toutefois le contenu y a été déposé par la radio en question !

Au-delà de ces écueils, une chose reste sûre : au niveau des services comme des usages, de plus en plus d’appareils intègrent la voix comme principal vecteur d’expression ou de commande. Des assistants vocaux à nos smartphones, une part de plus en plus grande de nos environnements numériques ne nous obéissent plus seulement au doigt et à l’œil, mais bel et bien à la voix. Le secteur de l’intelligence économique n’y échappera pas et sera, quoi que l’on en pense, amené à poursuivre dans cette voie.

Learn More

AVEC KB CRAWL, LA VEILLE S’ÉTEND AUX VIDÉOS ET AUX CONTENUS AUDIOS !

La solution de veille informationnelle KB Crawl vient d’intégrer deux fonctions nouvelles. Attendues par de nombreuses organisations, elles permettent d’élargir la veille aux images, aux modules vidéo ainsi qu’aux formats audio. Une indéniable avancée pour les veilleurs.

Les podcasts n’en finissent plus de crever le plafond de verre : au mois de décembre dernier, l’institut Médiamétrie comptabilisait 179 millions d’écoutes ou de téléchargements de podcasts en français à travers le monde, soit une hausse de 4,7 millions en un seul mois ! Cette évolution récente vient compléter celle des images et des vidéos. En 2022, une plateforme telle que Youtube bat tous les records d’audience : 2 milliards d’utilisateurs actifs par mois et 500 heures de vidéo mises en ligne chaque minute ! Ainsi, toute stratégie média qui se respecte passe désormais par l’image et le son… Autant de raisons qui ont poussé KB Crawl à améliorer sa solution de veille informationnelle.


Une fonction de reconnaissance optique des caractères

Deux nouveautés KB Crawl permettent désormais d’accéder à la surveillance ainsi qu’à la collecte des informations de son, d’image et de vidéo qui se trouvent de plus en plus déployées sur Internet. Basées sur des développements propres et sur les technologies open source les plus abouties du marché, elles recouvrent deux fonctions distinctes et complémentaires.

La première est relative à l’« océrisation », c’est-à-dire à la reconnaissance optique des caractères. Elle s’applique aux fichiers image et permet de lire des textes inscrits sur des photos. Messages publicitaires, banderoles… L’outil interprète ces éléments et les retranscrit. Il permet au passage de décrypter certains articles ou PDF au format image, illisibles jusqu’alors par les outils de veille traditionnels.


Analyser les contenus audios et vidéos

La seconde fonction concerne la possibilité d’analyser des contenus audios ou vidéos, via une technologie de type « speech to text ». Le progrès est significatif : si l’on savait jusqu’à présent opérer de la veille sur le titre ainsi que sur la description et les commentaires d’une vidéo, il était en revanche impossible de repérer l’énonciation orale de tel ou tel sujet. C’est désormais chose faite avec cette nouvelle fonction d’analyse de contenus, qui alerte les utilisateurs dès lors qu’un mot clé prédéfini est traité au sein d’une vidéo ou d’un format audio (de type podcast par exemple). Une fois repéré, ce contenu peut être partagé via son lien, mais également être rediffusé en version texte. Un élément décisif qui permettra d’affiner toute analyse.

Ces nouvelles fonctionnalités font l’objet de tutoriels développés par KB Crawl et mis à la disposition de ses clients. Les équipes KB Crawl se tiennent également à la disposition des organisations pour toute demande d’approfondissement.

Un webinar dédié à ces deux nouveautés sera organisé par KB Crawl au mois de septembre.

Learn More