Veiller la voix : une tendance lourde en intelligence économique

Depuis quelques années, la voix est de plus en plus prisée afin de commander nos smartphones ou nos assistants vocaux, mais également pour avoir accès à des informations de plus en plus larges. La journée mondiale de la radio, ce lundi 13 février, nous permet de faire le point sur cette forte inclination, qui touche aussi le secteur de la veille.

La tendance est sociétale et elle agit depuis plusieurs années comme une lame de fond : de plus en plus d’organisations se mettent en quête du son – voire de la radio – afin de parfaire leur veille. Il faut dire que le marché de la reconnaissance vocale est, tous secteurs et toutes activités continues, en plein essor. Evalué à quelque 10,7 Mds $ US en 2020 (9,87 Mds €), il devrait atteindre 27,15 Mds $ US à l’échéance 2026 (25,04 Mds €), avec un taux de croissance annuel de près de 17% (Source : Mordor Intelligence).


Des sources orales captées grâce au Speech to Text

Dans le champ de l’intelligence économique, de plus en plus d’organisations sont en demande de solutions de veille capables de surveiller à la fois des contenus audio et des sources vidéo. Conférences, discours, podcasts, webinaires, ateliers, réunions… Les solutions de veille les plus qualitatives et les plus expérimentées du marché s’attachent à capter ces sources d’information multiples et parfois très qualitatives, afin de les transformer en textes.

Technologie de pointe développée spécifiquement, le Speech to Text permet tout particulièrement d’opérer une veille remarquable sur Youtube, véritable vitrine pour la quasi-totalité des organisations. Il est également très prisé par les documentalistes (lorsqu’il y en a au sein des entreprises) ainsi que par les structures scientifiques. Car les contenus sont légion, y-compris sur certains réseaux sociaux), pour consolider des connaissances parfois très pointues, pour ne pas dire de niche.


De nouvelles étapes à franchir

Telle qu’elle se présente aujourd’hui, la conversion de la parole en textes n’en est toutefois qu’à ses premiers balbutiements. En l’espèce, nous observons que le temps de la maturité est à venir. D’ici là, quelques caps demeurent encore à franchir. Nous pouvons en retenir au moins deux.

Le premier est d’ordre juridique, et nous renvoie au RGPD, le Règlement Général sur la Protection des Données. La voix de chacun d’entre nous constitue en effet une donnée biométrique. Elle permet de reconnaître le locuteur, et à ce titre elle se trouve protégée par plusieurs législations de protection des données. Pour le dire autrement, tout contrôle et toute exploitation de ces données se trouvent strictement encadrés, générant parfois la suspicion des personnes dont les informations sont collectées (par exemple dans le cadre d’un webinaire ou d’une conférence).

Le second cap qu’il conviendra de franchir à l’avenir est plus directement lié à la veille économique qui s’opère parmi les informations issues des médias radios – et singulièrement des podcasts. Certes, ces derniers (de plus en plus nombreux sur les plateformes de nos radios, à l’image de Radio France) constituent des sources précieuses, parce que souvent centrées sur des enjeux pointus. Il convient toutefois de savoir qu’à ce jour de nombreux médias refusent que leurs podcasts se trouvent captés. Pour que cela soit le cas, il faut passer par Youtube… si toutefois le contenu y a été déposé par la radio en question !

Au-delà de ces écueils, une chose reste sûre : au niveau des services comme des usages, de plus en plus d’appareils intègrent la voix comme principal vecteur d’expression ou de commande. Des assistants vocaux à nos smartphones, une part de plus en plus grande de nos environnements numériques ne nous obéissent plus seulement au doigt et à l’œil, mais bel et bien à la voix. Le secteur de l’intelligence économique n’y échappera pas et sera, quoi que l’on en pense, amené à poursuivre dans cette voie.