Veiller le deepweb, nouvel objectif stratégique des organisations ?

Veiller le deepweb : explosion du big data oblige, institutions et entreprises prennent peu à peu conscience de la mine d’informations précieuses que recèle le deepweb, ou web profond.

Veiller le deepweb élargit le potentiel d’accès à l’information. Un résultat situé entre 80 et 96% sur l’ensemble des données en circulation sur Internet.

Aussi appelé web invisible, le deepweb se compose de toutes les données non indexées en circulation sur Internet. C’est-à-dire toutes celles qui ne remontent pas ‘’à la surface’’, par une requête simple sur les moteurs de recherche généralistes type Google. Cela comprend tous les contenus des réseaux sociaux, des webmails, des sites payants. De façon générale, veiller le deepweb vise à accéder à des contenus nécessitant une authentification de l’utilisateur, c’est-à-dire une identification par login et mot de passe.

KB Crawl se positionne sur ce secteur depuis plus de dix ans, intégrant à sa solution une fonction capable de veiller le deepweb, explique Bruno Etienne. Nous pouvons crawler des moteurs de recherche spécifiques, y compris internes à des sites, y compris complexes et multicritères. C’est un service très spécifique, qui va au-delà des solutions de veille basiques. Il permet une surveillance sur mesure, que l’utilisateur configure selon ses besoins particuliers.

 

Les clients demandeurs de veiller le deepweb sont ceux qui ont besoin d’identifier des signaux faibles. Pour anticiper d’éventuelles fraudes ou menaces, ou plus simplement pour surveiller des tendances. Pour des organisations qui font de la veille innovation, crawler le deepweb permet ; de surveiller les sites de concurrents, les bases documentaires brevets, les bases de données universitaires, les sites de crowdfunding liés à la recherche. La veille tarifaire aussi utilise les informations dites « grises » du deepweb (cf article « Comment accéder à l’information grise pour obtenir une veille stratégique complète »), pour observer l’évolution des prix des produits, par exemple, sur chacun des moteurs de recherche de sites concurrents. Dans un autre registre – celui des services étatiques liés à la sécurité, la criminalité, les fraudes, etc. Il peut s’agir de scruter des forums et des groupes de discussion, des réseaux sociaux, pour y surveiller des activités illicites, potentiellement dangereuses ou menaçantes. La veille des médias sociaux s’avère aussi de plus en plus stratégique pour des organisations qui doivent gérer leur e-réputation.

Ainsi veiller le deepweb constitue-t-il un nouveau continent d’exploration pour les veilleurs. A ne pas confondre – comme c’est pourtant souvent le cas, y compris dans la presse spécialisée, avec le darkweb (ou darknet). Ce dernier est un Internet parallèle. Il fonctionne sur le principe d’anonymisation de la zone d’origine des échanges, et constitue le lieu privilégié de la cybercriminalité et des trafics en tous genres. On y accède par le biais de réseaux informatiques mondiaux décentralisés. Le plus célèbre étant Tor (acronyme de « The Onion Router »). « Pour l’heure il est techniquement impossible de veiller le darkweb de façon automatisée, affirme Bruno Etienne. Car pour infiltrer les réseaux du darkweb, hyper-contrôlés, il faut forcément appliquer une démarche humaine. Les hackers qui y sévissent veillent à la sûreté des échanges. Et ils ont toujours un coup d’avance ! ».

Si veiller le darkweb reste utopique en 2018, l’accès aux milliards de pages du deepweb est devenu une possibilité sur laquelle les organisations à fort enjeu économique ou stratégique ne peuvent plus faire l’impasse.

Learn More

Comment accéder à l’information grise pour obtenir une veille stratégique complète ?

Faire une veille superficielle et se contenter de l’information blanche n’est aujourd’hui plus démarquant. Accéder à l’information grise devient un enjeu critique. Comment atteindre ces données difficiles d’accès ?

Information blanche : un accès facilité

Pour que la veille soit efficace et soit un outil pertinent, il faut qu’elle soit constituée d’informations de qualité. L’accès y est souvent restreint on la nomme alors information blanche, c’est-à-dire celle facile à consulter car libre d’accès. 

Information blanche : un impact moindre sur la prise de décision
l’information blanche est facile à consulter car libre d’accès

Néanmoins, si ces informations sont facilement consultables, cela signifie tout le monde peut les consulter, que ces informations sont connues de beaucoup de monde. L’information blanche est de l’information accessible donc l’accès n’est pas restreint. Elle peut être recueillie dans la presse, sur internet, dans les banques de données, etc.
Ces informations peuvent avoir un impact moindre sur la prise de décision. Le décideur sait que sa décision n’aura pas l’avantage d’être anticipative ou exclusive par rapport aux mouvements du marché.

Information grise, plus difficile à consulter mais légale

Il est essentiel de parvenir à obtenir des informations de qualité et d’avoir accès à un autre type d’information, dites information grise, légalement accessible mais difficile d’accès. C’est une information inconnue du public, mais qui n’a pas été recueillie de manière illégale. Laissons de côté l’information noire, protégée par des contrats ou des textes juridiques.
Plus difficile d’accès, l’information grise est plus rare, mais essentielle pour se démarquer.  

Information grise : il faut la chercher pour la trouver
Typologie de l’information : l’information grise est démarquante

Comment accéder à l’information grise ?

1 – Accès par le Web invisible

Surveiller le web invisible devient une nécessité pour qui veut obtenir de l’information démarquante. Pour cela, il est essentiel d’avoir accès au contenu non indexé par les moteurs de recherche. Les enregistreurs de macro sont un moyen efficace de mettre sous surveillance des pages protégées et accessibles uniquement par identification, ou encore de visiter des pages générées par des formulaires dynamiques. Ces pages, non référencés par les moteurs de type Google, contiennent de l’information grise.

2 – Formalisation de la remontée d’information grise

L’entreprise peut ne pas se contenter de chercher ses informations de veille sur internet, où la plupart des informations sont blanches. L’un des moyens d’obtenir de l’information grise est grâce à la collaboration. Les lecteurs de la veille doivent devenir veilleurs à leur tour, en partageant les informations auxquels ils sont accès. Les informations peuvent provenir de personnes qui ne sont pas veilleurs. La force de vente est notamment une source d’information grise, grâce au contact avec les fournisseurs et clients externes, qui apportent des informations orales qui ne sont pas accessibles par internet.
Formaliser la remontée d’informations et systématiser le partage de ces informations est essentiel et peut être facilement mis en place, en créant des canaux de communication directe entre les collaborateurs de la société et le département de veille :

  • L’activation d’une adresse email récipiendaire d’informations dans la plateforme de veille permet de regrouper toutes les informations et de les transformer aisément en articles, en un clic.
  • Il est également possible de donner le droit à tous ou certains de ses utilisateurs de créer des articles, qui seront automatiquement publiés ou devront être validés par un veilleur.
l’aspect coopératif de la veille peut être entériné grâce à un espace collaboratif
Information grise et coopération des collaborateurs commerciaux

Si la veille est gérée par le département de veille, nombreux sont ceux qui pensent qu’il ne doit pas être l’unique acteur de la veille. Pour aller plus loin que de simples canaux de communication, l’aspect coopératif de la veille peut être entériné grâce à un espace collaboratif. L’utilisateur de la plateforme de veille passe alors du statut de lecteur à celui d’acteur. Il peut suggérer du contenu, publier des articles et participer à des groupes de discussion. De cet effort collaboratif et de cette rencontre des esprits peuvent émerger de l’information grise plus conséquente que l’équipe de veille n’aurait pu regrouper d’elle-même.

Learn More