Scraper gratuitement les stratups de la BPI sans une ligne de code

Dans la continuité de notre article du 21 janvier 2021 qui détaillait comment réaliser un ciblage qui convertit grâce à LinkedIn, nous allons voir aujourd’hui comment scraper – c’est-à-dire extraire les données qui nous intéressent – un annuaire d’entreprises.

Notre cible sera la BPI et son hub de plus de 1300 startups françaises.

Cette méthode est accessible à tout le monde et ne nécessite aucune connaissance particulière en programmation. Elle est rapide avec simplement 4 étapes, repose sur des outils simples et elle est entièrement GRATUITE !

Allons-y et dans 10 minutes nous aurons un nouveau ciblage 👊

👉 Etape 1 : Identifier la structure de l’URL de la BPI

Les équipes de la BPI référencent et valident plus de 1300 startups françaises. Elles sont toutes accessibles sur le site de la BPI dans la section “le hub” où il est possible d’effectuer des recherches en fonction de mots clés, de technologies, de métiers ou de marchés.

Nous commençons en allant sur la page de recherche d’une startup : https://lehub.web.bpifrance.fr/search

Et continuons en consultant la page de la première startup. Elle est riche en informations diverses de présentation de la société.
Ce qui va nous intéresser est la composition de l’URL de cette page :
https://lehub.web.bpifrance.fr/startup/ + le nom de la société

La première partie de l’URL est la racine commune à toutes les URLs de pages de présentation de startups. Il suffit de consulter quelques pages additionnelles pour s’en rendre compte.

Cette racine est la clé que nous allons utiliser pour réaliser le scraping.

👉 Etape 2 : Google, notre meilleur ami pour obtenir toutes les pages de startups

Maintenant, utilisons une recherche Google pour obtenir toutes les pages web ayant comme racine l’URL : https://lehub.web.bpifrance.fr/startup/.

Rien de plus simple, l’astuce réside dans l’utilisation de l’opérateur “site:” dont la fonction est de forcer Google à effectuer sa recherche sur des URLs contenant la racine indiquée.

La recherche à réaliser est donc : “site:lehub.web.bpifrance.fr/startup/”

Vérifions que le résultat est cohérent, le site de la BPI annonce 1342 startups, la recherche Google donne environ 1270 résultats. C’est bon !

👉 Etape 3 : “Scaper” les données de la recherche Google

Il existe de nombreux outils pour “scraper” les données de pages internet. Nous utiliserons Instant Data Scraper. Il se présente sous la forme d’une extension Chrome et son utilisation est d’une simplicité déconcertante.

Une fois installé et sur la page de résultats de Google, il suffit de cliquer sur l’icône de l’extension et une nouvelle fenêtre s’ouvrira avec les principales données extraites.

Enfin, téléchargeons le fichier CSV associé. Rien à faire 👏 !

👉 Etape 4 : Nettoyage de la base

Il ne nous reste plus qu’à importer ce fichier dans notre tableur préféré pour supprimer les colonnes inutiles, nettoyer les champs et finaliser le ciblage.

Ce ciblage pourra maintenant être utilisé avec des outils complémentaires tels que LinkedIn Sales Navigator pour constituer des audiences d’une excellente qualité !

👉 Le mot de la fin

Cette technique simple et efficace permet de travailler avec une plus grande précision les ciblages. Malgré toutes les solutions d’automatisation, nous privilégierons toujours chez BAAX la qualité sur la quantité.

L’enjeu d’une bonne démarche d’acquisition est de proposer le bon message, à la bonne personne et au bon moment. Les taux de conversion n’en seront que meilleurs.

A vous de jouer maintenant !