Extraction De Données sur Le Web

Formation

À Malakoff Cedex

1 380 € TTC

Description

  • Typologie

    Formation

  • Dirigé à

    Pour professionnels

  • Lieu

    Malakoff cedex

  • Durée

    3 Jours

La formation apporte aux participants les notions théoriques et les réponses pratiques indispensables à la mise en œuvre des techniques d’acquisition automatisées de données sur le web. Le cours aborde les formats de données courant disponibles sur le web et les méthodes d’extraction de ces données structurées ou semi-structurées depuis une page web (“web scraping”) ou une interface de programmation.

Précisions importantes

Modalité Formation continue

Les sites et dates disponibles

Lieu

Date de début

Malakoff Cedex ((92) Hauts-de-Seine)
Insee Timbre J401 - 3, Avenue Pierre Larousse, 92245

Date de début

Consulter

À propos de cette formation

Connaissances de base en traitement de données, programmation, notions de HTML.

Questions / Réponses

Ajoutez votre question

Nos conseillers et autres utilisateurs pourront vous répondre

À qui souhaitez-vous addresser votre question?

Saisissez vos coordonnées pour recevoir une réponse

Nous ne publierons que votre nom et votre question

Emagister S.L. (responsable du traitement) traitera vos données pour mener des actions promotionnelles (par e-mail et/ou téléphone), publier des avis ou gérer des incidents. Vous pouvez consulter vos droits et gérer votre désinscription dans la politique de confidentialité.

Les Avis

Le programme

Les droits d’utilisation des données disponibles sur le web

  • Présentation des concepts de licences sur les données, du mouvement OpenData et des principales licences.

Les types de données disponibles sur le web

  • Explication des formats HTML, XML, JSON, RSS.

Concepts de protocoles réseau

  • Notions de client/serveur, TCP/IP, requêtes HTTP GET/POST.

Récupérer des données fournies par une interface de programmation (API)

  • Définition d’une API, requêtage, exemples pratiques avec R.

Récupérer des données d’un site web

  • Définition du web scraping, parcours de pages web, extraction de données via XPath/regex, exemples pratiques avec R.

Exemples d’outils pour faciliter le web scraping

  • Outils pour extraire depuis des sites statiques ou sites fortement dynamiques (ajax): Yahoo Pipes!, Scrapy, PhantomJS, etc.

Problèmes avancés d’extractions de données

  • Ordonnancement, proxy, authentification, erreurs HTTP.

Extraction De Données sur Le Web

1 380 € TTC