Comment récupérer les données d’Instagram en utilisant Python
Instagram fait partie des sites de réseaux sociaux les plus en vue avec des milliards d’utilisateurs. Tout le monde, des élèves aux célébrités, possède un compte Instagram. Les données publiques d’Instagram peuvent être d’une immense valeur pour les services, les professionnels du marketing, ainsi que pour les personnes. Toute personne peut utiliser ces informations pour faire des analyses de données, cibler la publicité et produire des insights.
Vous pouvez faire usage de Python pour construire un outil automatisé qui extrait les données d’Instagram.
Installation des bibliothèques requises
Instaloader est une bibliothèque Python que vous pouvez utiliser pour retirer les informations publiques facilement accessibles d’Instagram. Vous pouvez accéder à des données comme les photos, les clips vidéo, le nom d’utilisateur, le nombre de publications de blog, la matière des followers, la matière des adhérents, la bio, etc. en utilisant Instaloader. Gardez à l’esprit qu’Instaloader n’est pas connecté à, accrédité, conservé ou soutenu par Instagram quel qu’il soit.
Pour monter instaloader via pip, exécutez la commande suivante :
Vous devriez avoir pip configuré sur votre système pour installer des collections Python externes.
Ensuite, vous devez configurer la collection Python Pandas. Pandas est une collection Python qui est principalement utilisée pour effectuer l’ajustement de l’information ainsi que l’analyse des données. Exécutez la commande suivante pour la monter :
Maintenant, vous êtes prêt à commencer à établir le code et à faire sortir les données d’Instagram.
Mise en place de votre code
Pour mettre en place le dispositif d’apport de données Instagram, vous devez importer la collection Python Instaloader et également créer une instance de la classe Instaloader. Ensuite, vous devez donner le handle Instagram du compte duquel vous voulez extraire les informations.
Le code Python de l’extracteur Instagram est facilement disponible dans un dépôt GitHub et vous pouvez l’utiliser gratuitement sous la licence MIT.
Il s’agit d’une excellente étape initiale pour inspecter la fonction fondamentale. Vous devez voir des informations significatives sans aucune erreur :
Extraction des données du profil
Vous pouvez supprimer des informations bénéfiques facilement accessibles au public comme le nom d’utilisateur, le nombre d’articles, le nombre de fans, la matière adhérente, la biographie, l’ID utilisateur, ainsi que l’URL extérieure en utilisant Instaloader avec simplement quelques lignes de code. Vous devez simplement fournir l’adresse Instagram du compte.
Vous devriez voir de nombreuses informations sur le compte à partir de la gestion que vous définissez :
Extraction des e-mails à partir de la bio
Vous pouvez extraire les adresses e-mail de la biographie Insta de tout type de profil en utilisant des expressions normales. Vous devez importer le programme Python. re et également passer l’expression régulière pour la vérification de l’e-mail en tant que critère à la collection re. findall() méthode :
Le script va certainement imprimer tout ce qu’il reconnaît comme une adresse électronique dans la biographie :
Extraction des données des meilleurs résultats de recherche
Lorsque vous recherchez quelque chose sur Instagram, vous obtenez de nombreux résultats, y compris des noms d’utilisateurs et des hashtags. Vous pouvez extraire les meilleurs résultats de recherche en utilisant l’outil de recherche. get _ accounts() et get _ hashtags() techniques. Il suffit de proposer la requête de recherche dans le champ instaloader. TopSearchResults() approche. En outre, vous pouvez répéter ainsi qu’imprimer/stocker les résultats spécifiques.
La sortie inclura certainement tout type de noms d’utilisateurs et également de hashtags correspondants :
Extraction des suiveurs & & Followings d’un compte
Vous pouvez extraire les followers d’un compte, et aussi ceux qu’il suit lui-même, en utilisant Instaloader. Vous devrez donner un nom d’utilisateur et aussi un mot de passe Instagram pour récupérer ces informations.
N’utilisez jamais vos comptes personnels pour extraire des informations d’Instagram car cela pourrait obtenir la mise hors la loi momentanée ou permanente de votre compte.
Après avoir produit une circonstance de la classe Instaloader, vous devez fournir votre nom d’utilisateur ainsi que votre mot de passe. Cela permet de s’assurer que le robot peut se connecter à Instagram en utilisant votre compte et également récupérer les informations sur les fans ainsi que les followings.
Ensuite, vous devez fournir le manageur Instagram du compte cible. Le site get _ fans() et get _ followees() permettent d’obtenir les fans et les followees. Vous pouvez obtenir les noms d’utilisateur des fans ainsi que des followees en utilisant la technique follower. username ainsi que followee. nom d’utilisateur propriétés spécifiquement.
Si vous souhaitez stocker le plomb à un fichier CSV, vous devez d’abord transformer les données droit dans un Pandas DataFrame choses. Utilisez les propriétés pd. DataFrame() approche pour convertir un objet de liste de contrôle en un DataFrame.
Enfin, vous pouvez exporter l’objet DataFrame vers une donnée CSV en utilisant l’approche à _ csv() méthode. Vous devez passer l’objet nom de fichier. csv comme paramètre à cette technique pour obtenir les informations exportées dans le format des documents CSV.
Seuls les propriétaires des comptes peuvent voir tous les fans et les followings. Vous ne serez pas en mesure de tirer toutes les informations sur les fans et les followings en utilisant cette méthode ou tout type de méthode diverse.
Télécharger les publications d’un compte Instagram
Encore une fois, pour télécharger et installer des messages à partir de n’importe quel compte, vous devrez fournir un nom d’utilisateur ainsi qu’un mot de passe. Ceci afin que le robot puisse se connecter à Instagram en utilisant votre compte. Vous pouvez récupérer toutes les données des messages en utilisant l’option get _ blog posts() approche. De même, vous pouvez itérer et également télécharger tous les messages individuels en utilisant l’approche get _ blog posts() .télécharger _ post()technique.
Scraper le Web en utilisant Python
Le grattage de données ou grattage du Web est l’un des moyens les plus typiques pour tirer des détails utiles d’Internet. Vous pouvez utiliser les informations que vous retirez pour la publicité et le marketing, le développement de matériel ou la prise de décision.
Python est le langage privilégié pour le data scraping. Des bibliothèques comme BeautifulSoup, Scrapy, ainsi que Pandas simplifient le retrait, l’analyse et la visualisation des informations.
Comment puis-je obtenir des données Instagram à partir de Python ?
Après l’installation, créez simplement un fichier python et mettez ces codes et exécutez-le 🙂 avec ce code, vous pouvez;
- Obtenez la photo de profil des utilisateurs.
- Téléchargez de temps en temps les données de publication des utilisateurs telles que des images, des médias ou des biographies.
- Téléchargez les données de publication du hashtag.
- Obtenez tous les noms d’abonnés de l’utilisateur.
- Obtenez tous les noms suivants de l’utilisateur.
Comment puis-je extraire des données d’Instagram ?
Appuyez sur ou sur votre photo de profil en bas à droite pour accéder à votre profil. Appuyez sur en haut à droite, puis appuyez sur Votre activité. Appuyez sur Télécharger vos informations. Saisissez l’adresse e-mail à laquelle vous souhaitez recevoir un lien vers vos données, puis appuyez sur Demander le téléchargement.
Est-il légal de supprimer des données d’Instagram ?
Cette personne peut être poursuivie en vertu de la loi sur l’intrusion dans les biens mobiliers, la violation du Digital Millennium Copyright Act (DMCA), la violation du Computer Fraud and Abuse Act (CFAA) et le détournement. Cela ne signifie pas que vous ne pouvez pas gratter les canaux de médias sociaux comme Twitter, Facebook, Instagram et YouTube.
Comment utiliser l’API Instagram avec Python ?
Un processus en cinq étapes
- Assurez-vous que Python est installé sur votre serveur.
- Obtenez une clé API.
- Abonnez-vous à l’API Instagram.
- Créez un modèle de sortie en Python.
- Utilisez-le dans différents contextes.