Comment valider une URL à l’aide d’expressions régulières
La programmation a rendu facile la gestion d’informations textuelles structurées aussi bien que désorganisées. Des outils comme les expressions régulières et les collections extérieures rendent ces tâches beaucoup plus simples.
Vous pouvez utiliser la plupart des langages, y compris Python et aussi JavaScript, pour confirmer des URL en utilisant une expression régulière. Cette instance regex n’est pas idéale, pourtant vous pouvez l’utiliser pour examiner les URLs pour des instances d’utilisation basiques.
Une expression régulière pour valider une URL
La regex pour confirmer une URL proposée dans ce post n’est pas la meilleure. Il peut y avoir de nombreux exemples d’URL légitimes qui peuvent échouer à la reconnaissance de cette regex. Il s’agit d’URL comportant des adresses IP, des personnalités non ASCII et des méthodes comme FTP. La regex conforme ne valide que les URL les plus habituelles.
La regex considérera certainement une URL légitime si elle satisfait aux conditions ci-dessous :
- La chaîne de caractères doit commencer soit par http ou https respecté par :// .
- La taille consolidée du sous-domaine et du domaine doit être comprise entre 2 et 256. Il ne doit contenir que des caractères alphanumériques et/ou des personnalités spéciales.
- Le TLD (Top-Level Domain) ne doit comporter que des personnalités alphabétiques et sa longueur doit être comprise entre 2 et 6 personnalités.
- La fin de la chaîne URL peut inclure des caractères alphanumériques et/ou des caractères spéciaux. Et aussi elle peut se dupliquer pas ou même plus de fois.
Vous pouvez valider une URL en JavaScript en utilisant l’expression régulière suivante :
De même, vous pouvez utiliser l’expression régulière suivante pour confirmer une URL en Python :
Où :
- ( http|https)://) veille à ce que la chaîne de caractères commence par http ou https adhéré à://.
- indique les personnalités alphanumériques et/ou les caractères spéciaux. Les premières circonstances de cette collection représentent l’ensemble des personnalités pour permettre la composante sous-domaine et aussi domaine. Tandis que les secondes circonstances de cet ensemble représentent la collection de personnalités à autoriser dans la chaîne de questions ou la partie sous-répertoire.
- représente l’indication de l’événement de 2 à 256 fois (les deux globales). Cela suggère que la longueur consolidée du sous-domaine et du domaine doit se situer entre 2 et 256.
- . représente le caractère point.
- implique tout type de lettres minuscules de a à z dont la taille est comprise entre 2 et 6. Il s’agit de l’ensemble des personnalités pour permettre la partie de domaine de premier niveau.
- b représente la limite d’un mot, c’est-à-dire le début d’un mot ou la fin d’un mot.
- * est un opérateur rep qui montre absolument aucun ou plusieurs doublons de la chaîne de requête, des spécifications ou des sous-répertoires.
- ^ ainsi que $ suggèrent le début et la fin de la chaîne de caractères spécifiquement.
Si vous êtes maladroit avec l’expression ci-dessus, jetez d’abord un coup d’œil au guide des expressions régulières pour les débutants. Il faut un certain temps pour se familiariser avec les expressions régulières. L’exploration de quelques exemples comme la validation des informations de compte utilisateur en utilisant les expressions normales doit aider.
La regex over satisfait les types d’URL de la liste ci-dessous :
- https://www.something.com/
- http://www.something.com/
- https://www.something.edu.co.in
- http://www.url-with-path.com/path
- https://www.url-with-querystring.com/?url=has-querystring
- http://url-without-www-subdomain.com/
- https://mail.google.com
Utilisation de l’expression régulière dans un programme
Le code utilisé dans ce travail est facilement disponible dans un dépôt GitHub et est totalement libre pour que vous puissiez l’utiliser sous le certificat MIT.
Il s’agit d’une méthode Python pour confirmer une URL :
Ce code fait appel à la méthode de Python. re.com pile() pour assembler le motif d’expression normale. Cette méthode accepte le motif de regex comme une spécification de chaîne et renvoie également un motif de regex things. Ce motif de regex things est mieux utilisé pour rechercher des incidents du motif de regex à l’intérieur de la chaîne de caractères cible en utilisant la fonction re. search() approche.
Si elle découvre au moins une combinaison, le re. search() renvoie la combinaison initiale. Gardez à l’esprit que si vous avez l’intention de rechercher toutes les correspondances avec le motif de la chaîne cible, vous devez utiliser la méthode re.findall() technique.
L’exécution du code ci-dessus permettra de vérifier que la première URL est valide mais que les autres ne le sont pas.
De même, vous pouvez confirmer une URL en JavaScript en utilisant le code suivant :
Encore une fois, l’exécution de ce code validera certainement que les tout premiers stands URL et cetera d’entre eux sont nuls. Il fait appel à la fonction match() pour faire correspondre la chaîne cible à un motif d’expression de routine.
Valider des données importantes en utilisant des expressions régulières
Vous pouvez utiliser des expressions normales pour parcourir, faire correspondre ou analyser un message. Elles sont également utilisées pour le traitement du langage tout naturel, la correspondance des motifs et l’analyse lexicale.
Vous pouvez utiliser ce dispositif efficace pour confirmer des types d’informations cruciales comme les numéros de cartes bancaires, les détails des comptes d’utilisateurs, les adresses IP, et aussi plus.
Comment valider une URL ?
Vous pouvez utiliser URLConstructor pour vérifier si une chaîne est une URL valide. URLConstructor ( new URL(url) ) renvoie un objet URL nouvellement créé défini par les paramètres d’URL. Une exception JavaScript TypeError est levée si l’URL donnée n’est pas valide.
Comment validez-vous un modèle regEx ?
La validation du modèle RegEx peut être ajoutée aux questions de type saisie de texte. Pour ajouter une validation, cliquez sur l’icône Validation sur la question de type saisie de texte.
Comment vérifier si une chaîne est une URL ?
Correspondance Regex Nous faisons cela en appelant la méthode test() sur un objet RegExp avec un modèle qui correspond à une chaîne qui est une URL valide. La méthode RegExp test() recherche une correspondance entre une expression régulière et une chaîne. Il renvoie vrai s’il trouve une correspondance. Sinon, il renvoie false .
Comment valider l’URL dans PHP regEx ?
PHP fournit la fonction intégrée filter_var() avec le filtre FILTER_VALIDATE_URL. Ainsi, nous pouvons facilement valider une URL en PHP à l’aide de regex javascript ou d’une expression régulière. Le filtre FILTER_VALIDATE_URL valide une URL. Drapeaux possibles de validation d’URL en PHP.