Bloc-note d'un développeur web
Dans : Snippets
6 sept 2009Voici une petite fonction PHP pour vérifier qu’une URL pointe bien sur un domaine donné.
On valide dans un premier temps, via filter_var1, le format de l’URL. Cette dernière doit notamment être accompagné d’un protocole. La récupération de l’hôte depuis l’URL se fait très simplement avec la fonction parse_url. Enfin, on s’assure que le domaine cible est bien le domaine principal de l’hôte.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | /** * Checks a URL belongs to a given domain. * * @param string $url The URL to test. * @param string $domain The target domain. * @return boolean */ function isDomainOf($url, $domain) { if (false === filter_var($url, FILTER_VALIDATE_URL, FILTER_FLAG_HOST_REQUIRED)) { return false; } $host = parse_url($url, PHP_URL_HOST); if (false === $host) { return false; } return (boolean) preg_match('#^(?:[^\.]*\.){0,}' . $domain . '$#', $host); } |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 | $test = array( array( 'domain' => 'pioupioum.fr', 'url' => 'http://pioupioum.fr', 'synopsis' => 'Le domaine testé lui même.' ), array( 'domain' => 'pioupioum.fr', 'url' => 'http://example.com', 'synopsis' => 'Un domaine différent.' ), array( 'domain' => 'pioupioum.fr', 'url' => 'http://www.pioupioum.fr', 'synopsis' => 'Un sous-domaine.' ), array( 'domain' => 'pioupioum.fr', 'url' => 'http://foo.bar.pioupioum.fr', 'synopsis' => 'Un double sous-domaine.' ), array( 'domain' => 'bar.pioupioum.fr', 'url' => 'http://foo.bar.pioupioum.fr', 'synopsis' => 'Le dommaine cible contient un sous-domaine.' ), array( 'domain' => 'pioupioum.fr', 'url' => 'http://assets1.pioupioum.fr/foo/bar.png', 'synopsis' => 'Un contenu hébergé sur un sous-domaine.' ), array( 'domain' => 'pioupioum.fr', 'url' => 'http://www.example.com/foo/bar.png', 'synopsis' => 'Un contenu hébergé sur un domaine différent.' ), array( 'domain' => 'pioupioum.fr', 'url' => 'http://fakepioupioum.fr', 'synopsis' => 'Un domaine proche.' ), array( 'domain' => 'pioupioum.fr', 'url' => 'http://www.fakepioupioum.fr', 'synopsis' => 'Un domaine proche avec un sous-domaine.' ), array( 'domain' => 'pioupioum.fr', 'url' => 'pioupioum.fr', 'synopsis' => 'Aucun protocol n\'étant spécifié, la fonction filter_var invalide le test.' ) ); for ($i = 0, $c = count($test); $c > $i; ++$i) { $ok = isDomainOf($test[$i]['url'], $test[$i]['domain']); printf("%s\n[%s] L'URL \"%s\" %s sur le domaine \"%s\".\n\n", $test[$i]['synopsis'], ($ok) ? 'SUCCESS' : 'FAIL', $test[$i]['url'], ($ok) ? 'pointe bien' : 'ne pointe pas', $test[$i]['domain'] ); } |
Qui nous donne l’affichage suivant :
Le domaine testé lui même. [SUCCESS] L'URL "http://pioupioum.fr" pointe bien sur le domaine "pioupioum.fr". Un domaine différent. [FAIL] L'URL "http://example.com" ne pointe pas sur le domaine "pioupioum.fr". Un sous-domaine. [SUCCESS] L'URL "http://www.pioupioum.fr" pointe bien sur le domaine "pioupioum.fr". Un double sous-domaine. [SUCCESS] L'URL "http://foo.bar.pioupioum.fr" pointe bien sur le domaine "pioupioum.fr". Le dommaine cible contient un sous-domaine. [SUCCESS] L'URL "http://foo.bar.pioupioum.fr" pointe bien sur le domaine "bar.pioupioum.fr". Un contenu hébergé sur un sous-domaine. [SUCCESS] L'URL "http://assets1.pioupioum.fr/foo/bar.png" pointe bien sur le domaine "pioupioum.fr". Un contenu hébergé sur un domaine différent. [FAIL] L'URL "http://www.example.com/foo/bar.png" ne pointe pas sur le domaine "pioupioum.fr". Un domaine proche. [FAIL] L'URL "http://fakepioupioum.fr" ne pointe pas sur le domaine "pioupioum.fr". Un domaine proche avec un sous-domaine. [FAIL] L'URL "http://www.fakepioupioum.fr" ne pointe pas sur le domaine "pioupioum.fr". Aucun protocol n'étant spécifié, la fonction filter_var invalide le test. [FAIL] L'URL "pioupioum.fr" ne pointe pas sur le domaine "pioupioum.fr".
(Bon je recommence, parce que je suis de relative bonne humeur
)
Nice !
Par contre, pour le :
J’aurais utilisé un sprintf() pour créer mon pattern, j’ai toujours trouvé ça plus joli ^^’
(Ce coup-ci j’ai copié le commentaire dans mon presse-papier, pas fou le gars
)
Pourquoi réinventer la roue ? parse_url()
Je fais justement appel à parse_url pour traiter l’URL donnée. J’effectue ensuite un contrôle plus strict sur les sous-domaines. Aucune roue n’a été réinventée ici