Link Parser

Développement - le 9 Octobre 2013 par Mathieu WEBER

V0.1.5

J'ai bossé ces derniers jours sur le parser de lien (le formulaire dans la barre de menu) afin d'améliorer la reconnaissance des sites. En plus des tags facebook, je regarde toutes les images du site. J'ai adapté un code que j'ai trouvé là http://github.com/maparrar/linkparser en suivant un lien du post d'origine ici http://redsunsoft.com/2011/01/parse-link-like-facebook-with-jquery-and-php/

L'idée intéressante du code est de filtrer toutes les images dont le ratio ne respecte pas au moins 1/3 entre hauteur et largeur, ou qui n'ont pas au moins 200px de large. En fait ça filtre toutes les bannières de pub avec un format adhoc et toutes les images qui ne sont pas dignes d'être partagées. Pour l'instant mes tests sont assez satisfaisants, le résultat est assez probant.

J'ai du me remettre au javascript également pour faire le mini slideshow qui permet de faire défiler la liste des images et qui met à jour le formulaire avec la bonne url d'image.

Vous pouvez essayer avec cette url : http://www.tripadvisor.fr/LocationPhotos-g187497-Barcelona_Catalonia.html

Je suis assez satisfait du résultat. Et vous, vous en pensez quoi ?

Bon ceci étant dit il faudrait que je trouve un moyen de déterminer automatiquement une catégorie pour enlever de la friction. Et je dois aussi mettre en place un système de reconnaissance qui évite de créer deux fois un produit à partir d'une même url ou d'un url ressemblante

PS: bon forcément faut pas retourner le site, il y a toujours des cas qui plantent.