Qui sommes nous ?

Passionnés du web, de technos, de Linux et d’open data, notre équipe de quelques dizaines d’ingénieurs et de docteurs en informatique est avant tout une équipe de grands allumés qui adorent se réveiller le matin pour crawler des milliards de pages web, optimiser les performances de leurs algorithmes et imaginer les dizaines de nouveaux services que nous allons pouvoir créer grâce à l’émergence de l’open linked data.

Toute l’équipe technique est située à Sophia Antipolis, entre mer et forêt. Développeurs, explorateurs, chefs de projet, testeurs, admin systèmes et exploitants beaucoup de garçons mais aussi quelques filles, dans une ambiance particulièrement ensoleillée.

Nombre d’entre nous travaillent depuis plus de 10 ans dans les moteurs de recherche, monde passionnant ou chaque fonctionnalité devient un vrai challenge technique quand il est question de passer à l’échelle du web !
Au menu tous les jours : Maths appliquées, théorie des graphes, statistiques, text mining, web sémantique, analyse linguistique et beaucoup d’endurance car la pertinence d’un search web est un plat délicat pour initiés courageux. Mais le jeu en vaut la peine !

Collecter quotidiennement plus de 6 milliards de pages web pour en extraire le meilleur du francophone, rafraichir les données au mieux sans surcrawler, classifier les pages, détecter le spam, les miroirs, identifier les langues, les charsets, les thématiques des pages, indexer en des temps records, calculer en temps réel la meilleure combinaison des paramètres pour offrir la meilleure pertinence à nos utilisateurs Voilà 🙂 notre métier et notre expertise.

Convaincus que la sémantique est un axe fort pour les moteurs de demain, nous avons commencé à y travailler en 2009 en proposant à nos utilisateurs un service baptisé en interne « semantic search » qui permet de répondre à de nombreuses questions en langage naturel sur les thèmes principaux que l’on retrouve dans les requêtes faites au moteur: les people, le sport, la géopolitique (voir notre article précédent http://blog.lemoteur.fr/orange-democratise-le-web-semantique/ ).

Les défis sont encore nombreux: comment intégrer les données semi structurées émergentes dans nos algorithmes, comment accompagner et encourager la migration IPV6, comment faire cohabiter web sémantique et moteur statistique, chercher à comprendre au mieux les intentions de requêtes, accompagner encore mieux les utilisateurs d’Orange.fr dans leur parcours du support client, mais aussi quel avenir pour les moteurs de recherche dans l’internet des objets ?

On n’a pas fini de s’amuser 😉 A suivre …