Composants

Google compte plus d'un billion d'URL Web uniques

What's new with sign up and sign in on the web (Google I/O '18)

What's new with sign up and sign in on the web (Google I/O '18)
Anonim

Dans un Une découverte qui aurait probablement envoyé le personnage de Dr. Evil des films "Austin Powers" en arrêt cardiaque, Google a récemment détecté plus d'un trillion d'URL uniques sur le Web.

Cette étape a ému les ingénieurs de recherche Google, qui voient le Web se développer Par plusieurs milliards de pages individuelles chaque jour, les responsables de l'entreprise ont écrit vendredi sur un blog.

En plus d'annoncer cette découverte, Google en a profité pour promouvoir la portée et l'ampleur de son index.

chacune de ces milliers de milliards de pages - beaucoup d'entre elles sont similaires ou représentent du contenu généré automatiquement … ce qui n'est pas très utile aux chercheurs, mais nous sommes fiers d'avoir l'index le plus complet de tous les moteurs de recherche, et notre objectif a toujours été d'indexer toutes les données du monde », a écrit Jesse A lpert et Nissan Hajaj, ingénieurs logiciels de l'équipe Web Search Infrastructure de Google.

Cela faisait longtemps que Google ne s'était pas prononcé publiquement sur la taille de son index, un sujet qui suscitait régulièrement des controverses et des demandes reconventionnelles parmi les principaux moteurs de recherche.

Ces jours d'envie de taille d'index ont pris fin lorsqu'il est devenu évident que la plupart des gens numérisent rarement plus de deux pages de résultats Web. En d'autres termes, ce qui importe, c'est de fournir 10 ou 20 liens Web vraiment pertinents, ou, mieux encore, une réponse factuelle directe, car peu de gens parcourront 5000 résultats pour trouver l'information désirée.

Il sera intéressant de voir si cette annonce de Google, publiée sur son principal blog officiel, déclenchera une série de réactions de la part de concurrents tels que Yahoo, Microsoft et Ask.com.

Entre-temps, Google a également révélé des informations intéressantes sur la façon et la fréquence de ces analyses.

"Aujourd'hui, Google télécharge le Web en permanence, collecte des informations sur les pages mises à jour et retraite plusieurs fois par jour l'ensemble du graphique du lien Web.Ce graphique de 1 000 milliards d'URL ressemble à une carte composée de 1 000 milliards d'intersections Donc, plusieurs fois par jour, nous faisons l'équivalent informatique de l'exploration complète de toutes les intersections de toutes les routes des États-Unis, à l'exception d'une carte d'environ 50 000 fois plus grande que les États-Unis, avec 50 000 fois plus de routes. ctions », ont écrit les fonctionnaires.