Sites Internet

Google achète ReCAPTCHA pour booster les efforts de numérisation de livres

Réduire la taille d'un fichier PDF sous Mac

Réduire la taille d'un fichier PDF sous Mac
Anonim

Google envisage d'accélérer ses efforts massifs pour scanner des dizaines de millions de livres et de périodiques avec l'acquisition mercredi d'une société appelée reCAPTCHA

ReCAPTCHA est un fournisseur bien connu de la technologie CAPTCHA, qui est utilisée pour empêcher les spammeurs de utiliser des ordinateurs pour s'inscrire automatiquement à des services en ligne, tels que des comptes de messagerie Web et des enregistrements de sites Web.

CAPTCHA, qui signifie «test de Turing entièrement automatisé pour séparer les ordinateurs et les humains», oblige les utilisateurs à taper au hasard images, un processus qui est facile pour les humains, mais difficile pour les ordinateurs à faire correctement.

[Plus d'informations: Les meilleurs services de streaming TV]

Ce qui a attiré Google à ReCAPTCHA, c'est que l'entreprise a lié son service d'authentification de base aux efforts de numérisation des livres imprimés et des périodiques. Le géant de la recherche déploie d'énormes efforts dans ce domaine pour ses services Google Books et Google News Archive.

ReCAPTCHA prend ses images à partir de documents imprimés numérisés. Chaque fois que les gens résolvent un CAPTCHA de l'entreprise, ils contribuent également, en tant que sous-produit, à transformer les mots numérisés en texte brut pouvant être indexés et rendus consultables par les moteurs de recherche.

Google non seulement pour augmenter la fraude et la protection anti-spam pour les produits Google, mais aussi pour améliorer notre processus de numérisation des livres et des journaux », lit-on dans le blog officiel de Google, écrit par Luis von Ahn, co-fondateur de reCAPTCHA.

Le service ReCAPTCHA est utilisé par environ 100 000 sites Web et contribue à la numérisation d'anciennes éditions du New York Times.