Sites Internet

Able2Extract convertit les PDF en formats plus utilisables

Amar Lakel - Patrimonialisation numérique et avenir digital du document Masterclass DNHD-22.02.2019

Amar Lakel - Patrimonialisation numérique et avenir digital du document Masterclass DNHD-22.02.2019
Anonim

Si vous Vous avez déjà eu besoin de sortir le texte d'un document Adobe PDF, vous savez à quel point cela peut être frustrant. Le format de fichier virtuellement universel ne permet pas de réutiliser le texte d'un document et de le coller dans un autre. La mise en forme, l'interlignage et les images sont autant d'éléments qui compliquent la tâche des documents PDF. Mais Able2Extract (100 $, essai gratuit de 7 jours) fait le jeu de cette tâche fastidieuse.

Able2Extract convertit les PDF d'information en formats plus modifiables, tels que ceux utilisés par les applications Microsoft Office.

Able2Extract lit simplement le document PDF, puis crache du texte, des graphiques, des tableaux et d'autres contenus dans un document au format Microsoft Office de votre choix - Word, Excel ou Powerpoint. L'espacement des lignes et le formatage sont conservés au mieux de la capacité du programme: les tableaux ne provoqueront pas la rupture des paragraphes dans des endroits impairs. Les graphiques incorporés, qui sont conservés et déplacés dans les documents Office au même endroit qu'ils apparaissent dans le document PDF, ne le sont pas non plus.

La prime de 30 $ que vous payez pour la version Professionnelle du produit ajoute une fonctionnalité clé: ou OCR. A2E Pro peut lire dans ces documents PDF qui ont été scannés comme un fichier image, et fait un travail remarquable non seulement de convertir les images en texte, mais aussi de reproduire la pagination, la mise en page et même la police utilisée dans le document original.

L'extraction de texte à partir d'un fichier PDF généré à l'aide de l'utilitaire Adobe Acrobat (ou «Imprimer au format PDF») était un jeu d'enfant. Un document de 20 pages, avec des images en ligne, une table dont le texte a circulé, et d'autres détails, a été reproduit parfaitement dans un fichier.doc Microsoft Word. Utiliser la version Pro pour OCR un document mal reproduit qui avait été tapé à l'origine avec une machine à écrire, puis scanné crooked, était plus difficile.

Il a fallu au programme 3 minutes et 15 secondes pour convertir un autrement désastreusement mal scanné Test de 62 pages PDF. Des fautes de frappe mineures sont apparues lorsque des notes manuscrites sont apparues dans les marges sur certaines pages - mais elles ont aussi essayé de les reproduire. L'original avait été envoyé par fax, et le pied de page du fax, perdu dans la mauvaise qualité de numérisation, ne se reproduisait pas de la même façon - mais il était également totalement étranger. Lorsque vous chargez le fichier PDF dans le programme, vous pouvez faire glisser-sélectionner des parties de la page que vous souhaitez convertir; Si j'avais mieux planifié la conversion, j'aurais évité de sélectionner ces pieds de page inutiles et les notes dans les marges.

Un représentant de l'éditeur me dit que les dessins ou esquisses des documents PDF peuvent être numérisés et sortis dans un format de fichier permet de les charger avec AutoCAD. Bien que je n'ai pas testé cette fonctionnalité, je peux voir comment cela pourrait être incroyablement utile à un architecte, archiviste ou historien, surtout si les plans scannés dans un PDF n'ont pas été conçus à l'origine sur un ordinateur. Dans l'ensemble, j'ai été impressionné par Able2Extract.