I responsabili del progetto “Apache PDFBox” hanno annunciato il rilascio della versione 1.0 dei prodotti PDFBox e FontBox. Il primo consiste in una libreria Java che permette la creazione e la manipolazione di documenti in formato PDF mettendo a disposizione tutti gli strumenti per l’estrazione di contenuti.
PDFBox integra anche una serie di utilità basate su riga di comando che possono essere impiegate per crittografare e decifrare i file PDF, estrarre testi ed effettuare attività di conversione. FontBox è invece un componente che facilita l’estrazione dei dati relativi alle fonti di carattere usate nei documenti PDF. Sviluppato come parte del progetto PDFBox, FontBox si presenta come una libreria indipendente.
Requisito essenziale, indispensabile per l’impiego di PDFBox e FontBox è l’uso di Java 5. In questo esempio avevamo utilizzato una precedente versione di PDFBox per estrarre iterativamente le prime righe da tutti i documenti in formato PDF memorizzati all’interno di una cartella, su disco fisso. Allo scopo avevamo sviluppato un semplice progetto con Visual Basic 2005/2008.
L’ultima vesione di PDFBox e FontBox può essere prelevata facendo riferimento a questa pagina.