Extraer Texto de Archivos PDF (C#)

Paquetes Nuget

Install-Package iTextSharp

Código

using iTextSharp.text;
using iTextSharp.text.pdf;
using iTextSharp.text.pdf.parser;

...

StringBuilder sb = new StringBuilder();

using(PdfReader reader = new PdfReader(archivo))
{
 //Leer desde la página 1 a n (No existe Página 0)
 for (int i = 1; i < reader.NumberOfPages; i++)
 {
  sb.AppendLine(PdfTextExtractor.GetTextFromPage(reader, i));
 }
}

Comentarios

Entradas más populares de este blog

Generar archivos de Excel en C#, fácilmente con EPPlus

Rotar una imágen basándose en los metadados EXIF (C#)