Bueno, Mac OS X dispone de una opción que si te va a permitir la extracción de texto de los PDF incluso con el mismo formato o muy parecido si necesitas retener la información de tipografías.
La solución pasa directamente por Automator y sus diferentes capacidades, aunque hay que puntualizar un par de detalles previos ya que en función del sistema operativo, el resultado varía un poco. En Snow Leopard, una de las nuevas características del sistema operativo es su capacidad de copiar texto corrido en los PDF aunque esté separado en líneas. Esto permite a la acción de Automator que vamos a preparar la capacidad de extraer el texto por párrafos.
En Leopard la situación cambia, y ya que no es capaz de extraer el texto de la misma forma, el resultado son líneas independientes que hay que editar posteriormente.
Ahora vamos a crear esta acción de extracción de texto: para ello abriremos Automator, que está en Aplicaciones y solicitaremos una acción personalizada para impresora: vamos a optar por esta aproximación ya que generalmente se visualiza primero el PDF para ver su contenido y si es el PDF destinado a extraer el texto: así además la acción quedará encuadrada dentro de las opciones de “PDF” en la esquina inferior izquierda del cuadro de diálogo de impresión.
Nuestra acción tendrá este aspecto:
Ahora, al abrir el PDF, solo tendrás que solicitar la impresión y elegir esta acción de Automator desde el menú PDF para obtener un documento de texto (.txt o .rtf, según tu elección) en el escritorio que ya podrás editar de forma mas conveniente sin la necesidad de andar copiando y pegando desde el PDF.