->
Sí, sí… sé que Ubuntu es una distribución de GNU/Linux, pero la aplicación está totalmente operativa en Ubuntu 6.06 (Dapper) y 6.10 (Edgy), aunque es de suponer que funcionará en cualquier derivado de Debian. Según dicen en la web, están trabajando para que vaya en el resto de versiones de GNU/Linux.
El programa tesseract-ocr fue comprado por Google a HP hace varios años y la verdad es que reconoce incluso el texto en varias columnas, cosa que ni la versión 7 del famoso software de reconocimiento óptico de caracteres (OCR) de Adobe es capaz de hacer.
El programa lo podéis descargar desde aquí, aunque la imagen tiene que estar en formato TIFF para que sea reconocida.
Por otra parte, este programa será uno de los motores del futuro gran software OCR, también de google y también en código abierto, OCRopus, el cual aún está en fase temprana de desarrollo (fuí incapaz de descubrir cómo funcionaba).
22 Mayo 2007 a las 20:48
Yo me quedo con el Omnipage para WinBugs, los pdf me los reconoce de manera perfecta y las hojas escaneadas de forma pasable, con deciros que en el instituto me mandaron leerme un libro en inglés, lo escaneé con el OmniPage y lo traduje con una herramienta informática.xD.
Luego lo distribuí libremente por la clase, esto de compartir conocimientes me viene de chico.xD.
Ya me estoy haciendo al inglés, no soy tan vago por lo general.xD
En GNU/Linux he probado el Kooka, pero no me interpretaba bien los caractéres, así que desistí.
Probaré con éste a ver qué tal, pero eso de que sólo admita tiff no me inspira nada de confianza, habrá que ver cómo evoluciona el proyecto.
Por cierto Mario, ¿Podías programarte algo para que al olvidarte responder la pregunta no pierdas el texto escrito?Esque siempre que escribo se me olvida ponerla y pierdo todo el texto.xD.De todas formas tendré más cuidado.xD
22 Mayo 2007 a las 21:30
Sí, claro rubisf, pero después de los exámenes que ahora ando liadillo de tiempo.
Por cierto buena idea tuviste de pequeño, y seguro que ahora tendrás más. El Omnipage, yo es que no soy de software privativo
22 Mayo 2007 a las 21:31
Lo de que sólo admita TIFF te cuento. El programa es open source y además el tiff lo podrías crear tú, así te aseguras de evitar el código malicioso