Back to photostream

OCRWordpress prototype

OCRWordpress est un outil assemblé avec Openframeworks et utilisant un algorithme OCR (Optical Character Recognition) pour détecter du texte dans une image. L'extrait de texte isolé peut être ensuite envoyé et ajouté à un article d'un blog fonctionnant avec Wordpress. La détection est n'est pas parfaite et nécessite une correction manuelle.

J'ai pour projet de maintenir sur un blog une liste de livres que j'ai lu et de référencer pour chacun certains passages qui m'ont marqués, sans à avoir à retaper manuellement le texte. Je ne me suis pas documenté sur les solutions qui existent à ce niveau avec les liseuses.

L'outil est basé sur les librairies ofxTesseract pour la reconnaissance optique, ofxUI pour l'interface graphique et xmlrpc++ pour la communication avec Wordpress.

 

524 views
1 fave
0 comments
Uploaded on March 29, 2014