Quel est le meilleur programme de ocr ou icr gratuit pour la transcription manuscrite?

Javier demande:

Je suis un écrivain d`histoires courtes et contes. Je suis à la recherche d`un programme gratuit de reconnaissance optique de caractères (OCR) ou reconnaissance intelligente de caractères (ICR) pour numériser mes vieux manuscrits à partir d`images ou de photographies afin que je puisse les convertir en fichiers Microsoft Word.

Y a-t-il des programmes gratuits et précis en mesure de le faire? Malheureusement, je n`ai pas de scanner, mais j`avoir accès à un appareil photo numérique avec une résolution de 20 mégapixels.

manuscrit

Réponse de Kannon:

Comme vous l`avez déjà mentionné, il y a plusieurs types de technologies de reconnaissance de caractères qui peuvent convertir automatiquement l`écriture manuscrite ou dactylographiée en caractères numériques. Le niveau de précision de ces types de logiciels varie considérablement entre les différentes implémentations. Certains convertir sur une base lettre pour lettres et d`autres peuvent convertir des mots entiers. Il y a trois catégories de ce logiciel:

  • Reconnaissance optique de caractères (OCR)
  • Reconnaissance intelligente de caractères (ICR)
  • Mot reconnaissance intelligente (IWR)

Reconnaissance optique de caractères

En vérité, l`OCR est un terme générique et souvent toutes les méthodes décrites dans cet article sont appelés OCR - Wikipédia, cependant, donne OCR sa propre classification, mais les implémentations modernes ont tendance à amalgamer ensemble des méthodes multiples. Alors que fait-il? OCR convertit les lettres individuelles ou -typed handwritten- en caractères numériques. Ainsi, le logiciel examine un document, puis tente de le convertir en texte brut en devinant ce que chaque personnage est.

Le logiciel n`est pas parfait. logiciel OCR peut mal interpréter les caractères individuels avec des apparitions similaires, entraînant les mots mal orthographiés et sorties inexactes. La plupart du temps, les utilisateurs peuvent copier le texte généré par un programme OCR dans un traitement de texte et corriger automatiquement les fautes d`orthographe. Souvent, les erreurs apparaissent comme des caractères similaires. Par exemple, la lettre « d » peut être représentée comme « cl ».

Mais quand il s`agit de textes écrits à la main, OCR ne fait pas très bien. Au moins, la majorité des implémentations libres sont tragiquement mauvais. Il y a des produits commerciaux qui peuvent vraiment ongles la transcription manuscrite, mais leurs lieux de prix eux complètement hors d`atteinte pour le grand public. Par exemple, il y a le logiciel ReadSoft OCR de Lexmark. Ce coût de logiciels d`entreprise uniquement milliers de dollars.

annotée texte

Reconnaissance intelligente des caractères

IC est un sous-ensemble d`OCR qui est spécialisée dans la conversion de texte manuscrit en caractères numériques individuels. Étant donné que vos notes et manuscrits sont écrit à la main, un programme ICR est le plus utile. Cependant, je ne sais pas avec précision comment ils peuvent convertir des textes écrits en langues étrangères comme l`espagnol. Comme avec OCR, les utilisateurs peuvent améliorer la qualité des textes émis en les copiant dans un traitement de texte avec correction orthographique activée, puis la correction d`épreuves à la main.

Un test de caractère: 10 polices Jeux qui Prouvez Typographie peut être amusant

Mot reconnaissance intelligente

La dernière évolution de l`OCR et ICR est un logiciel de reconnaissance intelligente des mots. Plutôt que de reconnaître les caractères individuels, il tente de traduire entiers mots écrits à la main. Comme OCR et ICR, Word reconnaissance intelligente mistranslates souvent des mots, et demande à l`utilisateur de corriger manuellement les erreurs commises.

Quel est le meilleur logiciel gratuit OCR?

Tesseract

Il y a beaucoup d`options disponibles. Tesseract est probablement le meilleur Open source (Et gratuit) logiciel OCR là. A ma connaissance, il semble que sur les caractères individuels et non entiers mots.

Parce que vous utilisez Microsoft Word (qui a le meilleur, plus la vérification orthographique personnalisable dans les entreprises), vous pouvez simplement copier tout le texte dans Word, puis exécuter une vérification orthographique pour nettoyer les fautes d`orthographe.8 façons d`écrire & Grammaire Check In Microsoft Word utilisant différents dictionnaires & langues8 façons d`écrire & Grammaire Check In Microsoft Word utilisant différents dictionnaires & languesorthographe intégré de Microsoft Word et les outils de contrôle de grammaire peuvent être personnalisés pour répondre à vos besoins. Vous pouvez même utiliser la correction automatique pour accélérer votre saisie.Lire la suite

Tesseract est en fait un moteur OCR qui va de la ligne de commande. À moins que vous êtes prêt à faire face à la difficulté de manier un outil de ligne de commande, vous voudrez probablement installer quelque chose de plus convivial. Il y a une téléchargeable « front-end » (ou une Interface utilisateur graphique) qui vous permet d`utiliser Tesseract comme outil de glisser-déposer: PDF OCR X. Tout d`abord, installez le logiciel, puis exécutez. Vous verrez alors une fenêtre:

PDF Interface OCR

Ensuite, vous faites simplement glisser-déposer le fichier image sur la fenêtre. Une fois les charges d`image, exécutez le logiciel de transcription OCR. Il peut prendre une minute.

Malheureusement, il est avéré tout à fait inadéquat pour traiter votre texte. Voici à quoi il ressemble après avoir extrait le texte du document:

OCR extraction d`image en utilisant tesseract

Microsoft OneNote

Comme il semble que vous utilisez déjà Microsoft Bureau, la meilleure option est probablement aussi de Microsoft. Je vais deviner que vous possédez une copie de Microsoft Office, qui comprend OneNote. Cette est équipé de la technologie OCR assez avancée.

En outre, sur iOS et Android, il y a aussi le Microsoft Office complètement gratuit Lens, qui peut convertir JPEG (et d`autres formats d`image) directement dans le texte. Ce qui rend les versions mobiles est si merveilleux que vous pouvez prendre une photo, le télécharger au système de cloud computing de Microsoft, puis exécutez l`extraction de texte à partir de OneNote sur un bureau.

Le processus est assez simple. Tout d`abord, prendre une photo de votre texte. Si vous avez décidé d`utiliser l`application OneNote, vous aurez seulement besoin d`enregistrer le fichier sur votre compte onedrive. Dans le cas contraire, transférer l`image sur votre ordinateur et déposez-les sur OneNote.

Ensuite, faites un clic droit sur l`image et sélectionnez Copie Texte de l`image dans le menu contextuel.

extraction OneNote du texte

Video: Présentation du programme SimpleOCR

Ensuite, faites un clic droit sur une partie vierge de OneNote (ou dans une application de lecture de texte) et collez le texte. Le texte de votre document émis ressemble à ceci:

extraction OneNote texte OCR

Malheureusement, les résultats de OneNote ne font pas nulle part à proximité d`un bon travail, produisant une absurdité totale. Cela pourrait être causé par une combinaison de facteurs, comme une image déformée ou l`écriture qui ne se fait pas en ligne droite, ou simplement parce que le logiciel est pas assez bon.

Google Keep

En ce moment, la meilleure solution pour l`OCR sur des documents écrits à la main a trait à l`apprentissage de la machine: Plus précisément, l`apprentissage en profondeur. Profonde-learning est une méthode sophistiquée de la formation d`un ordinateur pour effectuer des tâches qui n`excellait humain auparavant à, comme la reconnaissance faciale (Picasa fait la reconnaissance faciale, Croyez-le ou non). Google a récemment acheté DeepMind, qui se développe technologie apprentissage en profondeur. Cette acquisition clé a eu un grand effet: Microsoft perd à Google OCR. En ce moment, Google offre l`une des méthodes les plus avancées (et gratuit): Google Keep.Comment faire pour utiliser la reconnaissance faciale dans Picasa Albums WebComment faire pour utiliser la reconnaissance faciale dans Picasa Albums WebLire la suite

Google Keep (Que nous avons d`abord examiné en 2013) Offre également une version mobile de leur application pour Android. Comme avec OneNote, vous pouvez tirer sur l`image et le transférer directement dans le nuage de Google. Il suffit de faire glisser l`image sur Google Garder la fenêtre. Cliquez ensuite sur le bouton de menu (trois points verticaux) et sélectionnez Grab texte de l`image dans le menu contextuel.

google garder

Voici à quoi il ressemble après avoir extrait le texte:

2015-07-18_19h45_34

Video: Reconnaissance de caractères manuscrits

Google Keep Wins

Comme vous pouvez le voir, Google Keep domine la compétition. Les résultats peuvent être encore améliorés en utilisant un Outil de montage d`image pour augmenter le contraste et redresser l`image.10 gratuit Photo Tools Editor pour tirer le meilleur parti de vos coups10 gratuit Photo Tools Editor pour tirer le meilleur parti de vos coupsQu`est-il arrivé à tous les clichés que vous avez pris dans le passé? Si vous avez des plans et des idées, voici quelques fenêtres et des outils multiplateformes pour les traiter avec.Lire la suite

Espérons que ces options d`aide. Si vous avez besoin de plus d`options OCR, s`il vous plaît vérifier la 5 meilleurs outils OCR, pour plus d`informations.

Articles connexes