Crear un nuevo idioma de reconocimiento

La estación de verificación utiliza datos sobre el idioma del documento al reconocer texto. Es posible que el programa no reconozca algunos caracteres en documentos con elementos poco comunes (por ejemplo, números de código), porque puede que el idioma del documento no contenga estos caracteres. Para reconocer dichos documentos, se puede crear un idioma personalizado que tenga todos los caracteres necesarios. También puede crear grupos de varios idiomas de OCR y usar estos grupos cuando reconozca documentos.

Cómo crear un idioma de usuario

  1. En el menú Herramientas, haga clic en Editor de idiomas.
  2. Haga clic en el botón Nuevo....
  3. En el cuadro de diálogo que se abre, seleccione la opción Crear un nuevo idioma basado en uno existente, elija el idioma que desee usar como base para el nuevo y haga clic en Aceptar.
  4. Se abrirá el cuadro de diálogo Propiedades de idioma. En este cuadro de diálogo:
    1. Escriba el nombre del nuevo idioma.
    2. El idioma que ha seleccionado en el cuadro de diálogo Nuevo idioma o grupo se muestra en la lista desplegable Idioma de origen. Puede seleccionar otro idioma en esta lista.
    3. El Alfabeto contiene el alfabeto del idioma base. Si desea editar el alfabeto, haga clic en el botón .
    4. El grupo Diccionario contiene varias opciones relacionadas con el diccionario que usará el programa al reconocer el texto y revisar el resultado:
      • Ninguno
        El idioma no tendrá ningún diccionario.
      • Diccionario incorporado
        Se usará el diccionario integrado del programa.
      • Diccionario de usuario
        Haga clic en el botón Editar... para especificar términos del diccionario o importar un diccionario personalizado ya existente o un archivo de texto con codificación Windows-1252. (Los términos se deben separar mediante espacios u otros caracteres que no estén en el alfabeto).
        Las palabras del diccionario de usuario no se marcarán como incorrectas cuando se revise la ortografía del texto reconocido. Se pueden escribir todo en minúsculas o mayúsculas, o solo con la letra inicial en mayúscula.
Palabra del diccionario Palabras que no se considerarán incorrectas al revisar la ortografía
abc abc, Abc ni ABC
Abc abc, Abc ni ABC
ABC abc, Abc ni ABC
Abc aBc, abc, Abc ni ABC
  • El Expresión regular le permite crear un diccionario de usuario usando expresiones regulares.
    See also: Expresiones regulares.
  1. Los idiomas pueden tener varias propiedades adicionales. Para cambiar estas propiedades, haga clic en el botón Avanzadas... para abrir el cuadro de diálogo Propiedades avanzadas de idioma, donde puede especificar:
    • Los caracteres por los que puede empezar o terminar una palabra
    • Los caracteres distintos de letras que aparecen por separado de las palabras
    • Los caracteres que pueden aparecer dentro de palabras pero que se deben ignorar
    • Los caracteres que no pueden aparecer en textos que se reconozcan usando este idioma (caracteres prohibidos)
    • La opción El texto puede contener números arábigos, números romanos y abreviaturas. opción
  1. Ya puede seleccionar el idioma que acaba de crear cuando seleccione los idiomas de OCR.

También puede guardar todos los diseños e idiomas de usuario como un único archivo. Para ello, haga clic en Herramientas > Guardar diseños e idiomas....

Consulte también:

Idioma de documento

26.03.2024 13:49:50

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.