Quechua: Herrero y Sánchez

El Diccionario Quechua: Estructura semántica del quechua cochabambino contemporáneo (1983) de Joaquín Herrero S.J. y Federico Sánchez de Lozada es indudablemente el diccionario más amplio y exhaustivo del quechua hablado en Cochabamba. La sección Quechua-Castellano es un acervo grande con 16.300 entradas y 903.000 palabras en total. Tiene más ejemplos y más explicación semántica y cultural, que cualquier otra diccionario. Es un recurso inestimable que debe ser consultado por cualquier persona interesada en la lengua actual de Cochabamba, que contiene muchos prestamos del castellano, construcciones gramaticales y fraseología que son distintas a otras regiones.

El ILLA ha digitalizado el diccionario de Herrero y Sánchez de Lozada para publicarlo en el internet y difundir el quechua cochabambino en las computadoras y los aparatos móviles. Ahora el Diccionario Quechua está disponible para utilizar en los diccionarios electrónicos de GoldenDict y StarDict en PCs con Windows, Linux, Mac OS o BSD. También el diccionario ha sido formateado para ser consultado en NuSimi, un diccionario electrónico para teléfonos celulares y tabletas de Android.

Para aprovechar de este diccionario, descargue e instale un diccionario electrónico. Después descargue los archivos del Diccionario Movima para utilizarlo en el diccionario electrónico:

También el diccionario está disponible para leer e imprimir:

  • PDF (Adobe Acrobat)
  • ODT (OpenOffice/LibreOffice)
  • DOC (Microsoft Word)

Diccionario Quechua en GoldenDict:

Diccionario Quechua en StarDict:

Diccionario Quechua en NuSimi:

Notas del ILLA:
El Diccionario Quechua de Joaquín Herrero S.J. y Federico Sánchez de Lozada es indudablemente el diccionario más amplio y exhaustivo del quechua hablado en Cochabamba. Tiene más ejemplos y más explicación semántica y cultural, que cualquier otra diccionario. Es un recurso inestimable que debe ser consultado por cualquier persona interesada en la lengua actual de Cochabamba, que contiene muchos prestamos del castellano, construcciones gramaticales y fraseología que son distintas a otras regiones.

A pesar de la riqueza del Diccionario Quechua, hoy en día es casi imposible encontrar una copia del texto. Muy pocos ejemplares fueron impresos en el año 1983 y las pocas copias existentes están guardadas como baluartes que no se pueden acceder. En la encuadernación, el texto está muy cerca del lomo, que hace que sea difícil fotocopiar. Para poner el diccionario al alcance del público, el Instituto de Lenguas y Literaturas Andinas-Amazónicas (ILLA) decidió publicarlo en el internet y lanzarlo para los diccionarios electrónicos de GoldenDict y NuSimi, para que el texto pueda ser consultado fácilmente en las PCs, tabletas y teléfonos celulares que son comunes hoy en día.

En el año 2010 el diccionario fue publicado en el internet por la carrera lingüística de la University of California-Los Angeles (UCLA) bajo la licencia Creative Commons-NoComercial-Atribución 2.5, que permite que el texto sea copiado, pero no puede ser vendido, ni el nombre de los autores pueda ser borrado. Lamentablemente la UCLA sólo publicó un PDF con imágenes del diccionario en el sitio http://quechua.ucla.edu/dictionaries

Para utilizar el texto en los diccionarios electrónicos de GoldenDict y NuSimi, fue necesario convertir las imágenes de PDF a texto. El ILLA utilizó FineReader 8.0 para convertir el diccionario a texto, pero FineReader no esta afinado para reconocer la lengua quechua, entonces había muchos errores en la conversión. La mayoría de estos errores fueron corregidos manualmente, pero el ILLA todavía está buscando a voluntarios para revisar el texto línea por línea para eliminar los errores existentes en el diccionario.

Algunos cambios fueron hechos en el texto para ser utilizado en diccionarios electrónicos. Las palabras claves fueron puestos en negrillo y las entradas fueron sangradas para enfatizar las palabras claves. Además, palabras claves que no son nombres propios de personas o lugares fueron convertidas a minúsculas. Los colores fueron añadidos al texto para facilitar la lectura. Las abreviaturas V. (véase) y Sin. (sinónimo) fueron coloradas en verde, los ejemplos de quechua en morado claro y la traducción en castellano de estos ejemplos en azul.

El texto que ha sido cambiado por el ILLA es resaltado en amarillo y generalmente es acompañado por un comentario para explicar el cambio. El texto ilegible en las imágenes publicadas por el la UCLA está resaltado en verde. En tal sentido es necesario ubicar una copia original del diccionario para corregir este texto.

El diccionario de Herrero y Sánchez de Lozada utiliza el alfabeto pentavocálico que fue considerado el estándar en 1983, cuando el texto fue publicado. En 1984 el alfabeto único fue aprobado por el gobierno de Bolivia, que utiliza Q en lugar de J para representar el sonido posvelar al final de una silaba. Por ejemplo, wasiyoq en lugar de wasiyuj y llaqta en lugar de llajta.

En los años 90, la Reforma Educativa promovió el uso de un alfabeto trivocálico influenciado por la ortografía del lingüista peruano Rodolfo Cerrón-Palomino, que es considerado el alfabeto estándar hoy en día.

La meta del diccionario de Herrero y Sánchez de Lozada es documentar la lengua hablada en Cochabamba, con toda su variación y su riqueza fonética. Por ello Herrero y Sánchez de Lozada listan muchas variantes de una palabra para capturar todas las maneras que la palabra puede ser pronunciada. Sin embargo, la meta de la ortografía normalizada es escribir en una sola forma para que pueda ser leído en todas las regiones quechuas. En lugar de capturar la variación fonética y dialectal de la lengua, la ortografía normalizada pretende encontrar una ortografía única para eliminar confusión y promover la alfabetización de la lengua. Entonces, no es recomendado consultar al diccionario de Herrero y Sánchez de Lozada para descubrir como escribir correctamente un vocablo. Para esta meta, es recomendado consultar el Diccionario Bilingüe de Teófilo Laime (o el Diccionario Unificado: Quechua Sureño de Rodolfo Cerrón-Palomino para el estándar peruano) que también están disponibles para descargar en nuestro sitio de http://www.illaa.org/index.php/diccionarios

Notas Técnicas
El PDF del diccionario Quechua-Castellano fue descargado de sitio http://quechua.ucla.edu/dictionaries El PDF fue pasado a FineReader 8.0 para la conversión al texto. Pasamos un mes revisando el texto en FineReader para eliminar los errores en la digitalización. Hemos hecho muchos intentos exportar el texto de FineReader, pero no fue posible exportar el texto sin perder el formateo o desordenar el texto. Por ejemplo, intentamos exportar el texto como HTML y escribimos el script cleanDicHerreroSanchez.php para eliminar todos los DIVs y celulas de tablas a parafos, pero desubrimos que FineReader trastornó el orden del texto cuando lo exportó. Al final tuvimos que abrir LibreOffice 3.5 en la misma maquina virtual de Windows donde estaba instalado FineReader y copiar y pegar manualmente cada página de FineReader a LibreOffice.

Después hemos escrito varios scripts de PHP para formatear y convertir el texto. Escribimos el script insertBrDicHerreroSanchez.php para insert saltos de línea en las definiciones. Después utilizamos nuestro script formatDicHerreroSanchez.php para insert los colores en el texto. Finalmente, utilizamos nuestro script formatDicHerreroSanchez.php para convertir el texto para ser utilizado en GoldenDict y StarDict. El TAB file in HTML format fue pasado a SimiDic-Builder para constuir la base de datos para SimiDic. El diccionario Quechua-Castellano fue publicado en http://www.illaa.org el día 13 de febrero de 2014. Es el diccionario número 22 que hemos convertido para utilizar en diccionarios electrónicos, pero todavía estamos muy lejos de nuestra meta de publicar diccionarios para todas las lenguas indígenas de los Andes y el Amazonas.

Hemos utilizado FineReader 8.0 para convertir el PDF del diccionario Castellano-Quechua al texto, pero no hemos revisado el texto manualmente para corregir los errores. Vemos que algunas de las imágenes en el diccionario Castellano-Quechua son de mala calidad, entonces ahora estamos planificado escanear las páginas para ver si podemos mejorar la calidad, pero necesitamos prestar un copia del diccionario para escanear. Con mejores imágenes esperamos que FineReader puede hacer la conversión a texto con menos errores.