Problemas técnicos en el alfabeto guaraní boliviano

El uso de la diéresis < ¨ > para la nasalización y el I cortado <ɨ, Ɨ, ï, Ϊ> DOC, ODT, PDF

En los años 60 y 70, los misioneros evangélicos que crearon el alfabeto guaraní boliviano escogieron caracteres no estándares para representar algunos sonidos de la lengua guaraní. Igualmente, escogieron caracteres no estándares para la escritura de chiquitano.

El uso de la diéresis ( ¨ ) para la nasalización
En el alfabeto guaraní boliviano oficial, el diéresis < ¨ > es la marca diacrítica utilizada para la nasalización de vocales. Este no es el uso estándar del diéresis y no será reconocido por personas viniendo de otras lenguas. Generalmente, el diéresis está utilizado sobre una letra vocálica para indicar que esta letra no es parte de un diptongo1 o digrafo2 y debe ser pronunciada separadamente.

Ejemplos:

  • Español: vergüenza [berˈɣwenθa]
  • Catalán: aigües [ˈajɣwəs] “aguas”, qüestió [kwəstiˈo] “cuestión”
  • Occitano: lingüista [liŋˈɡwistɔ] “lingüista”, aqüatic [aˈkwatik] “acuático”
  • Francés: aiguë o aigüe [eɡy] “aguda”
  • Gallego: mingüei [miŋˈɡwei] “Me achico”

El otro uso común de la diéresis es para indicar que una vocal es no muda:

  • Luxemburgués: chancë [ˈʃãːsə] “oportunidad”
  • Inglés: Brontë /ˈbrɒntiː/ (apellido)

En la lengua alemán, la diéresis es llamado umlaut que significa “otro sonido” y ha reemplazado la después de otro vocal, que originalmente fue escrito encima del vocal para indicar que la vocal es pronunciado con otro sonido.

Ejemplo:
schoen → schoen → schön.

Como en alemán, en aymara la diéresis también puede reemplaza dos grafemas vocálicas, pero se utiliza para indicar alargamiento vocálico. A veces este alargamiento ocurre cuando se unen dos vocales porque un consonante al medio esta mudo:

Ejemplos:
maya → maa → mä “uno”
paya → paa → pä “dos”

En algunos dialectos centrales de quechua, como Ancash-Huailas y Junin-Huanca, tambien se utiliza la diéresis para reemplazar dos grafemas vocálicas y para indicar alargamiento vocálico.

El único otro idioma donde el diéresis está utilizado para nasalización es el idioma seneca de Norte América. Su vocal <ë> tiene una pronunciación nasal que puede variar entre [ɛ̃] y [œ̃] y su vocal <ü> puede variar entre [ɔ̃] to [ɑ̃]. Probablemente, los Senecas decidieron utilizar la diéresis para la nasalización porque la vocal <ä> en el idioma seneca tiene un sonido como la <ä> con umlaut de alemán, entonces fue más fácil utilizar la misma marca diacrítica para todas las vocales. Además, los Senecas tuvieron mucho contacto con francés, una lengua que contiene las grafemas <ë> y <ü>, entonces fue más fácil utilizar los mismos caracteres en las imprentas.

En cambio, el tilde <~> es la marca diacrítica generalmente utilizada para indicar la nasalización. Este uso tiene razón considerando la evolución de esta marca diacrítica. Originalmente el tilde <~> fue escrito encima de un vocal en latín medieval para representar un o después de la vocal. Esta practica se continuó en la escritura de francés, español, catalán y portugués hasta el siglo 17. Originalmente el tilde fue escrito como un pequeño encima de la vocal, pero por tiempo se trasformó en <~>.

Ejemplo:
quem →quen →quẽ “quien” (acusativo)

y son consonantes nasales, entonces fue una evolución natural utilizar el tilde para representar vocales nasales en portugués y el N alveolar nasal <ñ> en español.

Ejemplos en portugués:
mão/mãos “mano/manos”
melão/melões “melon/melones”
mãe/mães “madre/madres”

En la misma manera el alfabeto fonética internacional (AFI) y el alfabeto guaraní de Paraguay y Argentina utilizan el tilde para la nasalización.

El uso del la diéresis <¨> en lugar del tilde <~> para la nasalización en el alfabeto guaraní boliviano oficial está creando un conflicto con la escritura paraguayo y argentino y una división innecesaria. No hay ninguna razón lingüística para utilizar otra ortografía que Paraguay y Argentina. Además, muchos guaranís en Bolivia ya conocen el uso del tilde por la influencia del alfabeto paraguayo, entonces un cambio oficial de la diéresis al tilde no será un gran inconveniente para los guaranís bolivianos.

El uso del I cortado <ɨ, Ɨ, ï, Ϊ>
El alfabeto oficial de guaraní boliviano utiliza el carácter <ɨ> que es llamado “I cortado” y representa la vocal I central cerrado, mientras el alfabeto paraguayo utiliza el carácter para el mismo propósito. Su forma nasal es representada por el carácter <ï> en el alfabeto boliviano y por el carácter <ỹ> en el alfabeto paraguayo y argentino.

Aunque se encuentra el carácter <ɨ> en el alfabeto fonética internacional, la única lengua (aparte de guaraní boliviano y chiquitano) que utiliza este carácter en su escritura es zapoteco, una lengua indígena del suroeste de México.3 El carácter más común para representar esta fonema es, como se ve en los alfabetos de polaco, checo, kaingang, muisca, tupi, guaraní paraguayo y võro.

Lengua Carácter para la fonema [ɨ] Ejemplo AFI Significado en español
Acehnese eu tupeue [tupɨə] ‘saber’
Amharic ሥር [sɨr] ‘raiz’
Angor ü hüfı [xɨβə] ‘caliente’
Checo (algunos dialectos) y był [bɨɫ] ‘he was’
Inglés e (en casos especiales) roses [ˈɹoʊzɨz] ‘rosas’
Irlandés ao saol [sɨɫ] ‘vida’
Kaingang y fy [ɸɨ] ‘semilla’
Mapudungun ü trukür [tʴuˈkɨɹ] ‘neblina’
Muisca y hycha [hɨʂa] ‘yo’
Polaco y mysz [mɨʂ] ‘ratón’
Rumano î înot [ɨˈnot] ‘yo nado’
Ruso ы ты [tɨ] ‘tu’ (singular)
Sueco i bi [bɨː] ‘abeja’
Tupi y yby [ɨβɨ] ‘tierra’
Vietnamita ư trưa [ʈɨɜ˧] ‘medio día’
Võro y sysar [sɨsarʲ] ‘hermana’
Galés norteño u llun [ɬɨːn] ‘dibujo’
Zapoteco ɨ [nɨ] ‘agrio’

Solo los alfabetos de zapoteco, guaraní boliviano y chiquitano, que fueron creados por lingüistas extranjeros del Instituto Lingüístico del Verano (SIL International), utilizan el <ɨ>, que es un carácter especializado del alfabeto fonético internacional (AFI). Este alfabeto no tiene la meta de ser fácil de aprender y utilizar y no es recomendado para el público general. Fue creado para uso especializado de lingüistas profesionales que necesitan una ortografía única y exacta para representar todas las fonemas del mundo. En cambio un alfabeto utilizado por un público general debe ser fácil de aprender y usar y debe usar caracteres comunes que la gente ya conocen para promover la lectura y escritura.

Problemas informáticos
El alfabeto guaraní boliviano fue creado en los años 60 y 70, antes que la computadora fue muy utilizada en la edición de texto. Sin embargo, hoy en día la habilidad de representar un alfabeto en la computadora es una requisito imprescindible para la promoción y la revitalización de una lengua, especialmente cuando se quiere utilizar la lengua en contextos oficiales y educativos.

Los caracteres especiales <ɨ, Ɨ, ï, Ϊ> del alfabeto guaraní boliviano oficial presentan varios inconvenientes para visualizarlos y imprimirlos con la computadora. Las tipografías estándares como Times New Roman, Ariel, Helvetica y Courier recientemente han añadido el I cortado <ɨ, Ɨ> en la versión 5.0 de las tipografías que vienen con Microsoft Vista, pero muchos guaraní-hablantes en Bolivia utilizan anteriores versiones de Microsoft Windows que no vienen con el I cortado en las tipografías.

Para conseguir nuevas versiones de estas tipografías, hay que comprarlas de Monotype por un costo exorbitante o encontrar una copia pirateada. El Monotype Elements Library con las tipografías más conocidas cuesta $750 y requiere una conexión de internet y una tarjeta de crédito para comprarlas. Entre 1996 y 2002, Microsoft ofreció la descarga por gratis de 11 de sus tipografías más comunes, pero estas tipografías no contienen el I cortado <ɨ, Ɨ>. Para usuarios de Windows 3.1, 95, 98, Millenium Edition, Server 2000, XP y 2003 Server, la única opción factible es utilizar una tipografía no muy conocida. Se puede descargar por gratis un número de tipografías libres que incluye <ɨ, Ɨ> como Gentium, Doulos SIL, Charis SIL y Andika, pero se necesita acceso al internet. También, muchos programas como Microsoft Office y Adobe Acrobat Professional vienen con tipografías adicionales, pero muchas personas no quieren utilizar estas tipografías especiales porque no pueden pasar sus archivos a otras computadoras que no tienen estas tipografías instaladas. Además no se puede visualizar el I cortado fácilmente en paginas web, porque la mayoría de navegadores web están en computadores sin estas tipografías.

El I cortado nasal <ï, Ϊ> presenta un problema más grave, porque no está incluido en ninguna tipografía y no tiene códigos definidos en Unicode, que es el conjunto universal de caracteres que pretende representar todos las grafemas ortográficas del mundo. Para crear este carácter en Unicode, hay que entregar el carácter <ï> (U+03CA) o <Ï> (U+03AA) y después juntarlo con la marca diacrítica < ̵> (U+0335) para formar <ï̵> o <Ï̵>. La otra opción es entregar el carácter <ɨ> (U+0268) o <Ɨ>
(U+0197) y juntarlo con la marca diacrítica <¨> (U+0308) para formar <ɨ̈> o <Ɨ̈>. Ambas formas puede causar problemas en algunas tipografías. A veces la barra en <ï̵> (U+03CA, U+0335) queda un poco a la izquierda y no aparece bien equilibrada. A veces la diéresis en <Ɨ̈> (U+0197, U+0308) no sube encima de I mayúscula y aparece en el medio del carácter.

I cortado en varias tipografías

En MS Office, OpenOffice.org y LibreOffice, si una tipografía no tiene un caracter, inserta el caracter de otro tipografía del mismo estilo. En los ejemplos arriba, Times New Roman, Arial y Trebuchet MS no tiene el carácter <ɨ>, ni las marcas diacríticas <¨, ̵>, entonces los caracteres resaltados en amarillo fueron insertados automáticamente de otras tipografías, creando discordancias entre los caracteres.

Aunque Unicode provee códigos para combinar caracteres con marcas diacríticas, las tipografías por defecto de Windows no incluyeron las marcas diacríticas antes de versión 5.0 en Windows Vista. Una opción para usuarios de computadoras viejas es cambiar a un sistema operativo libre. X Windows, que es el entorno gráfico utilizado por la mayoría de distribuciones de BSD y Linux, ha soportado Unicode desde su comienzo y las tipografías libres generalmente incluyen los caracteres <ɨ, Ɨ, ï, Ï> y las marcas diacríticas <¨, ̵>. Desafortunadamente, muchas guaraní-hablantes no quieren cambiar su sistema operativo ni tienen el conocimiento técnico para hacerlo.

Aunque Windows Vista y Windows 7 incluyen los caracteres <ɨ, Ɨ, ï, Ï> y las marcas diacríticas <¨, ̵> en sus tipografías más comunes, todavía su uso presenta algunos desafíos. La mayoría de usuarios no tienen ninguna idea como teclear estos caracteres, porque no hay una tecla designada para estos caracteres. Ningún teclado del mundo ofrece una tecla designada o una combinación de teclas para introducir los caracteres <ɨ, Ɨ>, ni las marcas diacríticas combinadoras <¨,  ̵>.

Muy pocos escritores de guaraní boliviano han descubierto que los caracteres <ɨ, Ɨ> existen. Hay que abrir un editor de texto como Microsoft Word o OpenOffice Writer y ir al dialogo para insertar un carácter especial. Después de pasar por varias pantallas de caracteres, se encuentra el I cortado en la sección de “IPA Extensions” lejos de los otros Is. Si el usuario no sabe que Unicode permite la combinación de caracteres con marcas diacríticas, no descubrirá como introducir el I cortado nasal. Pocos escritores guaranís ha memorizado los números de Unicode para estos caracteres especializados y muy pocos saben como programar combinaciones de teclas para insertar estos caracteres. Entonces, escritores guaranís malgastan mucho tiempo insertando estos caracteres desde el diálogo de Insertar > Símbolo o copiando y pegando de otros partes del texto.

En Linux y BSD, hay una manera universal para introducir códigos de Unicode, sin importar la lengua del teclado. Oprima SHIFT + CONTROL + u para entrar el modo de Unicode, después entregue el número hexadecimal del carácter.

En Windows, hay varias maneras de entregar estos caracteres, pero ninguna funciona en todos los casos:

Método 1: Valor hexidecimal de Unicode con ALT

  1. Oprima y siga oprimiendo la tecla ALT.
  2. Oprima la tecla + en el teclado númerico.
  3. Teclee el valor hexidecimal de Unicode.
  4. Suelte la tecla ALT.

Este método funciona en todos los teclados sin importar su lengua, pero hay que recordar el número decimal de Unicode. Desafortunademente, hay que cambiar el registry de Windows para activar esta opción. Vaya a HKEY_Current_User/Control Panel/Input Method. En REG_SZ, ponga HexNumpad a “1″. Si esta opción no existia, hay que añadirla. Rebutee la computadora.
Este método no sirve bien porque la mayoría de las computadores en cybercafes no permitiría esta opción porque tiene protección que no permite que el usuario toque el registry de Windows. Otro problema es que muchos laptops no tiene un tecleado númerico separado. Se puede activarlo con una teclea especial de FUNCIÓN pero es demasiada molestia activarlo para introducir un solo carácter y desactivarlo después.

Method 2: Valor decimal de Unicode con ALT

  1. Oprima y siga oprimiendo la tecla ALT.
  2. Teclee 0 (cero) y la valor decimal de Unicode en el teclado numérico.
  3. Suelte la tecla ALT.

Este método sólo función en Windows XP SP1 y después y es muy inconveniente como el método anterior.

Method 3: Valor decimal de la página de código

  1. Oprima y siga oprimiendo la tecla ALT.
  2. Teclee el valor decimal del carácter del código de la página.
  3. Suelte la tecla ALT.

El valor de cada carácter depende de la página de código. Para chequear el código de la pagina, vaya a la línea de comando y entregue: chcp
Acá es una lista de las páginas de código y sus valores de caracteres como estos.

Method 4: Depende de la aplicación
Algunas aplicaciones tiene métodos personalizados para introducir caracteres especiales. Por ejemplo, algunas aplicaciones de Microsoft como WordPad y Microsoft Word soporte Unicode con ALT + X.

  1. Teclee un valor hexidecimal de Unicode.
  2. Oprima la tecla ALT + X para convertir el valor a su letra correspondiente de Unicode. (Oprima ALT + X otra vez para convertir un carácter a su valor numérico de Unicode)

Method 5: Unicode IME
Microsoft Windows provee el programa Unicode Input Method Editor (IME). Oprima las teclas ALT-IZQUIERDA + SHIFT para abrir el modo de Unicode IME para introducir un valor hexidecimal de Unicode.
Para activar está opción:

  • Vaya a Control Panel -> Regional Settings. En la pestaña Languages, active soporte para lenguas de Asia Este. Esta opción ocupará 230MB de espacio en el disco duro y requiere que la computadora sea rebuteada después.
  • Vaya a Control Panel -> Regional Settings. En la pestaña Languages, haga clic en el botón Details.
  • Ahora la barra de tareas tendra un icono adicional para mostrar cual lengua está en uso.
  • Oprima ALT_IZQ + SHIFT para abrir el modo Unicode IME. La barra de tareas mostrará CH.
  • Teclee los dígitos hexadecimales de un carácter Unicode.
  • Para salir del modo Unicode IME, oprima ALT_IZQ + SHIFT otra vez. La barra de tareas mostraré el código de de lengua en uso otra vez).

Dado estos problemas, no es sorprendente que casi todos los escritores de guaraní no utilizan los caracteres designados de I cortado, pero utilizan el formateo para tachar el I. Esta solución causa varios problemas. Primero, el formateo sólo funciona en editores de texto y otros ambientes que soporte el formateo. No sirve en la linea de comandos, archivos de texto plano y aplicaciones que no utilizan texto formateado. Muchas veces el formateo se pierde cuando texto es cortado y pegado entre aplicaciones y el texto no distingue el I normal y el I cortado. Normalmente el texto es guardado en una base de datos y archivos de configuración como texto plano, entonces no es posible almacenar texto guaraní correctamente si los I son tachados con formateo.

Otro problemas es que los buscadores en el internet y aplicaciones de escritorio solo funciona con texto plano, entonces no se puede buscar el I tachado. Tampoco se puede ordenar texto correctamente porque los editores de texto no puede distinguir el I tachado y el I normal. Para preservar el tachamiento, hay que guardar el texto con formateo, pero utilizando formateo en una base de datos causa muchos problemas con las funciones de colación (ordenamiento). Aca en el Instituto de Lenguas y Literaturas Andinas-Amazonicas (ILLA), hemos encontrado muchos problemas con el I tachado cuando hemos incluido el diccionario Arusimiñee en StarDict, un diccionario electrónico. En StarDict, las palabras claves de cada entrada en el diccionario no pueden utilizar formateo, entonces el I cortado aparece en la lista de palabras como un I normal. Además el buscador no se distingue entre el I normal y el I cortado. Vamos a encontrar mas de estos problemas cuando los guaranís entre el mundo informático.

Otro problema es que no se puede tachar fácilmente sola una letra mientras se escribe, porque el editor de texto aplica el tachamiento a los caracteres que son escritos directamente después del I cortado. Entonces, hay que primero escribir el texto y después volver y tachar el I cortado, que es muy tedioso, porque los editores de texto no tienen teclas de acceso rápido para tachar texto. Se puede definir teclas de acceso rápido para tachar texto o insertar un I cortado, pero pocas personas saben como hacer esto. Lo que la mayoría hace es tachar un I manualmente y copia y pega este I cortado en otras partes del texto. Esto también es tedioso y ineficiente porque se pierde el I cortado cada vez que se copia otro texto. También, no se puede pegar el este texto mientras se escribe porque el tachamiento será aplicado a las próximas letras tecleadas que siguen el I cortado en el texto.

En la computadora, el texto está tachado para varios propósitos, que pueden confundir el lector y ocultar el I tachado. Por ejemplo, el lector no sabe si la palabra fue originalmente ivi o ivi en este caso:
xxx xxx ivi xxxx xxxxx

El control de revisiones en editores de texto a menudo utiliza tachamiento para indicar cual texto fue reemplazado o borrado en una versión comparado a otro. También, editores a menudo tachan texto para indicar que el texto debe ser borrado o revisado, pero si alguien quita este tachamiento, el I cortado se transforma en I normal.

Ejemplo:
xxx xxx ivi xxxx xxxxx → xxx xxx ivi xxxx xxxxx → xxx xxx ivi xxxx xxxxx

Estos problemas no existen en el alfabeto paraguayo que utiliza en lugar de <ɨ>:

Ejemplo:
xxx xxx yvy xxx xxxx → xxx xxx yvy xxx xxxx → xxx xxx yvy xxx xxxx

Caracteres no ASCII en los alfabetos de guaraní:

Carácter Unicode descripción Unicode hexadecimal Unicode decimal Página de código HTML Teclado
ä latin small letter a with diaeresis 00E4 228 CP-1250, ISO-8859-1, UTF8/16 &auml;
&#228;
Español, latinoamericano y inglés internacional: “, a
Ä latin capital letter A with diaeresis 00C4 196 CP-1250, ISO-8859-1, UTF8/16 &Auml;
&#196;
Español, latinoamericano y inglés internacional: “, A
ã latin small letter a with tilde 00E3 227 CP-1250, ISO-8859-1, UTF8/16 &atilde;
&#227;
Español, latinoamericano: AltGr+4, a
Inglés internacional: ~, a
à latin capital letter A with tilde 00C3 195 CP-1250, ISO-8859-1, UTF8/16 &Atilde;
&#195;
Español, latinoamericano: AltGr+4, A
Inglés internacional: ~, A
ë latin small letter e with diaeresis 00EB 235 CP-1250, ISO-8859-1, UTF8/16 &euml;
&235;
Español, latinoamericano y inglés internacional: “, e
Ë latin capital letter E with diaeresis 00CB 203 CP-1250, ISO-8859-1, UTF8/16 &uml;
&#203;
Español, latinoamericano y ingles internacional: “, E
latin small letter e with tilde 1EBD 7869 UTF8/16 &#7869; Win: ALT+07869
MS Word: 1EBD, ALT+X
Linux: CTR+SHIFT+U, 1EBD†
latin capital letter E with tilde 1EBC 7868 UTF8/16 &#7868; Win: ALT+07868
MS Word: 1EBC, ALT+X
Linux: CTR+SHIFT+U, 1EBC†
Latin small letter g + combining tilde 0067 + 0303 103 + 771 UTF8/16 g&#771; Win:g, AltGr+0771
MS Word: 303, ALT+X
Linux: g, CTL+SHIFT+U, 303
Latin capital letter G + combining tilde 0047 + 0303 71 + 771 UTF8/16 G&#771; Win: G, AltGr+0771
MS Word: 303, ALT+X
Linux: G, CTL+SHIFT+U, 303
ï latin small letter i with diaeresis 00EF 239 CP-1250, ISO-8859-1, UTF8/16 &iuml;
&239;
Teclado español, latinoamericano y ingles internacional: “, i
Ϊ latin capital letter I with diaeresis 00CF 207 CP-1250, ISO-8859-1, UTF8/16 &Iuml;
&#207
Teclado español, latinoamericano y ingles internacional: “, I
ĩ latin small letter i with tilde 0129 297 UTF8/16 &#297; Win: ALT+0297
MS Word: 129, ALT+X
Linux: CTR+SHIFT+U, 129†
Ĩ latin capital letter I with tilde 0128 296 UTF8/16 &#296; Win: ALT+0296
MS Word: 128, ALT+X
Linux: CTR+SHIFT+U, 128†
ɨ latin small letter i with stroke 0268 616 UTF8/16 &#616; Win: ALT+0268
MS Word: 128, ALT+X
Linux: CTR+SHIFT+U, 268
Ɨ latin capital letter I with stroke 0197 407 UTF8/16 &407; Win: ALT+0197
MS Word: 128, ALT+X
Linux: CTR+SHIFT+U, 197
ɨ̈ (dos formas) 0268+0308, 00EF+0335 616+776, 239+821 UTF8/16 &#616;&#776;
&#239;&#821;
Win: ALT con: 0616, 0776; 0239, 0821
MS Word: ALT+X después de: 268, 308; EF, 335
Linux: CTR+SHIFT+U antes de: 268, 308; EF, 335
Ɨ̈ (dos formas) 0197+0308, 00CF+0335 407+776, 207+821 UTF8/16 &#407;&#776;
&#207;&#821;
Win: ALT con: 0407, 0776; 0207, 0821
MS Word: ALT+X después de: 197, 308; CF, 335
Linux: CTR+SHIFT+U antes de: 197, 308; CF, 335
ö latin small letter o with diaeresis 00F6 246 CP-1250, ISO-8859-1, UTF8/16 &ouml;
&#246;
Teclado español, latinoamericano y ingles internacional: “, o
Ö latin capital letter O with diaeresis 00D6 214 CP-1250, ISO-8859-1, UTF8/16 &Ouml;
&#214;
Teclado español, latinoamericano y ingles internacional: “, O
õ latin small letter o with tilde 00F5 245 CP-1250, ISO-8859-1, UTF8/16 &otilde;
&#245;
Español, latinoamericano: AltGr+4, o
Inglés internacional: ~, o
Õ latin capital letter O with tilde 00D5 213 CP-1250, ISO-8859-1, UTF8/16 &Otilde;
&#213;
Español, latinoamericano: AltGr+4, O
Inglés internacional: ~, O
ü latin small letter u with diaeresis 00FC 252 CP-1250, ISO-8859-1, UTF8/16 &uuml;
&#252;
Teclado español, latinoamericano y ingles internacional: “, u
Ü latin capital letter U with diaeresis 00DC 220 CP-1250, ISO-8859-1, UTF8/16 &Uuml;
&#220;
Teclado español, latinoamericano y ingles internacional: “, U
ũ latin small letter u with tilde 0169 361 UTF8/16 &#361;
*
Win: ALT+0197
MS Word: 128, ALT+X
Linux: CTR+SHIFT+U, 197†
Ũ latin capital letter U with tilde 0168 360 UTF8/16 &#360;
*
Win: ALT+0360
MS Word: 168, ALT+X
Linux: CTR+SHIFT+U, 168†
latin small letter y with tilde 1EF9 7929 UTF8/16 &#7929; Win: ALT+07929
MS Word: 1EF9, ALT+X
Linux: CTR+SHIFT+U, 1EF9†
latin capital letter Y with tilde 1EF8 7928 UTF8/16 &#7928; Win: ALT+07928
MS Word: 1EF8, ALT+X
Linux: CTR+SHIFT+U, 1EF8†
̵ combining short stroke overlay 0335 821 UTF8/16 &#821; Win: ALT+0821
MS Word: 335, ALT+X
Linux: CTR+SHIFT+U, 335
¨ combining diaeresis 0308 776 UTF8/16 &#776; Win: ALT+0776
MS Word: 308, ALT+X
Linux: CTR+SHIFT+U, 308
~ combining tilde 0303 771 UTF8/16 &#771; Win: ALT+0771
MS Word: 303, ALT+X
Linux: CTR+SHIFT+U, 303

* HTML 5.0 incluye: ĩ <ĩ> Ĩ <Ĩ> ũ <ũ> Ũ <Ũ>, pero no incluye códigos especiales para <ẽ>, <Ẽ>, <ỹ>, <Ỹ>. Internet Explorer 9 y después soporte estos códigos nuevos.
† En Linux y BSD, se puede teclear vocales con tilde <ã, ẽ, ĩ, õ, ũ, ỹ> con teclados de español (con tilde muerte) y latinoamérica (con tilde muerte): AltGr+4, vocal. Con teclados de inglés internacional: ~ (SHIFT + `), vocal

Problemas con el I cortado en un corrector de ortografía
El CEPOG y el CNC han contratado a nuestro grupo para desarrollar un corrector ortográfico de guaraní, pero estamos encontrando muchas problemas con el I cortado. Para chequear si una palabra existe, el texto necesita pasar sin formateo de OpenOffice.org o LibreOffice a Foma, un finite state machine que sólo funciona con texto plano. Si Foma no encuentra la palabra en guaraní, pasa una lista de sugerencias en texto plano a OpenOffice.org o LibreOffice para corregir la palabra. OpenOffice.org/LibreOffice no está diseñado para pasar texto formateado al corrector ortográfico y no puede mostrar una lista de sugerencias con formateo tampoco.

Entonces, nuestro corrector no puede funcionar correctamente si el usuario utilizar el I tachado en lugar del carácter designado para el I cortado. Dado que muchas tipografías no incluye el I cortado y la marca diacrítica de la barra (stroke) < ̵>, muchos usuarios no podrán utilizar nuestro corrector porque su editor no puede mostrar el I cortado en texto. Podemos solucionar este problema si distribuimos algunos tipografías libres que incluye el I cortado con nuestro corrector. Sin embargo, no estamos seguros todavía si nuestro base de datos PostgreSQL y Foma pueden almacenar y hacer búsquedas correctamente con caracteres combinados con una marcas diacríticas. También podemos predecir muchos problemas en la interfaz web mostrando el I cortado, porque muchos navegadores web no están instalados en computadores con tipografías modernas que incluyen el I cortado. Podemos escribir una función para reemplazar los I cortados por I tachados en la página web, pero el usuario puede perder el I tachado cuando copia texto de la página web.

Si logramos de solucionar todos estos problemas técnicos, todavía tenemos el problema que los escritores necesitan memorizar códigos difíciles de Unicode para escribir en el alfabeto oficial de guaraní boliviano, que es un gran obstáculo no necesario.

Beneficios del cambio al alfabeto paraguayo
Si el guaraní boliviano cambia al alfabeto paraguayo que utiliza el carácter en lugar de <ɨ>, podemos evitar estos problemas técnicas en la computadora. El uso de un carácter común que existe en el teclado estándar puede hacer la escritura en la computadora más rápido y eficiente. La meta del alfabeto de guaraní debe ser la promoción de la escritura por gente si entrenamiento especial, pero el alfabeto boliviano oficial actualmente está obstaculizando la escritura con sus problemas informáticos.

A diferencia de los caracteres <ɨ, ï̵>, los caracteres <y, ỹ> están incluidos en algunos tipografías por defecto de Windows, entonces no es necesario descargar y instalar tipografías especiales como Doulos SIL y Charis SIL. Además, es más fácil teclear que <ɨ> y <ỹ> que <ï̵>. Por ejemplo, en Microsoft Word se puede introducir <ỹ> tecleando 1EF9 seguido por ALT + X. En cambio, para introducir <ï̵> hay que teclear 3CA seguido por ALT + X y 335 seguido por ALT + X (o 268 seguido por ALT + X y 308 seguido por ALT + X). Además, se puede introducir <ỹ> utilizando la interfaz gráfica porque <ỹ> están en la lista de caracteres especiales para insertar, pero <ï̵> no aparece en esta lista (excepto como una marca combinada).

El cambio al alfabeto guaraní paraguayo es mejor en términos informáticos porque todas sus letras tienen caracteres designados en el estándar de Unicode, excepto de la letra <g̃>, que no está utilizado en el guaraní boliviano, entonces no es un problema. Sin embargo, el uso de vocales con tilde en lugar de vocales con diéresis presenta algunos desafíos informáticos. Las vocales con diéresis <ä, ë, ï, ö, ü> son incluidas en la página de código 1250 que muchas maquinas en Bolivia ya utilizan, pero esta página de código sólo incluye las dos vocales con tilde <ã, õ>, que son utilizadas en el alfabeto portugués. Todos estos caracteres también tienen teclas designadas en los teclados de español, latinomérica y inglés internacional, entonces se puede teclear directamente las vocales <ä, ã, ë, ï, ö, õ, ü>, pero es menos intuitivo teclear las vocales con tilde. En los teclados de español y latinoamérica, se oprime AltGr+4, seguido por la vocal. En el teclado de inglés internacional, se utiliza ~ (que es SHIFT + `), seguido por la vocal. Desafortunadamente, los teclados de español, latinoamérica y inglés internacional en Windows no incluyen las vocales <ẽ, ĩ, ũ, ỹ>,4 entonces es más difícil escribir las vocales nasales del alfabeto paraguayo.

Las vocales <ã, ĩ, õ, ũ> fueron incluidas en el conjunto de caracteres Windows Glyph List 4 (WGL4), que Microsoft ha incluido en todas sus tipografías desde el lanzamiento de Office 97. Las vocales <ẽ, ỹ> han sido incluidos en las tipografías mas utilizadas (Arial, Times New Roman y Courier New) desde Windows 98 Segunda Edición y MS Office 2000. Entonces, un usuario puede encontrar las vocales <ã, ẽ, ĩ, õ, ũ, ỹ> en MS Word en Insertar > Símbolo en el menú y estas vocales serán mostrado correctamente en las tipografías mas utilizada de Windows 98 y después. Desafortunadamente, Microsoft no ha actualizado todas sus otras tipografías en la misma manera, entonces todavía hay muchas tipografías como Arial Black, Trebuchet, Broadway BT y Milano LET que no incluyen las vocales <ẽ, ỹ> en Windows 7. Igualmente, estos tipografías tampoco incluyen las vocales <ɨ, ï̵> del alfabeto boliviano.

Aunque Microsoft no garantiza que todas sus tipografías incluyen las vocales <ẽ, ỹ> y no hay tecleas designadas para las vocales <ẽ, ĩ, ũ, ỹ>, el alfabeto paraguayo es mejor soportado por las tipografías que el alfabeto boliviano. La gran mayoría de computadores en uso hoy en día pueden visualizar y utilizar todo el alfabeto paraguayo, sin la necesidad de instalar tipografías adicionales como Gentium y Charis SIL. Usuarios de MS Office, pueden encontrar las vocales nasales utilizando la interfaz gráfica en el menú Insertar > Símbolo. Usuarios de OpenOffice.org y LibreOffice, pueden insertar estas vocales con el dialogo disponible en Insertar > Carácter especial. Los caracteres <ã, Ã, õ, Õ> están en la sección “Latin-1” de Unicode, <ĩ, Ĩ, ũ, Ũ> están en “Latin Extended-A” y <ẽ, Ẽ, ỹ, Ỹ> están en “Latin Extended Additional”. El diálogo para insertar caracteres especiales en MS Office es mucho mejor que el diálogo en OpenOffice.org/LibreOffice, pero su extensión Compose Special Characters5 puede facilitar la búsqueda y inserción de estos caracteres desde la interfaz gráfica.

Aunque el tilde es más difícil teclear en el teclado español y latinoamericano que la diéresis, el uso del tilde para la nasalización puede reducir las divisiones con los guaranís de Paraguay y Argentina y promover más intercambios intelectuales y culturales. Además el tilde será más entendible que la diéresis, porque el tilde es la misma marca diacrítica utilizada para la nasalización en español y portugués, entonces guaranís ya entrenados en la escritura de estas lenguas pueden aprender la escritura de su propia lengua más fácilmente.

Apéndice 1: Soporte de guaraní en las tipografías
Las tipografías más utilizadas como Times New Roman, Arial y Courier New han incluido todos los caracteres del alfabeto paraguayo desde Windows 98 Segunda Edición y MS Office 2000. A veces había problemas visualizando <g̃, G̃> in estas tipografías, pero el G nasal no están utilizado en la escritura boliviana y no es recomendado que sea utilizado tampoco. De hecho hay mucho debate en Paraguay acerca del uso del G nasal en la escritura.

En cambio, el I cortado <ɨ, Ɨ> y el I cortado nasal <ɨ̈,Ɨ̈> no fueron incluidos en las tipografías más utilizadas antes de Windows Vista. El I cortado nasal no es un carácter designado en Unicode y hay que crearlo combinando <ɨ, Ɨ> con una diéresis < ̈> (U+0308) o combinado <ï,Ï> con una barra < ̵> (U+0335). Antes de la versión 5.00 de las tipografías de Monotype, que son incluidas en Windows Vista, las tipografías como Times New Roman y Arial no incluyaban I cortado <ɨ, Ɨ> y el I cortado nasal <ɨ̈,Ɨ̈>, entonces es difícil difundir textos de guaraní en forma digital, porque editores de texto y navegadores de web en Windows XP no pueden visualizar el I cortado. Para evitar este problema, muchos escritores de guaraní utilizan el formateo para tachar el I cortando, pero esta solución no funciona en todos los contextos informáticos y puede causar muchas problemas en la confusión del I normal y el I cortado.

Para textos en tipografías más comunes como Times New Roman, Arial y Courier New, es mejor utilizar el alfabeto paraguayo. Desafortunadamente, AGFA Monotype, la empresa que desarrolla las tipografías utilizadas por Windows y muchas aplicaciones, todavía no ha añadido todos los caracteres del alfabeto boliviano, ni del paraguayo. Tipografías menos utilizadas como Trebuchet, Arial Black, Broadway BT y Milano LET todavía no muestran los caracteres <ẽ>, < ̃> (U+0303) en <g̃>, <ỹ> del alfabeto paraguayo y <ɨ>,< ̵> (U+0335) en <ï̵>, < ̈> (U+0308) en <ɨ̈> del alfabeto boliviano. En este caso, tal vez el alfabeto boliviano es más conveniente, porque se puede utilizar estas tipografías y tachar el I cortado con formateo, pero esta solución no es recomendada por todos los otros problemas que puede causar en el largo plazo. La solución es usar tipografías más estándares o descargar tipografías libres que cubren la lengua guaraní.

Tipografía Uso Versión Fecha6 No incluido alfabeto boliviano No incluido alfabeto paraguayo
Times New Roman Win 98, NT SP4 2.50 1998-05-15 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) ẽ, Ẽ, ỹ, Ỹ, ̃ (U+0303) en g̃
Times New Roman Win 98SE, Office 2000 2.76 1999-05-05 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) todos incluidos; tilde demasiado alto en g̃
Times New Roman Linux, gratis 2.82 2000-05-11 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) todos incluidos; tilde demasiado alto en g̃
Times New Roman Win XPSP2 3.00 2004-07-17 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) todos incluidos; tilde demasiado alto en g̃
Times New Roman Win 7 5.05 2009-06-10 todos incluidos todos incluidos
Arial Win 98SE, Office 2000 2.76 1999-05-05 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) todos incluidos; tilde demasiado alto en g̃
Arial Linux, gratis 2.82 2000-05-11 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) todos incluidos; tilde demasiado alto en g̃
Arial Win XPSP2 3.00 2004-07-17 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) todos incluidos; tilde demasiado alto en g̃
Arial Win 7 5.06 2009-06-10 todos incluidos; ̵ (U+0335) queda a la derecha en ï̵ todos incluidos
Arial Black Linux, gratis 2.35 1998-11-10 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) ẽ, Ẽ, ỹ, Ỹ, ̃ (U+0303) en g̃
Arial Black Win XPSP2 2.35 2001-08-23 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) ẽ, Ẽ, ỹ, Ỹ, ̃ (U+0303) en g̃
Arial Black Win 7 5.06 2009-06-10 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) ẽ, Ẽ, ỹ, Ỹ, ̃ (U+0303) en g̃
Trebuchet MS Linux, gratis 1.22 2001-04-09 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308), ẽ, Ẽ, ỹ, Ỹ, ̃ (U+0303) en g̃
Trebuchet MS Win XPSP2 1.23 2004-07-17 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) ẽ, Ẽ, ỹ, Ỹ, ̃ (U+0303) en g̃
Trebuchet MS Win 7 5.00 2009-06-10 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) ẽ, Ẽ, ỹ, Ỹ, ̃ (U+0303) en g̃
Courier New Linux, gratis 2.82 2000-05-11 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) todos incluidos; tilde a la derecha en g̃
Courier New Win XPSP2 2.90 2001-08-23 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) todos incluidos; tilde a la derecha en g̃
Courier New Win 7 5.11 2009-06-10 todos incluidos; ̵ (U+0335) a la derecha en ï ̵; ̈ (U+0308) a la derecha en ɨ ̈ todos incluidos; tilde a la derecha en g̃
Tahoma Win XPSP2 3.14 2004-07-17 ɨ, Ɨ; ̵ (U+0335) queda a la derecha en ï̵ todos incluidos; tilde a la derecha en g ̃
Microsoft San Serif Win XPSP2 1.41 2004-07-17 todos incluidos; ̵ (U+0335) queda a la derecha en ï̵ todos incluidos; tilde a la derecha en g ̃
Microsoft San Serif Win 7 5.02 2009-06-10 todos incluidos; ̵ (U+0335) queda a la derecha en ï̵ Todos incluidos
Verdana Linux, gratis 2.35 1998-11-12 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) todos incluidos; tilde a la derecha en g̃
Verdana Win XPSP2 2.43 2004-07-17 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) todos incluidos; tilde a la derecha en g ̃ o no aparece en algunos editores
Verdana Win 7 5.02 2009-06-10 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) todos incluidos; tilde está adentro del G̃
Broadway BT Win 7 ? 2009-06-10 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) ẽ, Ẽ, ỹ, Ỹ, ̃ (U+0303) en g̃
Milano LET Win 7 1.0 2009-06-10 ɨ, Ɨ, ̵ (U+0335), ̈ (U+0308) ẽ, Ẽ, ỹ, Ỹ, ̃ (U+0303) en g̃

Muchas veces no es obvio que un tipografía no contiene un carácter, porque editores como MS Word, OpenOffice.org Writer, LibreOffice Writer y AbiWord automáticamente inserta el carácter faltante de otra tipografía. Si el carácter es cerca en apariencia y tamaño no se anota la diferencia. El problema surge cuando el archivo está exportado a otro programa como WordPad or un navegador de web que no puede substituir caracteres faltantes.

Muestras de Tipografías en LibreOffice 3.4.4 en Linux
Nota: Caracteres resaltados son prestados de otras tipografías porque no existe en la tipografía original.

Muestras de Tipografías en WordPad en Windows XP SP2:

Muestras de Tipografías en WordPad en Windows 7:

Muestras de Tipografías en MS Word 2010 en Windows 7:

Nota: Algunos caracteres son prestados de otras tipografías

Apéndice 2: Guaraní en el web
Hay dos maneras de mostrar los caracteres <á, ã, é, ẽ, g̃, í, ĩ, ó, õ, ú, ũ, ý, ỹ> del alfabeto paraguayo y <ä, ë, ï, ɨ, ɨ̈, ö, ü> del alfabeto boliviano en HTML, que es el lengua de formateo de páginas web. Se puede escribir estos caracteres directamente en el HTML, pero la página necesita especificar un conjunto de caracteres como UTF-8 o UTF-16 que tiene códigos para estos caracteres.

La otra opción es utilizar entidades de carácter de HTML, como ä para <ä> y õ para <õ>. Desafortunadamente, no hay entidades nombradas para los caracteres <ẽ, ĩ, ɨ, ɨ̈, ũ, g̃, ý, ỹ> en HTML 4.0, entonces hay que usar sus valores decimales de Unicode, como ũ para <ũ> y ï̵ para <ɨ̈>.

Si la tipografía especificada por la HTML no incluye estos caracteres, el usuario no puede visualizarlos. En este caso, normalmente aparecen como una caja vacía ෣. (En Firefox muestra el valor de unicode en la caja). Si esa tipografía no está instalada, el navegador utilizará una tipografía por defecto especificado por CSS. Algunas tipografías instaladas por defecto en Windows 98SE y después pueden visualizar todos los caracteres del alfabeto guaraní paraguayo (excepto de <g̃, G̃> que no son utilizados en el guaraní boliviano). En cambio, estas mismas tipografías no pueden visualizar <ɨ, Ɨ, ɨ̈, Ɨ̈> del alfabeto boliviano.

Si el escritor guaraní puede control el formateo de la página web, puede especificar un tipografía como Arial Unicode MS que es garantizado mostrar los caracteres especiales, pero muchas computadores no tienen Arial Unicode MS instalado. La única forma de garantizar que el usuario puede visualizar los caracteres especiales es usar Google Web Fonts para descargar automáticamente uno de las tipografías libres de SIL International que son diseñadas para lenguas con caracteres especiales:

  • Gentium: Un reemplazo de tipografías con serifs como Times New Roman. Soporte texto cursivo, pero no soporte negrillo ni cursivo negrillo.
  • Gentium Basic: Como Gentium pero no tiene menos caracteres de Unicode que Gentium. Tiene cursivo, negrillo y cursivo negrillo y es la tipografía recomendada para guaraní.
  • Charis SIL: Un reemplazo de Bitstream Charter, uno de los primeras tipografías diseñados para impresoras láser. Soporte texto cursivo, negrillo y cursivo negrillo.
  • Doulos SIL: Un reemplazo de Times New Roman con la misma metronomia. No soporte texto cursivo ni negrillo.
  • Andika: Un reemplazo de Arial que fue diseñado para textos sencillos de niños. No soporte texto cursivo ni negrillo.

El problema es que el navegador web tiene que descargar la tipografía y instalarlo si no está instalado en su computadora. En Bolivia, la mayoría de gente utiliza el internet en cybercafes que tienen restricciones de seguridad que no permite la instalación o utiliza un congelador como Freeze que devuelve la maquina a su estado original cada noche. Entonces, hay que descargar la tipografía nuevamente cada vez que visita la página y no hay garantía que se puede instalarlo.

Además, hay muchos sitios como Google, Yahoo, Facebook, etc, donde el usuario no tiene ningún control sobre la configuración de la página, entonces no es posible especificar la tipografía en estos sitios y añadir una linea de HTML para descargar una tipografía nueva de Google Web Fonts. En algunas situaciones se puede tachar un I cortado con el formateo, pero muchos sitios no permite el formateo del texto y guarda el contenido como texto plano en una base de datos. Los Guaranís en Bolivia pueden evitar estos problemas, si cambian al alfabeto paraguayo.

Notas
1 Un diptongo es un conjunto de letras vocálicas pronunciado como solo un sonido (fonema).
2 Un digrafo es un conjunto de caracteres (consonantes o vocales) pronunciados como solo un sonido (fonema).
3 El alfabeto zapoteco fue creado por el Instituto Lingüístico de Verano (SIL Internaciónal).
4 En Linux y BSD, los teclados de español (con tilde muerte), latinoamérica (con tilde muerte) y inglés internacional incluyen tecleas para todas las vocales nasales <ã, ẽ, ĩ, õ, ũ, ỹ>. Desafortunadamente, pocos escritores de guaraní utilizan sistemas operativos libres.
5 Aunque esta extensión sólo está listada para OpenOffice.org, funciona sin problemas en LibreOffice tambien. Para utilizarlo, instálelo y vaya a Insertar > Compose Character. Desafortunadamente, esta extensión no es traducida al español.
6 La fecha del archivo que contiene la definición de la tipografía que he probabo; no es necesariamente la fecha que la tipografía fue lanzada originalmente.

Agregue un comentario

Su dirección de correo no se hará público.