Beruflich Dokumente
Kultur Dokumente
COMPARATIVA Y
OBTENCIÓN Y COMPARACÍON DE
FRECUENCIAS RELATIVAS DE LETRAS
Este sería el punto débil del método comparativo en lingüística, por mucho que
se parezca el castellano al latín la mejor prueba de su parentesco resultan los datos
históricos sobre la ocupación de la península por el Imperio Romano, los textos en
latín escritos en la península misma y encontrados en numerosos lugares etc.
A priori nadie lo diría, dos idiomas geográficamente tan alejados, hablados por
culturas un tanto dispares y formalmente indescifrables el uno para el otro son una
especie de primos lejanos. De hecho la teoría que afirma esta relación supuso toda
una revolución para la lingüística cuando Sir William Jones la formulo en 1788 y que
más tarde se comprobaría gracias a la lingüística histórica o comparativa.
Los lingüistas afirman que entre el año 3000 antes de cristo y el 2000 a.C una
lengua hablada en el caucaso se expandió por Europa y el sub-continente indio siendo
esta lengua que se llama indoeropeo, la madre del sánscrito (lenguaje sagrado de la
india del que por suerte conserva escritos), griego, latín, lenguas germánicas (de
donde vendrán las lenguas inglesa, alemana, noruega…), lenguas eslavas, lenguas
celtas, lenguas iranias… Así la lingüística ha sido capaz de relacionar en un mismo
nodo la práctica totalidad de idiomas hablados actualmente en Europa así como
algunas lenguas extintas, excepción hecha del Húngaro, el Fines, varios idiomas
hablados en la zona de Georgia, el Euskera y el Etrusco.
Euskera
¿Pero, a la hora de comparar dos idiomas como sabemos si estamos
comparándolos bien? Si comparamos una lista de diez palabras entre dos lenguajes y
por casualidad una de ellas es un préstamo de otro idioma estaremos introduciendo un
sesgo bastante importante en nuestra estimación. Otro problema es que teniendo los
idiomas miles de palabras diferentes con total seguridad podemos afirmar que
tomados dos idiomas totalmente dispares encontraremos unas cuantas palabras
iguales y de diferente significado e incluso varios pares de palabras iguales con el
mismo significado, seguramente monosílabos o bisílabos. Por ello no nos debemos
dejar llevar por la euforia si encontramos que los indios fueginos llaman Dar Vader a
un demonio del bosque (exagerando un poco), al fin y al cabo el repertorio fonético
humano no es ilimitado!
Una vez calculadas las frecuencias de los cinco idiomas las pasé a Excel
donde he sacado los grafiquillos que vienen al final.
Nótese que la elección de los idiomas no ha sido al azar, todos estos idiomas
comparten cierta característica en su ortografía, en general los sonidos se representan
con las mismas letras, esto es, los fonemas se representan de la misma forma. Para
comparar el inglés por ejemplo con el castellano habría sido necesario escribir otro
programa que midiese las frecuencias de los fonemas en cada idioma, este programa
sería más general y más útil pero hubiese requerido más tiempo y en estas fechas no
abunda. A la hora de adaptar el texto en portugués y el catalán se ha cambiado la ç
por la s y en general se han cambiado las letras con acentos de diverso tipo por sus
equivalentes no acentuadas.
De los datos S.I. obtenidos podemos concluir que en general el vasco tiene
menor nivel de parentesco con el castellano que otros idiomas de su entorno
comprobando lo que ya sabiamos y la hipótesis inicial.
Las frecuencias se han sacado de los siguientes textos algunos buscados mediante
google:
Bibliografia y fuentes:
-‘’El Euskera Arcaico’’ de Luis Nuñez Astrain, Editorial Hiru del libro aunque acabo de
descubrir que esta disponible en
http://www.erabili.com/zer_berri/muinetik/dokumentuak/2004/El_Euskera_Arcaico_Exte
nsion_y_Parentescos.pdf
Es interesante e incluso divertido en la parte que enumera unas cuantas teorias locas
que se han llegado a plantear para emparentar el Euskera.
-Wikipedia (sección de lingüística en ingles y en castellano, muy completas)
-‘’Elementary Cryptanalysis, a mathematical approach’’, de Abraham Sinkov,
Mathematical Asociation of America MAA, New mathematical library.
GRAFICOS: