Las divisiones lingüísticas de Europa
Newsletter #183 – 2026/05/10
Buen domingo a todos,
En Europa nos hemos acostumbrado a un mapa político ordenado y estable. Hay en torno a 50 países1, con fronteras bastante bien definidas y con la impresión de que cada país tiene su lengua y cada lengua tiene su país. Pero en España sabemos muy bien que eso de un país, una lengua es algo bastante lejano de la realidad de casi cualquier país del mundo.
Basta con echar un vistazo a un mapa lingüístico de Europa para ver que todo eso no se sostiene.

Ethnologue, una de las principales fuentes para el estudio de las lenguas en el mundo, recoge casi 300 lenguas vivas en Europa. Y hablamos únicamente de lenguas, sin agrupar aquí dialectos y variaciones regionales2. Algunas de estas lenguas, como el inglés, el francés o el español, cuentan con decenas de millones de hablantes; otras, como el livonio, el ingrio o el votio, ni siquiera llegan a los cien hablantes y se encuentran en un inminente riesgo de extinción.
La lingüística es uno de los demasiados muchos temas que me fascinan. Solo me manejo bien en español e inglés, pero siempre me ha interesado la historia y relación entre distintas lenguas, no tanto desde su aspecto normativo, sino más desde la realidad de su uso en el día a día por la gente de a pie. Por eso creo que merece la pena indagar en esa idea de falso orden que muchos hemos tenido alguna vez en la cabeza.
Las lenguas de Europa
Dentro de la complejidad de las lenguas europeas, sí que existe un orden: la gran mayoría pertenece a la superfamilia de lenguas indoeuropeas. El indoeuropeo es una protolengua que posiblemente se habló en algún lugar de la estepa euroasiática3 hace unos seis milenios y que, al expandirse por Europa, fue divergiendo en distintas lenguas hasta convertirse en las familias que conocemos en la actualidad.

En este mapa se aprecia que, dentro de la diversidad, se pueden agrupar casi todas las lenguas europeas dentro de tres ramas dentro de las lenguas indoeuropeas: las lenguas romances (en rojo), las lenguas germánicas (en marrón) y las lenguas eslavas (en azul).
Las lenguas romances son todas aquellas que descienden del latín vulgar que se habló en el Imperio Romano occidental. Tras la caída del aparato administrativo del Imperio romano en la región, el latín fue fragmentándose y adquiriendo una vida propia en cada territorio. Como resultado, aparecieron multitud de lenguas limitadas a espacios relativamente pequeños, pocas de las cuales se alzaron con un estatus a lo largo de los siglos, y algunas de ellas extintas a día de hoy4.
Las germánicas tienen su origen en el norte y centro de Europa, y se dividen a su vez en dos grandes ramas: el germánico septentrional (lenguas escandinavas, principalmente) y el germánico occidental (lenguas de Alemania, Países Bajos e Inglaterra). Al igual que sucede en el caso de las lenguas romances, hay que entender que en sus orígenes, las lenguas germanas eran muchas, con una diversidad regional difícil de describir. El caso del inglés es bastante interesante y quizá merece una mención especial. A pesar de ser una lengua germana, la invasión normanda de 1066 incorporó un volumen de vocabulario romance extraordinario, lo que la convierte léxicamente en una lengua bastante cercana a las lenguas romances.
Las lenguas eslavas ocupan el centro y el este de Europa, y se dividen en tres ramas: el eslavo occidental (polaco, checo, eslovaco), el eslavo oriental (ruso, ucraniano, bielorruso) y el eslavo meridional (serbocroata, esloveno, búlgaro y macedonio). La expansión de estas lenguas llegó más tarde que las ramas románica y germánica. Desde algún origen entre los ríos Vístula y Dniéper, se fue desplazando entre los siglos V y VI, coincidiendo con las grandes migraciones de pueblos germánicos tras el colapso del Imperio Romano. Esta rama tiene además la peculiaridad de dividirse también en dos sistemas de escrituras distintos: el latino y el cirílico5. Incluso existe una lengua, el serbocroata, con la peculiaridad de usar ambos sistemas de escritura de forma intercambiable según el contexto6.

Más allá de las tres principales ramas, el indoeuropeo en Europa tiene varias singularidades. El griego tiene su rama propia, con una tradición escrita que tiene casi tres mil años, aunque la lengua en sí ha cambiado tanto como cualquier otra7. El albanés y el armenio también conforman su propia rama, sin ningún antepasado común. Y luego está el caso del romaní, la lengua del pueblo gitano, también de origen indoeuropeo, con cerca de 10 millones de hablantes distribuidos por toda Europa. Precisamente, es esa falta de concentración en un territorio o de continuidad la que hace que, a la hora de la verdad, sea la lengua invisible por excelencia de Europa8.
Más allá de la familia indoeuropea, en Europa hay dos casos que suelen generar mucha curiosidad. Por un lado están las lenguas finoúgricas, entre las que se encuentran el finés, el estonio, el húngaro y las lenguas sami9. Por otro, el euskera (o vasco), la única lengua de Europa y una de las pocas del mundo de la que no se le conoce pariente alguno. Lo único que sabemos es que se trata de una lengua preindoeuropea que sobrevivió en los Pirineos occidentales mientras las lenguas romances conquistaban todo lo que le rodeaba. El maltés también merece mención especial, ya que se trata de una lengua fruto de la unión del árabe magrebí y las lenguas italianas, lo que la convierte en un híbrido de lengua semítica y romance muy difícil de clasificar.
Cuando las lenguas no sabían de fronteras
Históricamente, las lenguas no entendían de fronteras. Esas líneas imaginarias que definían reinos e imperios eran lo suficientemente permeables como para que habitantes a ambos lados continuaran interactuando y manteniendo vivo un medio de comunicación común. Europa, hasta hace relativamente poco, no era más que una inmensa distribución de continuos dialectales: gradaciones en las que hablantes de localidades cercanas se entendían, pero cuando les separaba más de cien kilómetros, ya empezaban las dificultades. No había lenguas que terminaran en un punto y comenzaran en otro.
![r/MapPorn - Incredibly detailed map of Italian dialects [2000 × 2286] r/MapPorn - Incredibly detailed map of Italian dialects [2000 × 2286]](https://substackcdn.com/image/fetch/$s_!YNFh!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Faa1753da-9069-493b-b815-3d821b82166d_2000x2286.png)
Italia es el país que mejor representa esta realidad, aún en la actualidad. Dante Alighieri, ya en el siglo XIV, escribía en De vulgari eloquentia sobre el mosaico de variedades regionales notablemente distintas entre sí. Con los años, el toscano literario se impuso como estándar escrito, pero la sociedad y la comunicación oral siguieron su propio camino. Es cierto que, si miramos a los textos de la Edad Moderna, parecen reflejar uniformidad, pero eso era únicamente la uniformidad de élites y académicos, no la del conjunto de los habitantes de la región. En la región de la actual Francia sucedió algo muy parecido, aunque en el ámbito literario todas esas variedades estaban cristalizadas en dos estándares: el occitano del sur y el francés del norte.
En los márgenes del día a día, había personas y lugares en los que el contacto entre comunidades distantes era más intenso: mercaderes y puertos. Allí la necesidad empujó a soluciones de compromiso, como el caso del sabir. Esta lengua, o más bien herramienta, se desarrolló en los puertos del Mediterráneo entre los siglos XV y XIX como lengua franca para facilitar las comunicaciones comerciales. Tomaba aspectos del italiano, el español, el árabe y el griego, principalmente, aunque también detalles de otras lenguas allá donde fuera necesario. Nadie buscaba normalizar, sino un entendimiento mínimo que hiciera posible hacer negocios.
Todo este panorama lingüístico de diversidad cambió en el siglo XIX, gracias a tres fuerzas que crearon una tormenta perfecta: el nacionalismo político, la normalización de la escritura y la escolarización masiva. El argumento lo hemos escuchado todos hasta la saciedad, ya sea leyendo sobre historia o escuchando a algunos políticos en la actualidad: un estado, una nación, una lengua. La diversidad lingüística pasó de ser una realidad de subsistencia a ser un problema de cohesión y un punto de fricción.

Cada país optó por una estrategia distinta. Francia ha pasado a la historia, merecidamente, por tomar la vía más agresiva. Prohibieron el uso en las escuelas de cualquier lengua que no fuera el francés, lo cual lanzó al bretón, al occitano o al alsaciano al borde del abismo. Alemania, como una nación relativamente reciente, tuvo un proceso mucho más gradual en el que pesó más la fuerza editorial que la fuerza estatal. Se estandarizó el alemán escrito gracias a la imprenta y la Biblia de Lutero, y poco a poco esta variedad fue dejando de lado al resto. En Italia, la unificación de 1861 se encontró con un país en el que menos del 3 % de la población usaba el italiano en la vida cotidiana.
España puede considerarse un caso aparte. La diversidad lingüística tuvo una gran resistencia por parte de las comunidades. Esto, unido a la incapacidad del Estado para llevar a cabo una estandarización como la francesa, permitió que muchas lenguas se mantuvieran vivas hasta bien entrado el siglo XX. Es cierto que el franquismo intentó una supresión activa de las lenguas regionales, pero el uso privado y la cultura permitieron una resistencia con la que el catalán, el euskera y el gallego llegaron vivos al fin de la dictadura. Sin duda hubo daños e hicieron falta décadas de recuperación, pero estas tres lenguas gozan en la actualidad de salud como pocas lenguas minoritarias en Europa10.
Las otras divisiones lingüísticas
Hasta aquí os he hablado de lenguas y de cómo históricamente unas se impusieron a otras. También he hablado de familias y ramas lingüísticas, que nos indican parentescos pasados entre lenguas presentes. Pero hay otra forma de ver la permeabilidad lingüística más allá de la división en lenguas y dialectos, algo que ningún atlas político muestra. Se trata simplemente de rastrear cómo se llaman algunas cosas cotidianas en las distintas lenguas y observar qué líneas dibujan esas distrubiciones.
Para ello, he elegido cinco alimentos: la naranja, el té, la patata, el azúcar y el pan.

La naranja es uno de los ejemplos más conocidos. En el mapa se agrupan las lenguas en cuatro familias según su término de origen. La familia árabe, que produjo naranja en español, orange en francés o arancia en italiano. A esta familia árabe le salió la variante eslava, con la misma raíz, que se formó pomarańcza en polaco o pomeranč en checo. La familia portuguesa que, aunque no se use en Portugal, es una referencia directa al país como origen del fruto, como portokáli en griego o portocál en rumano. La última familia es la de la manzana de China, que pone el origen de esta fruta en Asia oriental, con el caso de apel’sín en ruso o appelsin en noruego.

El mapa del té divide Europa con una increíble precisión, en función de la ruta por la que llegó la bebida. Las lenguas que dicen te, thé, tee o tea se corresponden con países donde el té llegó por el comercio marítimo portugués y holandés desde la región china de Fujian, donde la hoja se llama te. Las lenguas que dicen chai, čaj o variantes semejantes se corresponden con regiones donde el té llegó mediante la ruta de la seda, por lo que su origen hace referencia al mandarín chá. Si os fijáis, esta frontera lingüística separa casi a la perfección los países que comerciaban con Asia por tierra y los que lo hacían por mar.

La historia de la patata es especial. Llegó a Europa después de la llegada de los europeos a América, y se introdujo en el continente como algo desconocido, que cada región adoptó a su manera. La raíz taína batata pasó por el español y de ahí se extendió por el Mediterráneo y por gran parte del Atlántico. En alemán, el término Kartoffel esconde un camino largo, a través del italiano tartufolo (diminutivo de trufa), que hace referencia al parecido visual entre ambos alimentos. De algún modo, la patata es el ejemplo de una adaptación a lo desconocido, pero con una clara ruta de entrada e influencia.
![r/MapPorn - [OC] Where the word for sugar comes from in each language! (see comments for quick notes) r/MapPorn - [OC] Where the word for sugar comes from in each language! (see comments for quick notes)](https://substackcdn.com/image/fetch/$s_!ZtvV!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F8d9f0fa2-07c8-4512-b723-9a98e5c38b53_1200x962.png)
El azúcar es uno de los términos más homogéneos en las lenguas europeas, con sus adaptaciones fonéticas a cada lengua. El origen de esta palabra está en el sánscrito śarkarā, que pasó al árabe sukkar y de ahí a toda Europa. Primero de forma directa al Mediterráneo, incluyendo la península ibérica, Italia y los Balcanes, aunque también Alemania. Precisamente del alemán Zucker se extendió a toda Europa central, Europa oriental y los países nórdicos. La palabra en antiguo francés chucre fue la culpable de los términos que se usan en las Islas Británicas, Francia y Benelux. La antigua Yugoslavia tiene una pequeña variación a través del turco şeker, aunque tan solo es un paso más en el mismo origen.
La única excepción que encontramos a este patrón en Europa es el esloveno con sladkor, que literalmente significa dulce.

Para finalizar, he querido dejar el pan, ya que de algún modo muestra que las lenguas son resilientes ante cosas comunes que siempre han estado entre nosotros. Aquí no hablamos de una palabra que se adapta como un producto extranjero, sino de una palabra que evolucionó junto a las lenguas de cada región. Por supuesto que hay matices, pero a grandes rasgos en el mapa podéis ver una división lingüística para el pan que se asemeja mucho a la división lingüística por familias que hemos visto más arriba. Aquí no hay rutas comerciales, solo la esencia subyacente de la lengua.
Los cinco mapas que he traído en esta última parte no son una excepción curiosa al orden lingüístico de Europa, son la norma. A lo largo de la historia, los hablantes de distintas lenguas se han prestado palabras a través de distintas rutas con total indiferencia hacia las fronteras que reinos, imperios y estados fueron trazando a su alrededor. El mapa político de Europa es un constructo reciente, con apenas dos siglos en un formato semejante al actual. Las lenguas, por su parte, llevan milenios en evolución. E indudablemente, tienen memoria.
Por petición popular, os dejo por aquí un botón para procrastinar, por si os pillo aburridos. Cada vez que pulséis en él, os llevará a un mapa distinto de los más de 1200 que tiene el catálogo.
Si te gusta lo que lees, no dudes en suscribirte para recibir un correo con cada nuevo artículo semanal. El correo de bienvenida vendrá además con una sorpresa que apreciarás si te gustan los mapas.
Dependiendo de dónde pongamos los límites de Europa, el número de países puede variar. En Sporcle suelen utilizarse 47, aunque se excluyen los países del Cáucaso, con los cuales se podría llegar a 50.
Antes de que saltéis al cuello, esperad, que ya hablaremos más adelante de los dialectos y la diferencia entre dialecto y lengua.
No hay consenso sobre el punto original del protoindoeuropeo, aunque la hipótesis de la estepa póntica es la más aceptada en la actualidad.
No quiero caer en la trampa de centrarme únicamente en las lenguas que se convirtieron en estatales más tarde y que son las más reconocibles a día de hoy. Una lista más o menos explicativa de las lenguas que surgieron del latín vulgar puede ser esta: Castellano, portugués, gallego, catalán, aragonés, asturleonés, navarro-aragonés, francés, occitano, francoprovenzal, gascón, véneto, lombardo, piamontés, ligur, napolitano, siciliano, sardo, rumano, dalmático, istriota, istrorumano, megleno-rumano, arrumano, romanche, ladino dolomítico, friulano y mozárabe. Pero esto en sí es una clasificación moderna, tan solo una simplificación de la realidad del momento.
Las lenguas eslavas occidentales, el esloveno y el croata usan el alfabeto latino; el ruso, el ucraniano, el búlgaro y el macedonio usan el cirílico, creado en el siglo IX por los monjes Cirilo y Metodio para traducir textos religiosos.
Uso serbocroata como lengua y no lo divido en croata, serbio, bosnio y montenegrino, aunque podría hacerlo si pensamos en la autodenominación de esta lengua en sus distintos países después de la desintegración de Yugoslavia.
Dicho de otro modo, el griego antiguo y el griego moderno no son inteligibles entre sí.
Es muy complicado verificar cuántos hablantes de romaní existen realmente, ya que no suelen formar parte de los censos nacionales. Las estimaciones suelen variar entre seis millones y doce millones, con mayor peso en países como Rumanía, Bulgaria, Hungría, Eslovaquia, República Checa o España. Y sí, hablo de romaní muy a la ligera, cuando en realidad hay tres variedades que no son inteligibles entre sí: el caló (típico de España), el sinti (típico de Alemania) y el romanés balcánico. Aquí os dejo un mapa para que veáis la distribución.
Las lenguas sami no son una lengua, sino una familia de unas diez lenguas distintas, con distintos grados de hablantes.
No todas las lenguas minoritarias tuvieron la misma suerte, todo sea dicho. El aragonés y el asturleonés están aún en una situación muchísimo más precaria.



Wow … Con esto tengo para el finde. Me faltó Georgia, su lengua y su escritura …
Gracias