一、语言区
语言区是根据语言上的差异而划分的空间分布范围。各种语言差异的程度变化比较大,在词汇和语法、发音等方面可能完全不同。
根据词汇应用和发音差异而划出的地域分界线称为等语线(isogloss)。例如,美国伊利诺斯州、印第安纳州和俄亥俄州北部的人把鸡胸分叉的骨称为叉骨(wishbone,其含义为两人共扯此骨,扯开成为二骨,其长度不等, 得其长者万事如意),而南部一些地方,称此为曳骨(Pully-bone)。这种词汇应用上的差异在地域上的界线就是所谓的等语线。如果选用其他词汇, 则会画出另一等语线。因而,可以说选用多少词汇就可画出多少条等语线。由于各词汇的应用与发音差异不可能完全相同,所以,等语线不是完全重叠的。各语言地理学家可根据自己研究的目的与选择的标准不同,画出各种特征语言分布区。但是实际上,有些等语线往往聚集在一起,多条等语线聚集的地方,也就是语言发生急剧变化的地方,也是划分方言与其他语言最合适的地方。例如,在英国北部卡莱尔(Carlisle)和登弗里斯之间向东北方延伸到柏尔威克(Berwi- ck)是许多等语线汇集处,这表示此线是北英格兰和
南苏格兰之间方言的过渡带。在美国的得克萨斯州,由于过去受西班牙人的影响,所以在英语中采用了许多西班牙语词汇。根据应用西班牙语词汇而画出的等语线大多从沿海的加尔奥斯顿向西北方向延伸。
从此看来,不论是同一语言中的方言,还是不同语言中语种,其相接触的地方往往是一种语言混合使用的带而不是明显的线。这就给满足某种要求画出具体分界线带来一定困难。语言分布大都是在地域上相连成片的分布区。但是,有时也出现与主分布区不相连的岛状分布,成为语言岛。这种语言分布上的特殊现象,常会引起语言和地理学家的注意。
世界上的语言大约有 2500—3000 种。根据其语音、语法和词汇等方面特征的共同之处与起源关系,把世界上的语言分成语系。每个语系包括有数量不等的语种。这些语系与语种在地域上都有一定的分布区,很多文化特征都与此有密切的关系。现在对各种语系及其地理分布简介如下。
图 5—1 世界语言分布图
(一)印欧语系
印欧语系(Indo-European)是世界上最大的语系,可分为 4 个语组: 1.日尔曼语组(Germanic)。此语组包括英语、西日尔曼语、北日尔曼
语和东日尔曼语 4 部分。
- 英语的发展:英语在英格兰已有 1500 年历史。这块土地,过去遭到过来自丹麦的盎格鲁人(Angles)、萨克逊人(Saxons)和朱特人(Jutes) 的入侵。英格兰(England)这个名字就源于盎格鲁。英语就是由这 3 个民族所说的语言融合而成的。
这 3 个民族都属于日尔曼民族,他们分别居住在现今的丹麦南部、北部, 以及德国的西北部。他们的语言类似于北欧其他民族的语言,所以,英语属于日尔曼语组,与其他日尔曼语在结构上有许多相同之处。
在这 3 个民族入侵前,英格兰的居民主要是凯尔特人(Cel-ts),他们
说的是凯尔特语。凯尔特人于公元前 2000 年到达以前,那里说什么语言,至今并不清楚。在英语成为那里的语言的同时,凯尔特语则被排挤到康瓦尔与威尔士和苏格兰边缘的高地一带。康瓦尔语早在 17 世纪时已经灭绝,说苏格兰语和威尔士语的人数也已不多。
随着英国在全世界殖民地体系的建立,英语被传播到世界很多地方。最早的殖民地是在北美洲,后来是澳大利亚、新西兰和南非。在其他地区的殖民地,如印度等国,虽然独立以后已采用本民族的语言,但同时也继续用英语。因此,现在估计在世界上用英语作为执行政府公务和出版文件用的官方语言的人数占世界人口的 1/4。加上把英语作为第二语言的人数,总人数可能将近世界人口的半数。
- 西日尔曼语:虽然此分支在起源上属于同一语组,但后来已演化成 2 个分支,即高地日尔曼语和低地日尔曼语。高地指德国南部的山地,低地指北部的低地。英语也是低地日尔曼人所说的语言,后来由于他们迁往英格兰, 经演化而成英语。
低地日尔曼语包括旧萨克逊语(Old Saxon)、旧低地弗兰科语(Old Low Franconia)和旧弗里西亚语(Old Prisian)。旧萨克逊语是那些没有迁往英国而留在原处的萨克逊人说的语言,它是今天低地德语的主要成分,是现
代德国北部人说的现代德语中的一种方言。旧弗兰科语是现代荷兰语和弗兰芒语的基础,而弗里西亚语只是荷兰东北部少数人所说的语言。高地德语成为现在标准德语的基础。
- 北日尔曼语:北日尔曼语是斯堪的纳维亚人所说的语言,其中包括瑞典语、丹麦语、挪威语和冰岛语。原来,这些语言是相同的,起源于古代斯堪的纳维亚语(Old Norse)。在 10 世纪以后,由 于人口的迁移和政治形成了不同的国家而带来了语言上的分化。
在这 4 种语言中,冰岛语与其他 3 种语言在地理位置上相距较远,所以比起其他日尔曼语来,变化较小。
- 东日尔曼语:这种语言在历史上存在过,但现在已经灭绝这种语言主要是公元 3 世纪时,住在欧洲东部和北部的哥德人用的语言。到 16 世纪时, 说这种语言的哥德人住在俄国的克里米亚。由于受到政治控制的影响,哥德人的后代使用其他语言,而这种语言就消失了。可见,一种语言的空间分布是衡量一个文化集团命运的尺子。如果该文化集团兴旺发达,则其使用的语言就会在地理范围上不断扩大,反之,则会缩小,甚至终于灭绝。
- 罗曼语组(Romance)。在印欧语系中与日尔曼语组相匹敌的是罗曼语组。也称为拉丁语组。这种语言是由于古罗马人说的拉丁语发展而来的。所以称为罗曼语。
拉丁语的传播与罗马城地位的提高有关。在公元 2 世纪罗马最盛时期, 罗马帝国的疆域西达西班牙、北到不列颠群岛,南至非洲北部,东面经中东抵黑海。随着罗马军队在帝国各省的进驻,拉丁语也被传播到各个角落。而各省当地人所说的语言由于受到征服者语言的抑制而大大地削弱,甚至被消灭。
在罗马帝国灭亡以后,虽然拉丁语仍在一些地方继续使用,但其范围已大大缩小。在其他地方有的已恢复使用原来的语言,有的则被东方或北方说日尔曼语和斯拉夫语的民族所征服。
在罗马帝国时期,拉丁语在各省也有不同。帝国各省经历了几百年的殖民与统治,各省所用的拉丁语以占领时期罗马军队所说的口语为基础。同时, 各省的拉丁口语中由于引入许多当地原语言中的词汇而有了变化。所以各省所用的拉丁语词汇已不是标准的书面形式,而是一种被称作通俗拉丁语
(vulgate Latin)的口语。vulgar 这个词的意思即是指平民。驻防在帝国各地军队用的是通俗拉丁语,它在词汇上与文学上用的拉丁语不同。例如, 在拉丁语中,文学上用的拉丁语的马是 equus,英语中由此词转化为 equine
(马)和 equestrain(骑马者)。可是,平民所用的通俗拉丁语中,马这个词是 caballus。现代意大利语中的马则由此词转化为 cavallo,在西班牙语中为 caballo,在葡萄牙语中为 cavalo,在法语中为 cheval,在罗马尼亚语中为 cal。在 5 世纪以后,罗马帝国崩溃,使先前各省与它的往来和联系中断,结果导致拉丁口语在各地区的差异增加。到 8 世纪,这种彼此的孤立终于使彼此的语言发生根本性变化。今天,拉丁语已成为过去的语言,除在一些宗教活动中与某些科学文献中使用外,已没有人使用这种语言,更没有人说这种语言。
现代罗曼语,在当前罗曼语中主要有西班牙语、葡萄牙语、法语、意大利语和罗马尼亚语等 5 个语种。这些语种在欧洲的分布与这些国家的国界大体是一致的。从地图上可以看出,西班牙和法国之间有比利牛斯山相隔;在
意大利和法国之间有阿尔卑斯山阻挡;在意大利和罗马尼亚之间有斯拉夫语区。自然的和人文的阻隔使得语言处于孤立状态。随着时间的推进,语言发生变化。各罗曼语种并不是突然出现的。开始作为各省的方言出现,后来, 随着民族和国家的发展,才出现标准的民族语言,所以法语、西班牙语等都是近期才逐渐形成的。
- 法语:法语是由法国北部的方言演变而来的。因为首都巴黎就在该区范围内,所以把这里的方言称为标准法语。从 18 世纪以后,巴黎法语由于巴黎在政治、经济和社会方面的领导地位而加速向外传播,遂在法国取得优势地位。
法国的方言分南北两部分,北部方言被称作 langue d'oil,南部的方言被称作 langue d'oc。这两个词汇是由于表达所谓“是”的方式不同而产生的。罗曼语的“是”为 hoc illud est,意思是就是这样,在南方,这个词汇被简化成 hoc 或 oc,因为 h 不发音,所以被取消,就变成了 oc。在北方这个词被简化成 o-il 或 oil 即把 hoc illud est 的 hoc illud 内 h 音消掉, 并简化而成 o-il,如果将这两个音节快读,就变成 oil,同时又把最后 est 的音也取消就成为 oil。现在南方方言又称为普罗旺斯语。
法语在非洲有相当影响。由于许多地方过去是法国殖民地,所以,在独立后,这些国家(约有 20 个)多仍用法语作为官方语言。
- 葡萄牙语和西班牙语像英语一样,在罗曼语中,特别是西班牙语和葡萄牙语由于其过去具有大片的殖民地,所以亦成为世界性语言。使用这两种语言的人 80%在欧洲以外,主要是在中美洲(含墨西哥)和南美洲。因此, 中美洲和南美洲又称为拉丁美洲。在拉丁美洲,以西班牙语作官方语言的就有 18 个国家。
说葡萄牙语的在拉丁美洲只有巴西,其人口约占南美洲总人口的一半, 它约等于葡萄牙本国人口的 11 倍。需要指出的是,葡萄牙语成为南美洲东部
的官方语言,西班牙语成为其他拉丁美洲的官方语言,是由于 1494 年在教皇仲裁下,签订托尔德西里雅斯条约,双方同意大约相当于西经 46°作为分界线,此线以东地区归葡萄牙、以西归西班牙所造成的。此即历史上有名的“教皇子午线”。
西半球各地所用的西班牙语和葡萄牙语与欧洲用的有些差别。所以巴西与葡萄牙有一联合语言委员会,目的在于使其共同语言标准化。
-
意大利语:在欧洲与其国界几乎完全一致。在非洲只有索马里以意大利语作为官方语言。
-
罗曼什语、加泰隆语和撒丁语:这是罗曼语组中除去上述 4 种主要语
种以外的 3 种运用范围不广的语种。罗曼什语分布在瑞士东部,用此种语言
的只有 2 万多人,被列为瑞士 4 种官方语言之一。加泰隆语,也可作为西班
牙语的一种方言,使用的人有 600 多万,分布在以巴塞罗纳城市为中心的西班牙东部。同时,该语言也是位于西班牙和法国之间的比利牛斯山中间的安道尔的官方语言。撒丁语分布在意大利的撒丁岛上,是意大利语、西班牙语与阿拉伯语的混合物,亦是该岛的通用语言。
瑞士位于日尔曼语与罗曼语两语组之间的过渡地区,其官方语言有德语
(占总人口的 69%)、法语(占 21%)、意大利语(占 10%)、罗曼什语(占1%)。该国尽管语言复杂,但人民能和平相处,具有强大的向心力。
- 斯拉夫语组(Slavic)。该语组亦称波罗的-斯拉夫语组,一般可划分
为东、西、南 3 语种。斯拉夫语实际上在 17 世纪才被确认,并随斯拉夫各民族的分离而出现分化。
- 东斯拉夫语:这个语种使用的人数最多,分布最广。东斯拉夫语即俄语。俄语是苏联的主要语言,使用该语言的人有 2 亿多。第二次世界大战后,
俄语的重要性有所提高,成为联合国使用的 5 种正式语言之一,在欧,俄语是各国的第二语言。在前苏联,除俄语外,属于东斯拉夫语的还有乌克兰语、白俄罗斯语,前者使用的人数有 4000 多万,后者有 900 多万。
-
西斯拉夫语:这种语言主要有波兰语、捷克语和斯洛伐克语。后两种是捷克和斯洛伐克的官方语言,有时也被合称一种语言。
-
南斯拉夫语:这种语言包括保加利亚语、塞尔维亚语、克罗地亚语、斯洛文尼亚语和马其顿语。除保加利亚语是保加利亚的官方用语外,其余 4 种都是前南斯拉夫的官方语言。塞尔维亚语和克罗地亚语虽然前者用古斯拉夫字母,后者用拉丁字母,但这二者仍然十分相近,所以亦被认为是一种语言。在斯拉夫语中,各种语言与其他印欧语系的语言相比,差异比较小,所以这几种语言相互可以理解的部分比较多。
- 印度-伊朗语组(Indo-Iranian)。此语组在印欧语系中使用的人数最多。本语组包括 100 多个语种,使用的人数超过 9 亿,属于东部印度-伊朗语的有孟加拉语、印地语和巴基斯坦语,属于西部的有伊朗语。
在印度-伊朗语组中,使用印度语的人数最多,包括印度人、巴基斯坦人和孟加拉人。巴基斯坦人主要用乌尔都语;在印度大约有 1/3 的人用印地语, 他们大都分布在印度北部。这两种语言十分接近,不过乌尔都语用阿拉伯字母,而印地语用印度自己的字母。如果把这两种语言当作一种语言,则其使用的人数占世界第三位。
在孟加拉和印度东部的人说孟加拉语,人数超过 1.3 亿。在印度,属于
印欧语系的大约还有近 100 种语言,其中使用人数比较多的是旁遮普语(6000 多万人)、马拉蒂语(5000 多万人)、古吉拉特语(3000 多万人)、其他还有拉贾斯坦语、比哈尔语、奥里亚语、阿萨姆语等。
在印度,除属于印欧语系的语言外,还有很多语言分属于达罗毗荼语系、汉-藏语系和南亚语系。达罗毗荼语是单独的语系、是游牧雅利安人进入印度以前居住在印度的民族说的语言,以后受雅利安人影响而南迁,现住在南部德干高原。属于该语系的有坎纳拉语(在德干高原西北)马拉雅兰语(在德干高原西南)、泰卢固语(在德干高原的东北)、泰米尔语(在德干高原东南)。使用汉-藏语的人分布在印度的西北和克什米尔东部与东北部,与缅甸接壤的那加兰邦,使用那加兰语。分散于印度东北与东部的卡西语(在阿萨姆邦)、蒙达语(在比哈尔邦和奥里萨邦)、桑塔尔语(比哈尔邦和西孟加拉邦)则属于南亚语系。
在印度,宪法承认作为官方语言的有 14 种,其中 10 种属于印欧语系(阿萨姆语、孟加拉语、古吉拉特语、印地语、克什米尔语、马拉蒂语、奥里亚语、旁遮普语、梵文和乌尔都语),4 种属达罗毗荼语(坎纳拉语、马拉雅兰语、泰卢固语、泰米尔语)。使用这 14 种语言的占人口 90%。虽然在印度会说英语的人数只占 1%,但英语仍是各语种之间的交谈时经常采用的语言。在印度-伊朗语组中,有一种语种在空间上与其他语种分离,它是斯里兰
卡的僧伽罗语。在斯里兰卡约 75%的人操僧伽罗语,他们住在西南部。其余约 25%的人说泰米尔语,住在东北部。这两部分人在政治和经济上都有矛盾。
在泰米尔人中,有一半是斯里兰卡的公民;另一半出生于印度,在斯里兰卡无公民权。加上说僧伽罗语的人信奉佛教,而说泰米尔语的人信奉印度教和伊斯兰教,所以常出现矛盾。
在西部的印度-伊朗语组中,有法斯语和普什图语。法斯语用于伊朗,普什图语用于阿富汗和与阿富汗相邻的巴基斯坦的西部地区。分散于土耳其、伊朗和伊拉克的库尔德人用的库尔德语也属于该语组。这些语言都采用阿拉伯字母书写。
- 其他语种。在印欧语系中,还有一些小的分支,如阿尔巴尼亚语、阿美尼亚语、凯尔特语和希腊语,今天仍有少部分人在使用。阿尔巴尼亚语和希腊语基本上限于阿尔巴尼亚和希腊。用亚美尼亚语的亚美尼亚人除聚居高加索的亚美尼亚共和国外,还有不少人分散于附近地区和国家。凯尔特语在公元前后使用范围很广,包括现今的英国、德国、法国、意大利北部。可是, 今天这种语言只在爱尔兰有人使用,人数约 100 万,在苏格兰约有 10 万。在爱尔兰,盖拉语和英语一齐被当作官方用语。在法国西北部的布列塔尼半岛上仍保留着布列塔尼口语,这是遗留下的另一种凯尔特语。
在印欧语传入到欧洲以前,欧洲流行的语言在今天仍被保存下来的只有巴斯克语。它现在只分布在西班牙北部与法国西南相连的比利牛斯山地区, 使用的人有 100 多万。山区的闭塞环境使这种语言得以保存。
- 印欧语的起源。据推测,最早使用印欧语的是库尔干人(Kwrgan)。他们早先居住在里海北部靠近伏尔加河的草原地区。据考古学研究,库尔干人遗迹最早年代可追溯到公元前 4300 年,即距今 6000 多年前。语言学家是根据所有印欧语中某些共同使用的词汇以追溯其共同根源的。这些词汇所代表的实物和现象必然是原先印欧语使用者所熟悉的,后来掺杂到印欧各语系中的词汇,则难于研究其起源,因为这些词汇是印欧语分化后才掺杂进去的。在各种印欧语言中,经研究其中共同性的基本词汇有“冬天”和“雪”,而不是“海洋”。所以可以认为原先说印欧语的人居住在寒冷气候地区,那里距海较远。在印欧语中某些代表动物和树木的词汇有共同的词根,而在其他语系中却没有。此类词有山毛榉树、橡树、熊、鹿、雉鸡和蜜蜂,但却没有象、骆驼、稻米和竹子这类词汇。这些动植物分布的环境,可作为研究印欧语的起源的佐证。
据考古学研究,早期说印欧语的库尔干人已经有牧业,他们已驯养了马和羊,但还没有高度发达的农业。大约在公元前的 3000—2500 年间,库尔干人向欧亚各地迁移。他们向西进入欧洲,向东进入西伯利亚,向南则抵达西亚,并征服了这些地区。在其征服活动中,马为他们立下功绩。库尔干人起初是为其牲畜寻找新的草地而迁移、扩展,以后被其征服的人为了生存不得不顺从统治者的语言。库尔干人所占据的领土范围很广,但并没有统一的政权,各地的部落又相互孤立,由于世代的孤立,语言分异日益增大,最终在广大地区形成具有多语种的印欧语系。
(二)汉-藏语系
汉-藏语系包括汉语、藏缅语、苗瑶语、壮侗语等语种。其分布地区包括中国、缅甸(缅语)、泰国(泰语)以及周围邻近地区。
- 汉语。汉语是我国汉族的语言,我国有些少数民族也使用汉语,因此使用汉语的总人数达 10 亿以上。是世界上使用人数最多的一种语言。由于历史与地理上的原因汉语形成很多方言,彼此差异较大,一般认为,汉语中包
括有七大方言,七大方言及其使用范围见表 5-1。
汉语的特点是单音成意,每个音节代表一个意义,每个字代表一个音节。因此,每个字代表一个意义。汉字不是拼音文字,字与表 5-1 汉-藏语系