天才一秒记住【爱看小说】地址:https://www.antiquessd.com
为了找到答案,让我们来看看美国语言学家泰勒·施诺贝伦(TylerS)的一篇文章。
他使用了一套名为“世界语言结构地图集”
(WorldAtlasofLinguisticStructures)(wals.info)的公开数据库。
你可以把这套数据库想象成一份庞大的电子表格,其中,每一列代表一种语言特征(是否存在鼻元音,或是主谓宾语的顺序),而每一行代表一种语言,按字母A到Z排列,从埃塞俄比亚南部的阿瑞语(Aari)到新墨西哥州的尊尼语(Zuni)。
该数据库(简称WALS,跟“墙壁”
walls同音)收录了192种特征,2679种语言,所以,如果要把这份电子表格打印出来,真的非常庞大。
就算我们让每一个表格只有一厘米宽、半厘米高,整份表格也将是一堵足有两米宽、5层楼高的墙。
不过,它有80%的表格都是空的,因为大多数语言只有十来个特征可供填入表格。
这里,不妨把这些单个的表格想成是墙壁里的砖块。
施诺贝伦并未考虑所有的192个特征,因为它们许多在逻辑上是彼此关联的。
例如,一种语言有许多个不同的元音(WALS数据库收录的特征1),很可能也有着很高的元音—辅音之比(特征3),而如果元音少,该比率也较低。
如果把这两个特征都考虑在内,就会给予统计意义上的同一特点不恰当的权重。
这样的情况很多,故此很容易歪曲整体画面。
(我们后面会看到,他未能完全避开这一陷阱。
)
为了达到这一目的,施诺贝伦只考虑了21个特征,涵盖了语法、音韵学和词汇方面。
由于WALS电子表中的大多数单元(也即单个表格)都是空的,拥有全部21块“砖”
的语言很少(确切地说,是18种语言),由于这么小的样本无法代表世界语言的多样性,施诺贝伦降低了标准。
他将每一种语言拥有砖块的最低数量设为14,得到了239种语言,本书涉及其中的15种,施诺贝伦未探讨的5种语言是孟加拉语、爪哇语、葡萄牙语、旁遮普语和泰米尔语。
下一步是分析数据,为这239种语言生成一个“怪异”
指数,其数值从0到1,0代表极端怪异,1代表非常平庸。
最后,将这些语言按0到1的顺序排列起来,最怪异的排名靠前,平庸的排名靠后。
我再说明一下:数值低反映了稀有性,所以德语在这份“怪异”
表上排名靠前。
德语是一种奇怪的语言吗?至少它看起来不再像以前那么怪异了——毕竟,在这本战前的初级教科书里,哥特字体可是很流行呢。
本书涉及的15种语言的怪异程度排名情况*
在我们转向德语之前,先简略地看看两个极端。
在最底部的位置,我们发现的不是某种小而偏僻、压根儿没人听说过的方言,而是一个熟悉的角色——实际上,还是巴别塔里最大的一种语言:印地-乌尔都语。
它的指数不低于0.913,无趣得叫人好笑。
在表格靠平庸的底部,还有两种语言,或许会叫人更加吃惊:匈牙利语和巴斯克语,大多数欧洲人认为它们狂野、不规则、反复无常,结果却是平平无奇。
排名最靠前的“怪异”
者,指数仅为0.028,是一种仅为数千人使用的小方言:墨西哥查尔卡顿戈地区的米斯特克语。
虽说它的指数极低,但总体来说,它不算奇异。
在它总共拥有的17个特征里,有11个完全不明显,获得了最高分1。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!