1.gif
业务范围   

 

大姓区域分布研究

中国人民大学人口与发展研究中心 吕利丹 段成荣


 

 

 

一.姓氏区域分布的研究背景

我是谁?我从哪里来?人们常常追问自己的生命源头,探源自己姓氏的来龙去脉。寻根念祖是人的本性,慎思追远也是中华民族的传统美德,汉人通常有着极强的宗族观念和血统意识。家族和血统的绵延也就是姓氏的绵延,中国人对姓氏的重视集中体现了对宗族的重视。

对姓氏的记载和归纳,历来受到高度重视,古人对姓氏的研究成果也是层出不穷。目前广为流传的以“赵钱孙李,周吴郑王”开头的《百家姓》,编者要追溯到宋代钱塘的一位秀才。之后的元、明、清等各个朝代都有比较完备的关于姓氏的位次排列和地区分布的资料。

随着社会的发展,姓氏经过不断的分化、发展、演变,逐渐形成了今天我们所使用的姓氏。对于姓氏使用方面的问题一直是人们比较关注却又无法回答的问题。比如:我国目前有多少姓氏?每个姓氏有多少人口?姓氏的排名先后是怎样的?这些姓氏是如何分布的?等等。公安部全国公民身份号码查询服务中心(以下称“中心”)利用“全国公民身份信息系统”对全国户籍人口的姓氏的统计为我们回答这些问题提供了数据基础。

根据中心提供的数据,本研究将使用人数最多的二十个姓氏(如表1)作为大姓的代表分析其地域性分布特征。

表1 中国使用人数最多的二十个大姓

位次

1

2

3

4

5

姓氏

人数(万)

8447

8313

8119

6055

5193

占总人口%

7.44%

7.32%

7.15%

5.33%

4.58%

位次

6

7

8

9

10

姓氏

人数(万)

3557

2518

2413

2227

2203

占总人口%

3.13%

2.22%

2.13%

1.96%

1.94%

位次

11

12

13

14

15

姓氏

人数(万)

1738

1719

1508

1370

1348

占总人口%

1.53%

1.51%

1.33%

1.21%

1.19%

位次

16

17

18

19

20

姓氏

人数(万)

1202

1198

1190

1136

1068

占总人口%

1.06%

1.06%

1.05%

1.00%

0.94%

二.姓氏区域分布的度量方法

本研究构造了两个指标对使用人数最多的二十个大姓的地区分布差异进行量化:姓氏分布集中系数和姓氏分布强度系数,此外,本文还引入mapinfo的绘图技术,在中国地图上将各大姓分布的地方特色形象直观的表现了出来。

1.姓氏分布集中系数

不同姓氏的地区分布不均衡程度有所不同,这种差异可以用姓氏分布集中系数(XCI)来量化比较。姓氏分布集中系数(XCI)反映的是姓氏地区分布相对于人口地区分布而言的集中程度。系数数值越大,姓氏分布越不均匀;系数数值越小,姓氏分布越均匀。计算公式为XCI=∑│Xi-Si│/2,其中Xi是该姓氏在地区i的使用人数占该姓氏全国使用人数的百分比,Si是地区i的汉族人口占全国汉族总人口的百分比。

如表2所示,我们计算出了前20个大姓的分布集中系数。由表可知,不同姓氏的集中程度迥然有别。林姓的分布集中系数最高,达0.53,说明二十个大姓中,相对于人口地区分布而言,林姓分布最不均匀,如果要使林姓使用人口的地区分布与人口地区分布相同,即各省的林姓人口占全国林姓人口的比例与各省人口占全国总人口的比例相同,那么全国有53%的林姓人口需要跨省搬家。也就是说,全国1136万林姓人口中有602万林姓人口需要搬出自己的原有省份,到他省定居。二十个大姓中,分布集中系数最小的为李姓,有0.10,表示有10%的李姓人口,也就是8313万李姓人口中的831万人需要跨省搬家才能使全国的李姓使用人口分布与总人口分布相同。

从表2还可知,二十个大姓中,位次都排在前六位的王李张刘杨五大姓氏,其分布集中系数却排在最后五位,说明,这几个大姓的地区分布反而较均匀。

表2 二十个大姓姓氏分布集中系数

 

1

2

3

4

5

6

7

8

9

10

姓氏

XCI

0.53

0.34

0.29

0.27

0.24

0.23

0.22

0.21

0.20

0.20

 

11

12

13

14

15

16

17

18

19

20

姓氏

XCI

0.20

0.19

0.19

0.18

0.17

0.17

0.13

0.13

0.11

0.10

2.姓氏在各省区使用人数占全省人口百分比示意地图

我们利用姓氏在各省的人口数占全省人口数的百分比绘制了20个姓氏的地图,颜色的深浅代表了百分比的大小,颜色越深,表示所占百分比越大。见地图的图例,该系列地图以31个省市百分比的平均数为基础,以百分比的标准差为间距,将所有的百分比分为六个百分比段,平均数上下各三段,用六种不同深浅的颜色来表示。

具体到各姓氏,图例中百分比段的划分可能会随具体情况有所调整。个别姓氏在某些百分比段的省区数为零,在图例中将不会显示该百分比段。个别姓氏的地区分布差异极为明显,在一些省份的百分比极高,我们会考虑在图例中百分比平均数以上增加一个或者两个百分比段。

3.姓氏在各省区的使用人数占全国使用人数的百分比示意地图

    利用各姓氏在各省区的使用人数占该姓氏全国使用人数的百分比可以绘制出描述姓氏在各个省区分布的示意地图。绘制地图的方法是:将在各省区的百分比等范围分为五组,用不同深浅的颜色来代表各组的百分比范围。得到的地图中,颜色较深的区域表示该地区的姓氏使用人数占该姓氏全国使用人数的百分比较高,颜色较浅的区域则表示地区的姓氏使用人数占该姓氏全国使用人数的百分比较低。

三.研究结果

1.各省第一大姓中,王姓一统北方,南方则较为多元化

大姓的地区分布也存在不同程度的不均衡,不少大姓还具有明显的地方特色。例如在福建广东一带,“陈林半天下,黄郑排满街”的俗语广为流传,陈林黄郑成为典型的南方姓氏,在以东南沿海一带为中心的地区极为常见,而到北方各省,位次排名则明显后移。在黄河以北的华北以及东北地区,则以孙赵高等姓氏为代表。此外,还有西北的马姓,西南的何姓等。姓氏的这种地区差异有其特定历史原因和文化因素,可以说每个姓氏背后都有一个动人悱恻的家族变迁史,而且与各地的文化习俗和人口迁徙等有着密切的联系,彰显了各地域独特的姓氏文化。

 

图1 全国31个省市第一大姓示意图

 

 

姓氏分布的地区差异,从全国31个省市第一大姓的分布就可窥见一斑。我们在中国地图上利用不同的颜色代表不同的姓氏标出了各省直辖市第一大姓的分布情况。如图1所示,全国形成了王、李、陈、刘、张、黄六大姓氏一统天下的格局,以长江为分水岭,六大姓氏的分布又呈现出南北地方特色。王姓在长江以北的华北、东北的16个省市的广大地区无一例外的独领风骚;到长江以南,形成了五分天下的定局,较北方则更为多元化,第一大姓中没有了王姓的踪影,取而代之的是盘踞在中西部接壤的8个省区的李姓,东南地区4个省份的陈姓,以及分别在广西、上海、江西三个省区一枝独秀的黄、张、刘。

2.大姓区域分布

以使用人数多少来排列,全国前二十个大姓依次为:王、李、张、刘、陈、杨、黄、赵、吴、周、徐、孙、朱、胡、郭、高、马、何、林、郑。研究结果显示,大姓的地区分布不仅存在区域性的差异,而且在个别大姓上还十分突出。王张赵孙郭高马成为具有北方特色的姓氏,张赵郭三大姓氏在全国范围内分布比较广泛,在以内蒙古为中心的华北广大地区的人口中较其他地区更为常见;王孙高两姓在以黑吉辽为中心的东北地区最为聚集;马姓是典型的西北姓氏,在以青海、甘肃和宁夏为中心的西北地区频率最高。陈杨黄吴何林郑是则典型的南方姓氏,陈吴林郑四大姓氏在以福建、海南和广东等为中心的华南东部沿海地区最为集中;杨何两姓具有强烈的西南地方特色,在云贵川等地的人口中出现的频率较为突出;黄姓在以广西、海南为中心华南南部地区最为常见。胡姓和周姓在华中地区长江流域的各省区分布较集中,在人群中的频率较其他地区更高。李徐朱三个姓氏的区域分布则无明显的地方特色。

(1).北方姓氏——王张赵孙郭高马

    王张赵孙郭高马七大姓氏的分布向北方倾斜,成为北方的代言姓氏。如下列组图1所示,利用七个大姓使用人数占各省区人口百分比绘制出的地图由北到南颜色逐渐由深变浅,说明七个大姓在北方人口中的频率普遍高于南方。

具体到每个姓氏,其分布又具有自身特有的地域色彩。例如:

1.王孙高姓在长江以北的地区较以南的地区更为普遍,而且以东北地区最为常见。

王姓在坐落于华北和东北的16个省区一统天下,成为第一大姓。王姓人口占全省人口百分比最多的两个省份是东北的吉林(11.0%)和辽宁(10.7%)。

孙姓在东北地区人群中出现的频率最高,其次是华北偏东部的地区。孙姓占吉林、山东、黑龙江和辽宁等省份人口的比例最高,分别为3.52%、3.37%、3.35%和3.27%。

高姓人口在华北东部地区的人群中出现的频率最高,其中以内蒙古、山西和陕西三省高姓人口占全省人口百分比最高,分别为2.08%、1.84%和1.81%。其次,在京津冀鲁辽吉黑等地的比例也较高,都在1.5%以上。

2.张赵郭在以内蒙古为中心的华北广大地区的人口中较其他地区更为常见。

张姓人口占全省人口百分比最多的两个省区是天津(10.09%)和河北(10.05%)。此外,在山西、内蒙古、甘肃、北京、河南、宁夏和山东等省市占总人口的百分比也都在9%以上。

赵姓在华北北部黄河以北的地区人群中的频率最高,占全省人口百分比最高的四个省份依次是青海(3.87%)、河北(3.84%)、山西(3.71%)和内蒙古(3.50%)。

郭姓使用人数占山西省人口的比例最高,达3.14%。其次,占内蒙古、河南、河北、陕西、北京总人口的比例也都在1.5%以上。

3.马姓在人群中出现的频率,北方普遍高于南方,其中以西北地区最高(见图1)。占全省人口百分比最高的三个省份是青海、甘肃和宁夏,分别为2.62%、2.57%和2.09%。此外,在京津冀疆陕晋豫蒙鲁的占全省人口的比例也都超过1.5%。

 图2 王张赵孙郭高马使用人数占各省区人口百分比分布地图

 

 

利用姓氏在各省区的使用人数占该姓氏全国总使用人数的比例可以描绘出各姓氏在全国各省区的分布情况。总的说来,各个姓氏在各省分布的比例与相应省份的人口基数较为一致,在人口数较多的省区每个姓氏分布的人数相应的较多,在人口数较少的省区各个姓氏分布的人数也就相应较少。如组图2所示,七大姓氏在各省区的使用人数占该姓氏全国总使用人数的比例最高的几个省份也是人数最多的几个省份,例如华北东部的河南、山东、河北,西南的四川等地,到人口较少的西北各省区,该比例也就相应降低。

 图3 王张赵孙郭高马各省使用人数占全国该姓氏使用人数百分比

 

 

(2)南方姓氏——陈杨黄吴何林郑

陈杨黄吴何林郑七大姓氏,从各姓氏使用人数占各省区人口百分比和占全国该姓氏使用人数百分比来看,都具有典型的南方地域特色。具体到各个姓氏,在西南、东南和华南南部又有不同的集中程度。陈吴林郑在东南沿海的福建、广东等地最为聚集;杨何两姓在西南云南、四川等地最为常见;黄姓则在以华南南部以广西省为中心的地区人口中频率最高。

1.陈在东南沿海的浙江、福建、广东和海南四省均数第一大姓。

陈姓在以福建、广东为中心的东南部沿海一带的人群中出现的频率最高。此外,在东部苏浙沪和中西部的川渝贵桂鄂也较为常见,占当地人口百分比都在5%以上。相比较而言,陈姓在东北地区和西北地区的人口中所占比例较低。所以陈姓是一个典型的东南方大姓。

陈姓人口分布主要集中在东南和川渝两大地区。东南地区的粤苏浙闽徽鲁六省的陈姓人口占了陈姓总人口的44.63%,广东省的陈姓人口最多,有775万人,占陈姓总人口的14.92%。此外,在川渝两地居住的陈氏子孙占陈姓总人口的比例有11.16%。

2.杨姓在云南的排列位次最为靠前,排第2位。

杨姓在西部地区人口中的频率总体上要比高于东部,在西南地区的云贵川人群中的频率最高,占全省人口的比例分别为7.80%、4.94%、4.59%。其次,杨姓在西北地区的陕甘宁频率也较高,占全省人口的百分比也都在4%以上。

西南地区以四川省的杨姓人口最多,有378万,占全国杨姓总人口比例最高,达10.63%,以四川为中心,加上云南、贵州、重庆、湖南和广州,各省区占全国杨姓总人口的比例都在3%以上,共占了杨姓人口的33.69%。华中东部以河南省的杨姓人口最多,有317万,占全国杨姓总人口比例最高,达8.91%,以河南为中心,加上山东、河北、江苏和安徽,各省占全国杨姓总人口的比例都在4.8%以上,共占了杨姓人口的30.83%。

3.黄姓在广西数第一大姓,广东第二,福建第三

黄姓在人口中的频率是南高北低,而且从南到北呈逐渐降低的趋势。南部沿海的广西、广东、福建人口中黄姓人口所占比例最高,分别为7.62%、6.94%、6.45%。其次,黄姓在华中地区的江西、湖南、湖北、四川、重庆的人口中的频率也较高,都不少于2.5%。

黄姓人口最主要的聚集地是南部以粤桂闽为中心的沿海省份。以广东省居住的黄氏子孙最多,占黄姓总人口的21.65%,其次是广西、福建、湖南、四川、江西,各省黄姓人口占黄姓总人口的比例均在7%以上。以上六省共占了黄姓总人口的60.75%。

4.总的说来,吴姓在中国东南部地区较其他地区更为常见。吴姓人口在人群中的频率最高的三个省份是海南、福建和广东,占全省人口百分比分别为5.88%、4.69%和3.24%;此外在浙江、江西、安徽、上海、广西和贵州的比例也都在2.5%以上。

华南东部是吴姓子孙分布最多的地区,粤苏徽浙闽晋六省居住了超过四成的吴姓人口,其中占全国吴姓人口比例最多的三个省份是广东(11.42%)、江苏(8.10%)和安徽(7.44%)。在四川、浙江、福建、江西、河南和湖南的吴姓人口也较多,占全国吴姓人口的比例都在4.5%以上。

5.何姓在以四川为中心的西南部地区较为常见。从西南到东北,何姓在人群众出现的频率总体上逐渐减小。何姓在四川人口中出现的频率最高,占全省总人口的比例有2.63%。其次是四川以南和以西的广东、广西、重庆、贵州和湖南,占各省市人口的百分比都在1.70%以上。

西南地区的聚集了较多的何姓人口,云贵渝川桂湘粤居住的何姓人口占了何姓总人口的54.8%,其中以四川和广东两省分布的何姓人口最多,分别占全国何姓总人口的16.34%和13.39%。其次,华中东部的苏浙徽赣豫等地的何姓分布也较多,五省的何姓人口占何姓总人口的比例都不少于3.8%,共占了何姓总人口的21.82%。

6.林姓在东南沿海地区的人口中出现的频率最高,占福建全省人口的比例最高,达8.82%,其次是海南(5.29%)、广东(4.40%),浙江(2.28%)和广西(1.83%)。

林姓人口最主要的聚集地是东南沿海的省份,粤闽浙桂琼五省居住了7成林姓人口,其中以粤闽浙三省林姓人口最多,分别占全国林姓人口的30.42%、22.57%、和9.14%,共占62.12%。其次,在广西、四川、山东和海南,林姓人口占全国林姓人口的比例也都超过了3%。

7.郑姓在各地人口中的分布频率以福建最高,占福建全省人口的比例达3.2%,另外,占浙江、广东和海南全省人口的比例也超过了1.7%。

郑氏子孙的分布主要集中在东南沿海地区和华中偏东部的地区(见图2)。东南沿海的粤浙闽三省居住了三成的郑姓人口,各占全国郑姓人口的13.92%、9.56%和8.72%。其次,四川、河南和山东三个人口大省也聚集了不少郑姓人口,占全国郑姓人口的比例都在6%以上。

图4 陈杨黄吴何林郑使用人数占各省区人口百分比分布地图

 

 

 图5 陈杨黄吴何林郑各省使用人数占全国该姓氏使用人数百分比分布地图

 

 

(3)华中地区姓氏——胡周

胡周两姓在华中地区长江流域各地区的人口中的频率比全国其他地区都要高,其中湖北和湖南两省的使用人数占全省人口的百分比在全国范围内排前列。

1.胡姓在华中地区的人群中出现的频率最高,占全省人口百分比最高的四个省份是湖北(2.51%)、江西(2.48%)、浙江(2.06%),和湖南(2.04%)。其次,在西南地区的云贵川渝藏也比较常见,占全省市人口的百分比都在1.2%以上。

胡姓人口主要分布在华中偏东部的地区,鲁晋苏徽浙鄂湘七省居住了近一半的胡姓子孙。胡姓人口最多的4个省份要数四川、安徽、湖南、和河南四省,各占胡姓总人口的9.55%、9.08%、9.05%和8.01%。江西、浙江、江苏、湖北和山东的胡姓人口占胡姓总人口的比例也都在4.7%以上。

2.周姓在湖南、重庆、江苏三地的人群中出现的频率最高,占全省人口百分比分别为3.60%、3.15%和3.04%。

从周姓人口在全国各地的分布来看,在江苏、湖南和四川三省的周氏子孙最多,省内使用人口占全国周姓使用人口的比例都高于9%。