刘大宇 , 徐际超 , 曾滢,3 , 徐曲毅 , 刘宏 , 李越 , 刘长晖
1.广州市公安局黄埔区分局,广州 510700;
2.广州市刑事科学技术研究所,广州 510442;
3.南方医科大学法医学院,广州 510515
法庭DNA数据库的建立,一方面从技术上克服了侦查破案中地区和个案的局限性,另一方面可从根本上解决刑事案件中无名尸体的身份确定和被拐儿童的身份认定等调查难题,能及时有效地打击刑事犯罪[1]。Y-STR数据库作为DNA数据库的一部分,其辅助鉴定价值已在大量案件中得以体现,是常染色体数据库的重要补充[2-5]。中国社会由于传统的父姓制度,使得Y-STR数据库的建设具有重大意义。
随着Y-STR DNA数据库的不断扩大,无关男性个体的随机匹配概率也在增加,为了提高YSTR的个体识别效能,尽可能降低匹配数据量,在检验基因座数量有限的情况下,通常的做法是引入高多态性的快速突变Y-STR[6-7]。但突变率高的基因座容易导致同一父系的男性个体在匹配时因基因突变而被错误排除,不利于使用Y-STR数据库进行父系家系排查。基于此,本研究以374个广东汉族无血缘关系男性个体为样本,通过AGCU Y SUPP PLUS(简称YSP)荧光检测试剂盒和AGCU Y37(简称Y37)荧光检测试剂盒检测共59个Y-STR基因座的不同组合,评估其法医学应用效能并探讨Y-STR基因座的合理组合。
1.1 材料、试剂与仪器
采集374名广东地区汉族无血缘关系男性个体的口腔拭子,所有样本提供者均对本研究知情并自愿签订知情同意书。
AGCU Y SUPP PLUS试剂盒与AGCU Y37试剂盒均购自无锡中德美联生物技术有限公司;
Hi-DiTM甲酰胺、9700型PCR仪和ABI3130XL型基因分析仪均购自美国Applied Biosystems公司。
1.2 方法
Y-STR基因座的优势在于父系遗传,除非突变,同一父系的男性个体Y-STR基因座分型一致,因此常用于父系亲权鉴定、现场混合检材检验以及父系家族排查。本研究应用AGCU Y SUPP PLUS和AGCU Y37两种试剂盒,包含DNA数据库建设中涉及的59个Y-STR基因座,其中49个为单拷贝基因座,5个为双拷贝基因座(DYF404S1 a/b、DYS459 a/b、DYS385 a/b、DYS527 a/b、DYF387S1 a/b),对374例广东汉族无血缘关系男性个体进行基因分型检测,获取其遗传信息并将这59个Y-STR基因座按照突变率的高低进行分类组合和统计分析。
1.2.1DNA提取、PCR扩增和分型 用高盛TraceMag微量DNA磁珠纯化试剂盒及x-pure 96微量DNA自动提取/检测工作站提取DNA,-4 ℃保存待用。分别按照YSP和Y37试剂盒说明书进行PCR扩增,扩增产物采用ABI 3130XL遗传分析仪电泳,使用GeneMapper IDX v1.6进行数据分析。
1.2.2数据统计 用PowerStatsV12.xls计算各基因座的基因频率;
用Arlequin v3.5统计单倍型频率;
基因多样性(gene diversity,GD)及单倍型多样性(haplotype diversity, HD)按公式(1)计算。系统识别能力(discrimination capacity,DC)按公式(2)计算。
其中,n表示样本数,Pi表示第i个(等位)基因的基因频率或单倍型频率。
其中,Nh为单倍型数目,Ns为样本总量。
2.1 59个Y-STR多态性分析
电泳分型结果显示,各样本均得到有效扩增,有2例样本在DYS448基因座出现等位基因丢失,DYS460、DYS19、DYS587、DYS630、DYS449、DYS522以及DYS622等7个单拷贝基因座共检出8例 二 基 因 分 型,DYS404S1a/b、DYS387S1、DYS527a/b和DYS385a/b等4个双拷贝基因座共检出35例三基因分型,DYS385a/b双拷贝基因座检出2例五基因分型。上述异常分型的基因座均经公安部研发的DNATyper Y29试剂盒复核,结果分型一致,这些异常分型样本在基因频率和基因型频率计算中未纳入统计,在单倍型分析时纳入统计。
374例个体经YSP和Y37试剂盒检测所获得的59个Y-STR基因座的等位基因频率见表1。59个Y-STR基因座在广东汉族群体的GD值如图1所示,最低值为0.055 1(DYS645),最高值为0.958 0(DYS387S1a/b)。除 了DYS645(GD=0.055 1)、DYS617(GD=0.374 3)、DYS391(GD=0.382 1)、DYS438(GD=0.434 4)、DYS388(GD=0.4600)、DYS437(GD=0.487 8)、DYS596(GD=0.498 6)等7个基因座外,其余52个基因座GD值均大于0.5,表明这些基因座多态性较好,适用于广东汉族人群的法医学研究与分析。
图1 59个Y-STR的GD值分布Fig. 1 Distribution of GD values of 59 Y-STR loci
表1 374例广东汉族男性个体经YSP试剂盒和Y37试剂盒检测获得的等位基因/单倍型频率Table 1 Gene/haplotype frequencies of 374 Guangdong Han-ethnic male individuals tested with YSP and Y37 Kits
续表
续表
续表
2.2 59个Y-STR的组合分析
根据突变率的不同[8-14],这59个Y-STR基因座可以分为:中低突变Y-STR(突变率小于0.004)共44个,高快突变Y-STR(突变率大于0.004)共15个。将检测所得的遗传数据按YSP试剂盒所含的32个Y-STR基因座(YSP)、Y37试剂盒所含的37个Y-STR基因座(Y37)、两种试剂盒总共包含的59个Y-STR基因座(Y59)、44个中低突变YSTR基因座(Y-L 44)和15个高快突变Y-STR基因座(Y-H 15)共5种组合进行统计分类,计算检出的单倍型数量、HD值和DC值,结果如表2所示。Y59组合的单倍型数量为374,HD值和DC值分别为1.000 000和1.000 000,多态性效能最高,而突变率小于0.004的Y-L 44组合的HD值和DC值分别为0.999 986和0.997 326;
突变率大于0.004的Y-H 15组合的HD值和DC值分别为0.999 971和0.994 652。15个高快突变Y-STR基因座组合仅比44个中低突变Y-STR基因座组合少一个单倍型,而HD差值小于0.000 02,表明这两种Y-STR基因座组合多态性效能相当。
表2 5种基因座组合分析374例无关广东汉族男性个体的系统效能比较Table 2 Comparison of systematic efficiency of 5 combinatorial loci to analyze 374 unrelated Guangdong Han-ethnic male individuals
Y-STR数据库的建立主要用于筛查同一父系个体,缩小排查范围,为侦查提供线索,提高办案效率。目前,全国各地的Y-STR数据库规模不断扩大,检验的Y-STR基因座也日益增多[15-17],Y-STR单倍型入库比对后容易出现筛出信息过多、难以甄别真伪的情况。为了提高试剂盒的检验效能,常用的商品化Y-STR检测试剂盒引入了一定数量的快速突变Y-STR基因座[6-7],例如,本研究所用的Y37试剂盒含有DYS576和DYS449 2个快速突变Y-STR基因座,YSP试剂盒含有DYS713、DYS630和DYF404S1 3个快速突变Y-STR基因座。
已有文献报道,突变率μ<0.002为低突变,0.002<μ<0.004为中突变,0.004<μ<0.01为高突变Y-STR,而μ>0.01则为快速突变Y-STR[18]。本研究将2个Y-STR检测体系的59个Y-STR中突变率μ<0.004的44个中低突变Y-STR基因座组合分析,显示其HD值和DC值分别为0.999 986和0.997 326;
突变率μ>0.004的15个高快突变Y-STR基因座组合的HD值和DC值分别为0.999 971和0.994 652,15个高快突变Y-STR基因座组合仅比44个中低突变Y-STR基因座组合少一个单倍型,而HD差值小于0.000 02,表明这两种Y-STR基因座组合多态性效能相当。
将少数快速突变Y-STR引入到某一个Y-STR检测系统可显著提高其系统多态性效能,在混合检材个体识别中有重要的应用价值,但高突变率基因座的引入也容易导致同一父系的男性个体因基因突变而被错误排除。当出现1~2个甚至更多Y-STR基因座分型不一致时,特别是不一致的基因座其等位基因相差1~2个重复单位时,无法轻易判断是否为基因突变所致,因而不能轻易排除父系家族,不利于使用Y-STR数据库进行父系家系排查。因此,基于Y-STR数据库的实际应用需求,不应把快速突变Y-STR基因座随意加入到某一常规Y-STR检测体系中,而需从整体上考虑如何选择和组合这些基因座。
国内外已有构建中低突变Y-STR检测体系以及快速突变检测体系的相关研究,但尚未见高突变和快速突变联合检测体系的报道。目前六色荧光标记STR复合扩增技术已经成熟,一次可检测30~50个遗传标记。若能将快速和高突变Y-STR进行组合而建立检测体系,有望大大提高个体识别效能,有利于混合检材中男性供体的溯源;
而将中低突变的Y-STR进行组合,则可更好地满足Y数据库建设和父系家系排查的需求。