作者,Evil Genius
礼拜天我们分享一个简单的内容,突变的遗传有害性检测
首先第一个,InterVar
InterVar是一种生物信息学软件工具,用于通过ACMG / AMP 2015指南对遗传变异进行临床解释。 InterVar的输入是从ANNOVAR生成的注释文件,而InterVar的输出是将变体分类为“良性”,“可能良性”,“不确定重要性”,“可能致病性”和“致病性”。 2015 年美国医学遗传学和基因组学学会(ACMG) 开发了针对序列变异的解读的标准和指南 。 ACMG 开发的变异分类系统并推荐使用特定的标准术语,该系统将变异分为 pathogenic(致病的 ) 、 likelypathogenic(可能致病的) 、 uncertain significance(致病性不明确的) 、 likely benign(可能良性的) 、 benign(良性的) 来描述孟德尔疾病致病基因中发现的突变。 ACMG 的变异分类系统中共有 28 个证据类别,根据 28 个证据的组合形式进行变异位点的有害性分类。
链接:https://github.com/WGLab/InterVar
使用示例
python bin/InterVar/InterVar-master/example/test.hg19_multianno.txt
--input_type=AVinput
-o Software/Annovar_201602/table_annovar.pl
--convert2annovar Software/Annovar_201602/annotate_variation.pl
-d bin/InterVar/InterVar-master/intervardb
--skip_annovar
结果展示及说明
- Chr:染色体
- Start:变异位点在染色体上的起始位置
- End:变异位点在染色体上的终止位置
- Ref:参考基因组碱基型
- Alt:样本基因组碱基型
- Ref.Gene:基于refGene注释的基因名称,列出该变异所在的基因
- Func.refGene:对变异位点所在的区域进行注释
- ExonicFunc.refGene:外显子区的SNV 或 InDel变异类型
- Gene.ensGene:基于ensembl注释的基因号
- avsnp147: dbSNP数据库关于该位点的描述
- AAChange.ensGene:基于ensembl的氨基酸改变注释结果
- AAChange.refGene:基于refGene的氨基酸改变注释结果
- Clinvar: Clinvar:clinvar注释
- Intervar: InterVar and Evidence:intervar关于ACMG的注释
- Freq_ExAC_ALL:ExAC_ALL数据库中的次等位基因频率
- Freq_esp6500siv2_all:ESP6500数据库中的次等位基因频率
- Freq_1000g2015aug_all:千人数据库中的次等位基因频率
- CADD_raw:CADD初始分值
- CADD_phred:CADD_Phred分值
- SIFT_score:SIFT分值,表示该变异对蛋白序列的影响。
- GERP++_RS:注释变异位点的保守性的GERP++_RS分值
- phyloP46way_placental:
- dbscSNV ADA_SCORE和dbscSNV RF_SCORE:dbscSNV数据库的ADA分值
- dbsc SNV _RF_SCOR:是一个关于splicing区的变异注释数据库,基于不同算法给出Ada 和RF分值,作者建议使用0.6作为阈值。
- Interpro_domain:蛋白序列和蛋白分类数据库interpro中关于结构域的注释
- AAChange.knownGene:基于ncbi的氨基酸改变注释结果
- rmsk:rmsk数据库注释结果
- metaSVM_score:dbNSFP数据库整合的预测分值
- Freq_ExAC_POPs:
- OMIM:OMIM数据库注释的疾病号
- Phenotype_MIM:基于OMIM的表型注释
- OrphaNo.:注释Orphanet号
- Orpha:Orpha库注释内容
- Otherinfo:其他信息
2、CharGer
软件CharGer(Characterization of Germline variants)利用数据库和注释信息,依据ACMG标准对变异分类以评估变异的致病性。数据库可以下载到本地,也可以通过ReST APIs(联网)获取信息。
链接在https://ding-lab.github.io/CharGer/
标准ACMG模块:
--PVS1 very strong pathogenicity (default = 8)
--PS1 , --PS2 , --PS3 , --PS4 strong pathogenicity (defaults: PS1 = 7, PS2=PS3=PS4 = 4)
--PM1 , --PM2 , --PM3 , --PM4 , --PM5 , --PM6 moderate pathogenicity (defaults: PM1=PM2=PM3=PM4=PM5 = 2)
--PP1 , --PP2 , --PP3 , --PP4 , --PP5 supporting pathogenicity (defaults: PP1=PP2=PP3=PP4=PP5 = 1)
--BP1 , --BP2 , --BP3 , --BP4 , --BP5 , --BP6 , --BP7 supporting benignity (defaults: BP1=BP2=BP3=BP4=BP5=BP6=BP7 = -1)
--BS1 , --BS2 , --BS3 , --BS4 strong benignity (defaults: BS1=BS2=BS3=BS4 = -4)
--BA1 stand-alone benignity (defaults: BA1 = -8)
代码示例
charger -f demo.vcf -o charged.demo.tsv -D --inheritanceGeneList inheritanceGeneList.txt --PP2GeneList PP2GeneList.txt --BP1GeneList BP1GeneList.txt -l -E
结果文件为tab键分割的文本文件,共24列。其中比较关注的列为:
HUGO_Symbol:HUGO symbol基因名
Chromosome:染色体编号
Start:起始位点
Stop:终止位点
Reference:参考序列
Alternate:变异序列
ClinVar_Pathogenicity:clinvar致病性分类
ACMG_Classification:ACMG致病性分类
CharGer_Classification:Charger软件致病性分类
CharGer_Summary:注释结果描述。
3、ClassifyCNV
ClassifyCNV是一个命令行工具,它实现了2019年ACMG指南,以评估生殖系重复和缺失。该工具使用预先解析的公开数据库来计算每个拷贝数变异的致病性得分 (CNV)根据ACMG指南。
运行示例
git clone https://github.com/Genotek/ClassifyCNV.git
python ClassifyCNV.py --infile Examples/ACMG_examples.hg19.bed --GenomeBuild hg19 --precise
通过ClassifyCNV计算的数值致病性评分使用 以下截止值:
≤ −0.99: benign variant
−0.90 … −0.98: likely benign variant
−0.89 … 0.89: variant of uncertain significance
0.90 … 0.98: likely pathogenic variant
≥ 0.99: pathogenic variant
≤ −0.99: 良性变体
−0.90 … −0.98: 可能是良性变异
−0.89 … 0.89: 不确定意义的变体
0.90 … 0.98: 可能的致病性变体
≥ 0.99:致病性变体