师者,所以传道授业解惑也! 
sgRNAcas9安装与使用


sgRNAcas9使用手册


一、sgRNAcas9软件包简介
   该程序包能用于设计和评估sgRNA的脱靶效应(http://www.biootools.com/)。其包含有8个功能不同的小程序,最新版本为V3.0.5,均由Perl语言编写,可方便在不同操作平台如Windows和linux等操作系统中使用,运行环境仅需提前安装Perl。使用前,需从ensembl的ftp数据库下载目标物种的基因组和基因注释文件。大致操作流程如下:


1. 通过命令行调用“combine_genome.pl”程序,将下载的不同染色体序列合并为FASTA格式的单一基因组文件;

2. 用“format_genome.pl”程序处理基因组文件;

3. 调用核心程序“sgRNAcas9.pl”设计sgRNA并进行脱靶效应评估。可设置的参数有:①sgRNA的长度,限定范围为17~20 nt;②sgRNA的GC%含量,可限定最大值和最小值,默认为20%~80%;③对于靶标在DNA链上的位置,可限定sgRNA仅定位于正义链、反义链或双链;④既可设计单个sgRNA,还可设计“paired-gRNA”。如果设计“paired-gRNA”,可限定两个sgRNA之间距离最大值和最小值,默认值为-2~32 bp。靶标位点PAM类型为NGG,而对于脱靶评估,PAM类型为NGG和NAG。sgRNA与脱靶位点的碱基错配数可设置的范围为0 ~5 bp,还自动排除含“TTTT”终止序列的sgRNA。该软件对于脱靶效应评估,除了统计sgRNA全长序列碱基错配位点情况,还考察临近PAM的12 bp种子序列的特异性。

4. 利用从ensembl的ftp数据库下载的基因注释文件,可用“ot2gtf_v2.pl”和“pot2gtf_v2.pl”程序,进一步确定脱靶位点是否位于其它基因内;

5. 利用“sgRPrimer.pl”程序,可批量设计用于构建sgRNA表达载体的引物。

6. 利用“extract_targetSeq.pl”程序,可批量提取靶标位点或预测的脱靶位点两侧一定长度的基因组序列,以用于设计PCR扩增引物。

针对sgRNAcas9核心程序我们开发有图形用户界面版(GUI),需要请来信索取。


二、sgRNAcas9安装(以Windows8(64位)操作系统为例)

1. 登录www.biootools.com 网站, 进入sgRNAcas9 下载页面,下载sgRNAcas9_3.0.5.zip 压缩包,解压缩。

2. 请检查一下你的Windows 8系统是否已经安装有perl?如果没有,请点击链接http://www.activestate.com/activeperl/downloads,下载 activeperl 5.16.3Build 1603(64-bit) forwindows(64-bit,x64),照提示安装。

3. Win8下启动CMD,用win+R组合键(win键就是键盘下边有窗口小图标的键)打开运行窗口,然后输入cmd按回车即可。测试perl是否成功安装,键入perl -v ,如果显示版本号等信息表明perl安装成功。


4. 先测试sgRNAcas9是否可运行。打开README文档,将命令行perl sgRNAcas9_3.0.5.pl -ihEMX1_example.txt -x 20 -l 40 -m 80 -g genome_example.fa -o s -t s -v w -n 5 -p2>log.txt” 复制到cmd上,如果有输出结果表明测试成功。

5. DIY你的sgRNA,将hEMX1_example.txt和genome_example.fa换成你的目标基因和基因组即可。注意格式和文件保存的路径或文件夹名字不能含有空格和“|”等不常见符号。

6. 具体操作使用请关注网站或README文档说明。为了保证运行速度,极力推荐在64-bit 的linxu系统运行。

三、操作说明

1. 下载基因,基因组序列(FASTA格式)和基因注释GTF文件
NCBI, http://www.ncbi.nlm.nih.gov/

Ensemble(FTP), http://asia.ensembl.org/info/data/ftp/index.html?redirect=no

2. 下载sgRNAcas9_3.0.5.zip 和How to use sgRNAcas9.ppt(操作手册)BiooTools, http://www.biootools.com/

3. 下载和安装Perl程序(https://www.perl.org/)开始->运行->cmd,进入sgRNAcas9文件夹

4. 处理基因组文件
合并FASTA格式序列: perl combine_genome.pl -s fa -ocombine_genome处理基因组FASTA格式ID: perl format_genome.pl -i combine_genome

5. 运行sgRNAcas9程序设计sgRNA并评估脱靶效应
(1) Sense strand searching mode

perl sgRNAcas9_3.0.5.pl -i hEMX1_example.txt -x 20 -l 40 -m 80 -g genome_example.fa -o s -t s -v w -n 5

(2) Anti-sense strand searching mode

perl sgRNAcas9_3.0.5.pl -i hEMX1_example.txt -x 20 -l 40 -m 80 -g genome_example.fa -o a -t s -v w -n 5

(3) Double strand searching mode

perl sgRNAcas9_3.0.5.pl -i hEMX1_example.txt -x 20 -l 40 -m 80 -g genome_example.fa -o b -t s -v w -n 5

(4) Paired-gRNA searching mode

perl sgRNAcas9_3.0.5.pl -i hEMX1_example.txt -x 20 -l 40 -m 80 -g genome_example.fa -o b -t p -v w -n 5 -s 5 -e 35注:具体可根据实际情况设定参数,如输入文件,基因组文件的名称设定等

6. 检查脱靶位点是否位于其它蛋白编码基因内
perl pot2gtf.pl -i <input_POT> -g <gtf file> -o <output>

7. 批量设计用于构建sgRNA表达载体的引物对
perl sgRPrimer.pl -i CRISPR.targets_pairs.fa -s Select_ID.txt -l 20 -f accg -raaac

8. 批量提取on/off-targets 位点侧翼序列,用于设计检测基因组编辑效率引物对
perl extract_targetSeq.pl -i hEMX1_exon1_S_109.POT.txt -g hsa_genome.fa -l 500

技术参考:
1. Xie S et al.,sgRNAcas9: a software package for designing CRISPR sgRNA and evaluating potential off-target cleavage sites. PLoS One. 2014,9(6):e100448.
2. 谢胜松等. CRISPR/Cas9系统中sgRNA设计与脱靶效应评估[J]. 遗传, 2015,37(11): 1125-1136.
3. 赵长志等. sgRNAcas9软件图形用户界面开发及应用[J]. 遗传, 2015,37(10):1061-1072.