外贸网站建设软件有哪些,腾讯微博同步到wordpress,wordpress显示时间插件下载地址,电子商务网站建设 精品课文章目录 简介在线版使用本地版使用安装程序运行命令行准备输入文件运行拼接 Reference 简介 
Cap3是一款历史悠久的序列拼接软件#xff0c;非常适合Sanger序列拼接。此软件于1999年发表于Genome Rsearch杂志#xff0c;目前Google统计引用4885次(截止2019年1月30号)。 
Hua… 文章目录 简介在线版使用本地版使用安装程序运行命令行准备输入文件运行拼接 Reference  简介 
Cap3是一款历史悠久的序列拼接软件非常适合Sanger序列拼接。此软件于1999年发表于Genome Rsearch杂志目前Google统计引用4885次(截止2019年1月30号)。 
Huang, X. and Madan, A. (1999) CAP3: A DNA sequence assembly program. Genome Res., 9, 868-877. 
优秀的软件都会有在线版和本地版两个版本。在线版方便小数据量的用户、或无法拥有服务器和缺少Linux系统软件安装经验的用户轻松点击鼠标完成拼接。本地版配合强大的命令行可以批量完成大数据量的拼接。 
在线版使用 
http://doua.prabi.fr/software/cap3 
最后更新时间为2014年1月。 可以在对话框中提交如2条及以上要拼接且存在overlap的fasta格式序列(方向无所谓软件会自己调整)点击提交(SUBMIT)即可。 
结果如下 
Contigs拼接的结果一般就是你想要的结果Single sequences末拼接的序列如果都拼接成果此链为空Assembly details拼接详细可以看到序列拼接多序列的方向比对详细和一致序列详见下面。Your sequence file你刚才提交的序列可以复制内容保存 
查看拼接的细节文件有助于了解序列方向拼接结构碱基一致性等信息。 
Number of segment pairs  6; number of pairwise comparisons  3means given segment; - means reverse complementOverlaps            Containments  No. of Constraints Supporting Overlap******************* Contig 1 ********************
27F
515
1492-DETAILED DISPLAY OF CONTIGS
******************* Contig 1 ********************.    :    .    :    .    :    .    :    .    :    .    :
27F                  TGCAAGTCGAACGGCAGCACGGGAGCAATCCTGGTGGCGAGTGGCGAACGGGTGAGTAAT____________________________________________________________
consensus             TGCAAGTCGAACGGCAGCACGGGAGCAATCCTGGTGGCGAGTGGCGAACGGGTGAGTAAT.    :    .    :    .    :    .    :    .    :    .    :
27F                  ACATCGGAACGTGCCCAGTAGTGGGGGATAGCTCGGCGAAAGCCGGATTAATACCGCATA____________________________________________________________
consensus             ACATCGGAACGTGCCCAGTAGTGGGGGATAGCTCGGCGAAAGCCGGATTAATACCGCATA.    :    .    :    .    :    .    :    .    :    .    :
27F                  CGACCTACGGGTGAAAGCGGGGGACCGCAAGGCCTCGCGCTATTGGAGCGGCCGATGTCA____________________________________________________________
consensus             CGACCTACGGGTGAAAGCGGGGGACCGCAAGGCCTCGCGCTATTGGAGCGGCCGATGTCA.    :    .    :    .    :    .    :    .    :    .    :
27F                  GATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCTGTAGCTGGTCTGAGAG____________________________________________________________
consensus             GATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCTGTAGCTGGTCTGAGAG.    :    .    :    .    :    .    :    .    :    .    :
27F                  GACGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGG____________________________________________________________
consensus             GACGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGG.    :    .    :    .    :    .    :    .    :    .    :
27F                  GAATTTTGGACAATGGGGGCAACCCTGATCCAGCCATGCCGCGTGCGGGAAGAAGGCCTT____________________________________________________________
consensus             GAATTTTGGACAATGGGGGCAACCCTGATCCAGCCATGCCGCGTGCGGGAAGAAGGCCTT.    :    .    :    .    :    .    :    .    :    .    :
27F                  CGGGTTGTAAACCGCTTTTGTCAGGGAAGAAACGCGCCGAGCTAATACCTCGGTGTAATG____________________________________________________________
consensus             CGGGTTGTAAACCGCTTTTGTCAGGGAAGAAACGCGCCGAGCTAATACCTCGGTGTAATG.    :    .    :    .    :    .    :    .    :    .    :
27F                  ACGGTACCTGAAGAATAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGG____________________________________________________________
consensus             ACGGTACCTGAAGAATAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGG.    :    .    :    .    :    .    :    .    :    .    :
27F                  GTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGCTTTGCAAGACAG
515                                                 AAGCGTGCGCAGGCGGCTTTGCAAGACAG____________________________________________________________
consensus             GTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGCTTTGCAAGACAG.    :    .    :    .    :    .    :    .    :    .    :
27F                  ATGTGAAATCCCCGGGCTTAACCTGGGAACTGCATTTGTGACTGCATGGCTGGAGTGCGG
515                  ATGTGAAATCCCCGGGCTTAACCTGGGAACTGCATTTGTGACTGCATGGCTGGAGTGCGG____________________________________________________________
consensus             ATGTGAAATCCCCGGGCTTAACCTGGGAACTGCATTTGTGACTGCATGGCTGGAGTGCGG.    :    .    :    .    :    .    :    .    :    .    :
27F                  CAGAGGGGGATGGAATTCCGCGTGTAGCAGTGAAATGCGTAGATATGCGGAGGAACACCG
515                  CAGAGGGGGATGGAATTCCGCGTGTAGCAGTGAAATGCGTAGATATGCGGAGGAACACCG
1492-                     GGGGGATGGAATTCCGCGTGTAGCAGTGAAATGCGTAGATATGCGGAGGAACACCG____________________________________________________________
consensus             CAGAGGGGGATGGAATTCCGCGTGTAGCAGTGAAATGCGTAGATATGCGGAGGAACACCG本地版使用 
安装 
软件安装可以通过官网下载源代码 http://seq.cs.iastate.edu/cap3.html。在Linux, Mac, Windows, Solaris各主流系统版本。 
但推荐使用conda安装会自动安装它及相关的40余个依赖关系 
conda install cap3程序运行命令行 
cap3 File_of_reads [options]如 cap3 seq.fa 
seq.fa中包括要拼接的序列可以手动制作。也可以使用脚本。 
准备输入文件 
通常测序的结果为.seq文件。我们要将序列合并有一个共同的前缀如RiceP14C02使用我写的脚本format_seq2fasta.pl将其合并为fasta格式脚本在我的 https://github.com/YongxinLiu/Note 中 Perl 文件夹中 
如输入文件保存于seq目录中名字如下 
seq/RiceP14C02_1492R.seq
seq/RiceP14C02_27F.seq
seq/RiceP14C02_515F.seq合并一条序列的多个文件 
fileRiceP14C02
format_seq2fasta.pl -i seq/${file}_*.seq -o ${file}.fa对于另一个拼接的任务你可以修改file等号后面的即可。想要批量调用直接使用for循环即可 
运行拼接 
运行cap3只需提供输入fa文件 
cap3 ${file}.fa结果有如下5个文件 
RiceP14C02.fa.cap.ace原始序列使用信息RiceP14C02.fa.cap.contigs拼接序列结果RiceP14C02.fa.cap.contigs.links空RiceP14C02.fa.cap.contigs.qual质量RiceP14C02.fa.cap.info信息RiceP14C02.fa.cap.singlets空 
由于每个序列名称都叫Contig1需要改名为序列名 
sed -i 1 s/Contig1/${file}/ ${file}.faReference 
Huang, X. and Madan, A. (1999) CAP3: A DNA sequence assembly program. Genome Res., 9, 868-877.在线版 http://doua.prabi.fr/software/cap3本地版 http://seq.cs.iastate.edu/cap3.html