先找到需要设计引物的目标基因的在有引物序列的mRNA序列,可以通过全文(如最先发现该基因的文章),全文中有时可以找到大鼠c-jun mRNA序列的ACCESSION NUMBER,在PubMed中的“Nucleotide”中用此ACCESSION NUMBER就能找到序列。可以利用这个ACCESSION NUMBER在PubMed中的“Nucleotide”中搜索到序列后,点击右边的“links”,再点击里面的“Related Sequences”就能找到所有的大鼠c-jun mRNA序列及其他物种 的一些c-jun mRNA序列。
文献中的引物最好先验证其序列正确,并用软件 分析引物比较好后再采用。通过BLAST验证,既可知道序列是否正确,也可同时了解引物的特异性、引物的位置及PCR产物的大小等。
如果仅仅是为了验证引物序列是否正确(仅适合于基于完全匹配原则设计的引物),也可以用Blast的“Nucleotide-nucleotide BLAST (blastn )”或“Search for short, nearly exact matches”搜索,具体方法为:
1. 打开Blast,点击“Nucleotide-nucleotide BLAST (blastn)”或“Search for short, nearly exact matches”
2. 等新页面完全显示后,将引物序列直接copy到“Search”框(没有必要将下游引物序列转换成其互补链),下面3种方法都可以(我觉得这3种方法的搜索结果没有什么区别,没仔细比较过哦!)
(1)直接拷贝上游引物序列,然后直接将下游引物序列拷贝在上游引物后面
(2)直接拷贝上游引物序列,在上游引物序列后加一空格,然后直接将下游引物序列拷贝在空格后面
(3)直接拷贝上游引物序列,换行,然后直接拷贝下游引物序列
注意:记住上、下游引物的长度,如上游引物为19bp、下游引物为18bp,这在查看Blast结果时有用。
3. 点击“BLAST!”,新页面完全出来以后,点击“Format!”。
4. 结果完全出来后,查找有没有和1-19、20-37同时完全匹配的基因,其他的就不用考虑了。当然,如果下游引物序列所对应的基因片段的3'端正好和上游引物序列的3'端的1或2个碱基互补,那就可能是19-37或18-37。
如果有,那你的引物序列就是正确的。从文献上查的引物,除了要用Blast验证其序列是否正确外,还是应该用软件分析分析到底引物好不好。
实例
1、进入网页:http://www.NCBI .nlm.nih.gov/BLAST/
2、点击Search for short, nearly exact matches
3、 在search栏中输入引物系列:
注:文献报道ABCG2的引物为5’-CTGAGATCCTGAGCCTTTGG-3’;
5’-TGCCCATCACAACATCATCT-3’
(1)输入方法可先输入上游引物,进行blast程序,同样方法在进行下游引物的blast程序。
这种方法叫繁琐,而且在结果分析特异性时要看能与上游引物的匹配的系列,还要看与下游引物匹配的系列——之后看两者的交叉。
(2)简便的做法是同时输入上下游引物:有以下两种方法。输入上下游引物系列都从5’——3’。
A、输入上游引物 空格 输入下游引物
B、输入上游引物 回车 输入下游引物
4、 在options for advanced blasting中:
selec from 栏通过菜单选择Homo sapiens【ORGN】
Expect后面的数字改为10
5、在format中:
selec from 栏通过菜单选择Homo sapiens【ORGN】
Expect后面的数字填上0 10
6、 点击网页中最下面的“BLAST!”
7、 出现新的网页,点击Format!
8、 等待若干秒之后,出现results of BLAST的网页。该网页用三种形式来显示blast的结果。
(1)图形格式:
图中①代表这些序列与上游引物匹配、并与下游引物互补的得分值都位于40~50分
图中②代表这些序列与上游引物匹配的得分值位于40~50分,而与下游引物不互补
图中③代表这些序列与下游引物互补的得分值小于40分,而与上游引物不匹配
通过点击相应的bar可以得到匹配情况的详细信息。
(2)结果信息概要:
从左到右分别为:
A、数据库系列的身份证:点击之后可以获得该序列的信息
B、系列的简单描述
C、高比值片段对(high-scoring segment pairs, HSP)的字符得分。按照得分的高低由大到小排列。得分的计算公式=匹配的碱基×2+0.1。举例:如果有20个碱基匹配,则其得分为40.1。
D、E值:代表被比对的两个序列不相关的可能性。【The E value decreases exponentially as the Score (S) that is assigned to a match between two sequences increases】。E值最低的最有意义,也就是说序列的相似性最大。设定的E值是我们限定的上限,E值太高的就不显示了
E、最后一栏有的有UEG的字样,其中:
U代表:Unigene数据库
E代表:GEO profiles数据库
G代表:Gene数据库
(3)结果详细信息:
①圈出来的部分代表序列的信息
②第一个大括号代表上游引物与该序列的正链【Plus/Plus】的匹配情况:
共有21个碱基匹配,得分42.1分【21×2+0.1=42.1】,E值为0.020
上游引物与序列的2143~2163位点匹配
③第二个大括号代表下游引物与该序列的负链【Plus/Minus】的匹配情况:
共有20个碱基匹配,得分40.1分【20×2+0.1=40.1】,E值为0.077。
下游引物与该序列的29360~29379位点互补
注意点:
①上游引物为20个碱基,为什么会变成21个碱基呢?这是因为下游引物的第一个碱基为T,刚好与系列的2163位点的T匹配,因此下游引物的开头的第一个碱基被当成了上游引物了。同理,上游引物的最后一个碱基为G,被当成了下游引物了。通过寻找有没有与1~20位点、20~40位点完全匹配的序列,就可以避免这个因素的干扰了。
②为什么与上下游引物匹配的ABCG2序列有多种?
A、 为同一个基因来源的不同的mRNA片段
B、 为该基因的DNA系列
C、 为同一个基因来源的不同的cDNA克隆片段。
结果判断:
①验证文献报道的引物是否正确:如果你可以在所显示的结果中找出你的目的基因,一般说明你的引物正确性没问题。如果你blast后没有发现你的目的基因,或者分值很低,该引物就可能不适合用
②检测该引物是否存有同源序列相匹配,造成PCR反应的非特异扩增。如果上游引物和下游引物都找到的相同的基因,并且分数非常高。这种结果表明所设计的引物序列特异性不高,最好重新设计引物,否则会得到非特异扩增的PCR产物。