admin 管理员组

文章数量: 887019


2024年3月8日发(作者:霹雳书坊链接)

RNA Structure 3.71

RNAStructure利用Zuker算法(Zuker Algorithm),根据最小自由能原理(minimizing

free energy),通过RNA一级序列预测RNA二级结构。预测所用的热力学数据是最近由Turner实验室获得。该软件使用了一些模块来扩展Zuker算法的能力,并使之为一个界面友好的RNA折叠程序。

基本配置:Win95/98/Me/NT/2000。Pentium以上芯片,32兆内存。

软件下载:需要在线免费注册。

基本配置:Windows95,Windows98或WindowsNT。Pentium以上芯片,32兆内存。

1. 熟悉菜单对熟悉使用非常重要。简单介绍如下:

New Sequence:打开序列编辑器,可输入或粘贴入序列,以.seq格式存储。

Open Sequence:打开以.seq格式.gen(genbank)格式或文本格式存贮的序列文件。

RNA Fold Single Strand:此项使用RNA参数打开折叠窗口。

DNA Fold Single Strand:此项使用DNA参数打开折叠窗口。

RNA Fold Intermolecular:此项使用RNA参数折叠两个单体。

DNA Fold Intermolecular:此项使用DNA参数折叠两个单体。

Refold:此项使用不同于先前使用的标准,重新折叠,快速生成次优结构。用于已经折叠并存盘的序列。

Efn2:此项测定生成的RNA二级结构的自由能,储存在ct文件格式中。

Draw:此项可绘制任何结构,储存在ct文件格式中。

Dot Plot:此项可计算任何折叠的序列的点阵图,用于已经折叠并存盘的序列。

Mix and Match:此项可重组次优结构的区域使生成最低自由能的结构,与化学修饰数据一致。

Oligo Walk:打开Oligo Walk tool帮助确定一个与RNA对象紧密杂交的寡聚体。

2.方法:

RNAstructure使用Zuker算法预测RNA二级结构,预测一个结构分两步进行。第一步是使用回归算法生成一个最优结构与一系列次优结构。生成次优结构的个数由用户输入的两个参数(maximum structures and % sort)决定,第三个参数为窗口大小。此参数控制次优结构有多少不同。小的窗口尺寸只允许生成非常类似的结构。

第二步是重新排序最有可能的结构。使用公式重新计算每个结构的最小自由能,输出根据重新计算的最小自由能排序。

两步是连续进行的。

3.准确度

最近的研究比较了预测与种系确定的结构,When domains of less than 500 bases

were used, the algorithm was able to predict 82.5% of 3,426 base pairs from small

subunit rRNAs, group I introns, group II introns, and tRNAs.

4.序列编辑器

4.1如何生成与编辑一个RNA或DNA序列

选择File/New菜单,打开序列编辑窗口。需要的话,在Title框内输入Title信息,在Comment框内输入注释信息,最后在 Sequence框内输入序列信息, 由5'端到3'端。注意:使用大写字母输入序列。当使用T或U或同时使用时,RNA折叠算法将假设其为RNA将T认为是U,而DNA折叠模块将认为其为DNA并将U认为是T。

可使用X代表缺口或未知碱基。选择File/Save或File/save as命令以.SEQ格式贮存。

4.2载入序列或引入 Genbank格式文件

选择File/Open Sequence命令载入.SEQ序列文件,也可选择Genbank格式文件(.GEN)或只有序列信息的文本文件。

4.3序列编辑

当输入一个序列时,如果Read while typing选项选择的话,可在输入同时听到输入的序列,按下Read back键,计算机将从光标所在位置向回读序列,按Cancel键终止。如果先选择一部分序列再按Read back键,只读取选定部分。

序列编辑器可将你输入的序列转存为类似Genbank格式的文件。按下Format键,序列将变为每行60个碱基 每10个碱基一个空格。

Fold RNA键将你的文件输入Fold模块,程序将提示你存盘。

5折叠

5.1RNA单链折叠:如何预测RNA二级结构

1). 选择file|RNA fold single strand启动模块,单击sequence按键,打开对话框以载入序列,此序列必需以.SEQ为扩展文件名,其它序列文件可在序列编辑器中转为此格式。注意必需为大写字母。

2). 输入文件名后,缺省值将填充在剩下的区域,这些值可改变。选取 Generate Save File选项,在执行算法后生成存盘文件,此存盘文件用于重新折叠与生成点阵图。

3). 在此碱基可被强制为单链或双链或螺旋。

4). 单击开始键,开始预测运算。

5). 需要的话,选择Draw structure,在绘图模块中看预测的二级结构结果。输出的二级结构以最小自由能顺序排列。但由于方法的限制与热力学参数的简化,第一个结构并不一定为实际的RNA结构,要折叠一个已存贮为.seq文件的序列,可选择菜单选项file|fold RNA single

strand,直接进入折叠窗口。或单击工具条中的fold RNA single strand键。

5.2 RNA单链折叠模式:选项与高级选项

次优结构输出的数量由用户输入的两个参数决定。

Max % Energy Difference(最大能量差异百分值):设定所允许的输出结构自由能与最小自由能的差异百分数数值。例如,如果结构的最小自由能为-100 kcal/mol,最大能量差异百分值,则会排除任何等于或大于-90 kcal/mol的结构(大于即为负值更小)。

Max number of structures(最大结构数):所预测的可能结构的数量的绝对上限值。最大为1000。

Window size(窗口大小):此参数设定所生成的次优结构之间的差异程度。Windows size设定值越小,则生成的结构则越接近的结构;反之,Windows size设定值越高,则生成的结构则差异越大。

Advanced Options(高级选项):除非特殊情况,不推荐使用。

5.3 RNA单链折叠模式:强制某个碱基为单链模式

在二级结构预测过程中,用户可强制设定不配对的碱基。方法有如下两种:

1) 在序列文件中,不配对碱基使用小写字母表示。

2) 选择要折叠的序列后,选择Force|Single菜单,进入文本编辑框,输入不配对碱基从5'端的位置序号。单击OK。可重复此步来设定多个强制为单链的碱基。

查看目前的选择碱基,选择Force|Current.重新设定选择碱基,选择Force|Reset.菜单命令。

5.4 RNA单链折叠模式:强制某个碱基为双链模式

用户能选择必须配对的碱基,由Force|Double Stranded菜单命令完成,操作类似上述。

5.5 RNA单链折叠模式:二级结构预测中强制某个碱基配对

选择菜单命令Force|Pair完成。

5.6折叠模式:使用限制输出概述

尽管作者及其他人经过了巨大努力,本软件所预测的最低自由能结构可能并不是它在自然界存在的形式。特别是当序列长度大于1000个碱基时更是如此。

对一些小型的结构数据库的最近研究证明,最低自由能结构包含了大约73%的正确碱基对,

并且当序列长度为700个碱基仍是如此。但前,有95%的正确碱基对则至少出现在1000个最佳次优结构中的一个结构中。因此,我们建议通过实验来限制预测的结构。例如,化学修饰数据可帮助识别存在于自然界的结构。Mix&Match模块的功能便是帮助你使用此类数据识别最可能自然结构。

5.7 其它折叠模式

RNAstructure现在也提供其它几种折叠的预测,如DNA单链折叠、RNA和/或DNA寡聚体分子间折叠。并提供再折叠(refold)选项来生成已折叠序列的次优结构。这些折叠均使用了RNA单链折叠模式的相同基本输出内容。

DNA单链折叠

DNA序列的折叠原理是根据John SantaLucia, Jr.及其同事提供的热力学参数。参数的具体内容可见相关参考文献或到其主页浏览。

RNA或DNA分子间折叠

可使用RNA或DNA参数确定寡聚体的分子间二级结构。这需要选定两个序列。

分子间折叠使用初始参数以正确决定自由能。但也有一些限制。程序算法不能预测pseudoknots,对于分子间折叠意味着pseudoknots结构如kissing hairpins结构不能被正确预测,因此,使用的分子间折叠的序列应很短。

Refold

重新折叠选项可读取一个由任何折叠模块生成的存盘文件*.sav,并生成一个不同的次优结构。因为程序算法分为两部门,因此这功能非常有帮助。第一步是非常慢的一步,重新折叠便读取第一步的数据快速生成其它结构。

6 EFN2 能量函数2

此模块计算结构的自由能

1. 单击.CT File按键,打开对话框输入.CT文件的名字,这是一个含有二级结构信息的文件格式,以CT为扩展名。

2. 对于输出文件.OUT,给出了缺省名称,可单击Out file 按键更改

3. 单击Start 按键

4. 输出两个文本文件扩展名分别为.CT与.OUT。

5. 使用文本文件编辑器打开文件,

6. 结构以自由能大小排列,

7 绘图模块

1 选择菜单命令File|Draw.

2. 选择一个已存在的.CT文件绘图

如果.CT文件含有超过一个结构,可以选择观看哪个结构。在菜单中选择View|Structure

number,选择想要观看的结构。或按住Control键按动上箭头或下箭头也可更改现有显示结构。

放大缩小

选择View|Zoom或按住Control键按动左箭头或右箭头。

打印

选择File|Print.

拷贝到剪贴板

选择Copy菜单place a black and white bitmap on the clipboard将其拷贝到剪贴板,并可复制到其它应用程序。

可在view|counterclockwise菜单选项选择是顺时针还是逆时针绘图。


本文标签: 结构 折叠 序列 使用 预测