中国科学软件网-首页
GPMAW——生物软件

GPMAW程序的主要用途是作为蛋白质和多肽质谱分析一个工具的。然而,许多其他生物信息学工具已经被包括在内,因此使用该计划远远超越了简单的质量分析。


GPMAW可以在大多数格式阅读个人记录,但为了读一个数据库,它必须通过一个实用程序DBindex被索引。(免费提供指导数据,从在这里下载)。

DBindex可以在FastA和Swiss-Prot格式处理数据库。 然而,在索引之前, Swiss-Prot格式必须转换成FastA,但当个人记录被检索到GPMAW,程序将检索完全有注释的序列。

GPMAW - General Protein/Mass Analysis for Windows

The GPMAW program is primarily intended as a tool for mass spectrometric analysis of proteins and peptides. However, a number of other bioinformatics tools have been included, so the use of the program extends far beyond simple mass analysis.

Program content:
Sequence handling: Import of sequences from a number of different formats with direct database search in Entrez and in local databases (FastA format and Swiss-Prot). Sequences can be saved in local files (databases) for future reference.
From the sequence window a large number of actions can be performed. Sequences can be exported in FastA format (either singly or all sequences at once) for easy transfer to other programs.
Mass analysis: The protein can be cleaved by automatic methods (e.g. a flexible nomenclature for defining enzyme actions) or manually. The peptides are displayed with a number of parameters (various mass values - mono, ave, charges - Bull&Breese index, HPLC index, pI, charge) and can be further worked upon (e.g. cross-linked, new cleavage).
Peptide mass searches can be performed on any local database in FastA format.
Bioinformatics: A number of graphs can be displayed, hydrophobicity, dot-plot, secondary structure prediction. BLAST searches can be performed on local databases. Multiple alignment using ClustalW.
Sequence window
The sequence window is the default view of a sequence. From here you can call most of other sequence related functions (either thrugh the menu, the toolbar, or the pop-up menu).

Peptide window
The peptide window is normally called from the sequence window through the automatic digest commend. However, there are alternative methods like manual or semi-automatic cleavage.

Protein databases and GPMAW
GPMAW uses databases in a variety of purposes. In most cases you will need to download the database from the Internet, but the scientific community has made most of the databases freely available, and the only drawback is the enormous size of some of the databases.

Format. The databases are (of course) available in different formats. The most common format is the FastA format which is found in a couple of variants. For all of the variants, a database record is defined by the name line which starts with a ’>’ sign, usually followed by one or more accession numbers, the protein name and the species. On the following lines comes the sequence in one-letter code, usually formatted with 60 characters pr. line.
Another popular format is the Swiss-Prot (or EMBL) format, where each sequence record contains much additional information. For a detailed description see here.
Finally, many records are obtained in GenBank (Entrez/NCBI) format. This format is similar in information content to the Swiss-Prot format, is easier to read for humans, but more difficult to parse for computer programs. More information here.

GPMAW can read individual records in most formats, but in order to read a database, it has to be indexed by the utility program DBindex (freely available from Lighthouse data, download it here).
DBindex can handle databases in FastA and Swiss-Prot format. However, the Swiss-Prot format has to be converted into FastA before indexing, but when individual records are retrieved by GPMAW, the program will retrieve the fully annotated sequence.