matlab教程_spss软件_stata教程_gtap模型_gams_minitab_mathematica_nvivo-科学软件网
NTSYS-pc V 2.2 ——形态学分类系统
NTSYSpc 是生物形态软件,NTSYSpc可用于研究多元数据的形式和结构。例如使用者可以用来研究数据点样本,这些样本可能来自两个或多个不同的群体,或者使用邻接法或UPGMA方法构建聚类图来评估进化树.同样可以用于发现某些子集中的变异是相互关联的.NTSYS于60年代开发,经过多年的更新,现在NTSYS的功能已经非常强大了.
 输入的内容可以是描述性的信息,关于物种集合或直接衡量两个物种之间的相同点或不同点。说明词的种类和对象取决于应用——形态特征,大量物种,属性的出现和缺乏等等。NTSYSpc能转换数据,估算相同或不同的物体,并且还可以运用聚类分析,排列和多因素分析来总结物种间的关系。大多数结果可以以数字和图片的形式显示。这款软件既可以用于教学也可以用于科研。

NTSYSpc for Windows 2.2 的版本比起之前的版本使用更简单,功能更强大.NTSYSpc有一个交互模式(填表格的形式)和简单命令语言的批处理模式(对于分析模拟和多个数据集非常有帮助).NTSYSpc在充分利用Windows环境的优势,允许长文件名和处理大型数据集.绘图选项窗口可以让您定制您自己的图表型(如: 标题、字体、大小、颜色、规模、线宽、背景颜色、边距和其它选项)。还可以打印预览图表。NTS数据文件是ASCII文件可以和其他软件共享,同时还支持长段文字的输入。类似于电子表格的数据编辑器让您创建和编辑数据文件更为简便了。NTSYSpc还可以作为ASCII文本编辑器来编辑大型文件。矩阵可以用过Excel XLS和CSV文件阅读,数据树可以通过关联文件的一个形式进行阅读。另外还有导出MATLAB M文件的选项。

特 征
1、相似性和差异性:关联、距离、34个关联系数和11个遗传距离系数。
2、聚类:UPGMA和其他等级结构的SAHN方法(可以是多重关系)、邻接法和共同树的几种形式。
3、图论方法:最短长度的生成树和用邻接法绘制图片(可以是无根系统树)。
4、 排序:主成分或主坐标分析、对应分析、度量与非度量多维尺度分析、奇异值分析和Burnaby方法、典型分布随机分析、方案的多因素分析、常见的主成分分析、偏最小二乘、多关联性和典型相关。
5、图片互动:表征图、物种树、二维散点图,相似性和差异性矩阵的对比、傅立叶的大纲图、Procrustes绘图和三维视点绘图。
6、多变量测试:典型变量分析、协方差矩阵测试、维数测试、广义多元回归分析。同时还有辅导程序和模拟实验内容。
7、几何形态测量:包括Procrustes分析的特殊组件,用于叠加重点结构,绘制Procrutes分析的结果图片,绘制轮廓图片和轮廓形状的傅立叶系数(包括2D和3D椭圆图片)和部分2D和3D的弯曲系数并估算统一部分。
8、其他:由同表象相关、Mantel测试,3-way Mantel测试,数据标准化和矩阵转化等进行矩阵对比。矩阵可分割或合并。

系统要求:Windows NT/2000/ME/XP/Vista,安装完成后至少要有9MB的磁盘。
NTSYSpc can be used to discover pattern and structure in multivariate data. For example, one may wish to discover that a sample of data points suggests that the samples may have come from two or more distinct populations. Of equal interest is the discovery that the variation in some subsets of variables are highly inter-correlated.

The input can be descriptive information about collections of objects or directly measured similarities or dissimilarities between all pairs of objects. The kinds of descriptors and objects used depend upon the application—morphological characters, abundances of species, presence and absence of properties, etc. NTSYSpc can transform data, estimate dis/similarities among objects, and prepare summaries of the relationships using cluster and ordination analyses. Many of the results can be shown both numerically and graphically. The software is designed for both classroom and research.

Version 2.1 for Windows is especially easy to use yet still has the speed and functionality of the previous versions. There is an interactive mode (with “fill-in-the-blanks” entry forms) and a batch mode with a simple command language (useful for analysis of simulations and multiple datasets). The program takes advantage of the Windows environment and, for example, allows long file names and the processing of much larger datasets. Plot options windows allows you to customize the plots (specify titles, fonts, sizes, colors, scales, line widths, background colors, margins, and many other aspects of what is plotted). There is also a print preview mode. Data files are ASCII files that can be shared with other programs. Long input lines are supported. A spreadsheet-like data editor is included that makes it easy to create and edit data files. It can be also used as a text editor for very large files. Rectangular data matrices can be read from Excel XLS files and trees can be read from nexus files. Documentation includes a User Guide and an extensive help file with the technical details. Additional information about new features in version 2.1 and Sample screen shots are available. There is also a Frequently Asked Questions page.

Some of the features include in NTSYSpc are listed below. Similarity and dissimilarity: correlation, distance, 34 association coefficients, and 11 genetic distance coefficients.
Clustering: UPGMA and other hierarchical SAHN methods (allows for ties). Neighbor-joining method (including the new unweighted version). Several types of consensus trees.
Graph theoretic methods: minimum-length spanning trees. Graphs (unrooted trees) from the neighbor-joining method.
Ordination: principal components & principal coordinates analysis, correspondence analysis, metric & non-metric multidimensional scaling analysis, singular-value decompositions, projections onto axes and Burnaby’s method. Canonical variates analysis. Programs for common principal components analysis, partial least-squares, multiple correlation, and canonical correlations are also included.
Interactive graphics: phenograms, phylogenetic trees, 2D scatter plots , comparison of dis/similarity matrices, Fourier plots of outlines, Procrustes plots, and 3-D perspective plots.
Multivariate tests: canonical variates analysis, tests for homogeneity of covariance matrices, tests for number of dimensions, generalized multivariate multiple regression analysis.
Geometric morphometrics: includes specialized modules for Procrustes analysis to superimpose landmark configurations, plotting the results of a Procrustes analysis, Fourier analysis (including 2D and 3D elliptic) of outline shapes, plotting outlines and Fourier coefficients, and computation of 2D and 3D partial warp scores and estimates of the uniform component.
Other: includes comparison of matrices by cophenetic correlation, Mantel test, 3-way Mantel test, data standardization, and matrix transformations (simple functions, deletion, and now matrix transpose)..

Licensed users can download a copy of the latest update to NTSYSpc when an update becomes available. Users should check our Frequently Asked Questions page for helpful hints on the use of NTSYSpc.
Requirements: Windows 95/98/NT/2000/ME/XP. Requires about 3 MB of disk space after installation is complete.

Summary of changes in NTSYSpc ver. 2.1
The user interface for NTSYSpc has been redesigned to be easier to use (see the sample screen shots). There is now a User folder in which you can place the icons for the modules you use most frequently.
Input file formats have not changed — except for a small change in Excel files. Matrices in Excel XLS files can now be read directly by the computational modules -- there is no longer a need to import them using the NTedit program. All matrix types, rectangular, symmetric, etc., are now supported.
The NTedit program has been revised to include a text mode in which very large ASCII files can be edited (files up to 16MB with line lengths up to 32K). Standard cut, copy, paste, and other text editing commands are supported.
Graphics have been greatly improved and can be called directly from many of the computational modules by the use of speed buttons on a toolbar. The entry forms for the graphics programs have also been simplified since the graphic options are now available from option dialog boxes. You can now control the titles, scale, colors, fonts, line widths, etc. of most aspects of the plots. NTS files can now be loaded into the editor by just double-clicking on them in the Windows Explorer or by right-clicking on them and using the Windows "Send to" feature.
New computational modules have been added: AUTOREGR - Fits an autoregressive model. Used in spatial and phylogenetic "autocorrelation" studies.
PROCRUSTES – Procrustes superimposition of coordinates of 2D or 3D landmarks on specimens or superimpositions of multivariate ordinates of any dimension. Option to ignore reflections.
PROCPLOT – 2D and 3D plots of the results of a Procrustes superimposition.
FOURPLOT – Plot outlines and estimated outlines from the FOURIER module.
MULREG – generalized multivariate multiple regression. Can be used to perform simple bivariate regression, multiple regression, multivariate regression, and generalized least-squares regression (as used for the comparative method).
PLOT – Plot one or more columns of a rectangular matrix against a selected column. Points can be given different symbols and connected by lines

Many computational modules have been revised: CONSEN – Input trees can be in the nexus file format.
COPH – Input tree can be in the nexus format. Path length (additive) distance matrix and phylogenetic covariance matrix can be computed in addition to the usual ultrametric distances.
CVA – Can compute canonical variates scores for individual observations.
FOURIER – Many changes were made to make this module more useful. Linked to the new FOURPLOT module for direct viewing of the results.
MOD3D – Rewritten to provide interactive 3D rotation (drag with the mouse) and better axis labeling. Different symbols can be given to different points. 3D biplots can be produced.
MXCOMP – The Smouse-Long-Sokal (1986) 3-way Mantel test has been added to allow one to study the association between two distance matrices while holding the effects of a third matrix constant.
MXPLOT – Points can be given different symbols. 2D biplots can be produced.
NJOIN – Completely rewritten to greatly increase its speed. Larger datasets (i.e., more than 500 OTUs) can now be processed. Results can be saved in nexus file format or as an extended NTS tree format that allows for unequal heights of the OTUs in the tree. An option has been added for unweighted neighbor-joining trees.
OUTPUT – Supports Excel files and the new tree formats.
POOLVC – Allows missing values in data when computing the mean and covariance matrices.
TPSWTS – Modified to include a Procrustes superimposition and computation of a consensus configuration. 3D uniform component can now be computed.
TREE – Can now plot trees with unequal heights of the OTUs. Nexus tree files can be read.

Graphics have been improved to include interactive rotation in the 3D plots. Plot options can now be saved and restored. Groups of points can now be given different symbols in MOD3D and MXPLOT. When MXPLOT is called directly by SVD, EIGEN, or PROJ the option to preserve the correct aspect ratio is set automatically.

Frequently Asked Questions about NTSYSpc
What is the current version of NTSYSpc? Version 2.1 was released on 8 Sept. 2000. Note: there are many service releases (with numbers like 2.11k) adding new features and fixing problems that were discovered after the initial release. Please check the Updates page to see if a more recent release is available. Click on the help|About menu in NTSYSpc to check what release you currently have installed. While you do not have to uninstall the old version, it is better to uninstall the old version before the new one is installed. The uninstall process will not remove any of your data files.
Is there a tutorial available? While there is no tutorial guide available, the printed User Guide provided with the program gives a step-by-step example. This guide is also available as an Acrobat PDF file on the distribution CD. The help file contains step-by-step examples of using NTSYSpc for both a UPGMA cluster analysis and a principal components analysis. The main problem new users seem to have is due to the expectation that there is a single button to click to perform an entire analysis. Unlike many statistical packages, most analyses require one to go through a number of steps. While less user-friendly, this design makes many more types of analyses possible by combining the modules in various ways.
End of file or other problems reading a data file? This is the most frequently reported problem. This almost always is due to an error in preparing the data file. Common problems are miscounting the number of row or column labels or miscounting of the number or rows or columns in the matrix itself. Please double-check your files! Sometimes it helps to have someone else look at your file.
Does NTSYSpc read Excel files? NTSYSpc 2.0 did not read Excel files directly. You had to use the NTedit program to import the file and save it as a standard NTS file. A copy of the Excel program was required to be on your computer. Version 2.1 solves this problem by reading Excel files directly from both NTedit and NTSYSpc. As of release 2.10m all types of matrices can be read (not just rectangular as in previous releases). A limitation at present is that only a single matrix can be read from an Excel file (a way around this limitation is to save your Excel spreadsheet as a CSV format file. Note that Excel and CSV files must start with NTSYSpc header information. There can be optional comments and row and column labels. There must be a line that tells NTSYSpc how many rows and columns to expect. The matrix header line for Excel files in NTSYSpc ver. 2.0 was slightly different from that of the standard NTS files. In version 2.1 it is now the same as in the NTS files except that the suffix codes ’L’, ’B’, and ’E’ must not be used. The NTedit program can now also write CSV files.
Problems using NTSYSpc? Be sure to check whether a new service release is available. You will need a password (contact Exeter Software) and your present registration serial number. updates The Updates section of the help file lists the additions, changes, and problems fixed in each release of NTSYSpc.
Why does MDSCALE always stops after just 5 iterations even though the solution is not very good? The default value for "Maximum stress ratio" was set at "0" (fixed in release 2.10K). You should change that value to something like "0.999".
Computations of similarity/dissimilarity values seems to ’blow up’? If a cluster analysis results in no structure and the range of similarity values going from 0 to 0 or from 1 to 1 then there may be a problem with the missing value code being set when you did not expect it. Whether or not the missing value code is set is mentioned in the listing output. In NTedit make sure the missing value edit box is blank (not a ’0’) if there are no missing values in the data.
Batch codes for MOD3D and MXPLOT. The batch code parameters for specifying the variables was changed from that in version 1.80 of NTSYSpc. They now use X, Y and X, Y, Z rather than I, J and I, J, K.
Need additional copies of the User Guide? There is a PDF file for the User Guide on the CD you received from Exeter. You can also view, download, and print the latest version of the User Guide from this link for version 2.0 and this link for version 2.1. They are standard Adobe Acrobat PDF files.
Data size limits? Most modules in NTSYSpc do not have explicit dimension limits for objects or variables. The limitation will be disk space and time. Larger amounts of RAM will speed up to computations for very large datasets. With the present capacity and power of modern PCs, a data set with a few hundred samples or variables is considered a small dataset for most computations. However, the MDSCALE module must manipulate many matrices simultaneously and hence is more limited in the size of the matrix it can handle (512 variables is the maximum).
Why are only the first 30 OTUs are shown in the dendrogram? By default, a maximum of 30 OTUs are displayed on each page of the dendrogram. To display additional pages or to change the number of OTUs/page, right-click on the plot to bring up the options window. You can change many aspects of the plot including the fonts used to display the titles and OTU labels. In version 2.1 you can use the PageUp and PageDown keys to scroll through the other pages. You can also use the "+" and "-" keys to change the number of OTUs per page.
Is NTSYSpc Y2K compliant?. Yes, it is. However, NTSYSpc does not do anything with dates expect to display today’s date in the listing windows. No computations are performed using dates so it does not matter whether 2 or 4 digits are used to represent the year.
Why doesn’t the old DOS version 1.80 of NTSYSpc work on newer computers? This has puzzled us for some time. Usually an error 200 is encountered. A solution has been found recently. It turns out the problem is the faster speed of the newer CPU chips -- not problems with newer Windows versions. A patched version of the old DOS program is now available (updates). You will need your original version 1.80 serial/registration number.
Really stuck on a problem using NTSYSpc? For technical help e-mail directly to F. James Rohlf, rather than to Exeter Software. Please attach copies of the files that you are having problems with so that we can reproduce the problem you are having and thus get back to you more quickly with a solution.
A problem has just been found in the MULREG module. For regression through the mean, the numerator degrees of freedom for the overall test is k+1 rather than k (where k is the number of independent variables). This was fixed in version 2.10x. Please update your copy to that version if you plan to use that module.
Does NTSYSpc work in Windows XP? Yes - no problems have been reported. It is the version of Windows used for the development of NTSYSpc.
How should I cite NTSYSpc in a publication? You can use the following format: Rohlf, F. J. 2002. NTSYSpc: Numerical Taxonomy System, ver. 2.1. Exeter Publishing, Ltd.: Setauket, NY. [substitute, of course, the version number you have and its copyright date from the Help|About window.]
What happened to the ntsys.ini file? Release 2.11L makes an important change in the location of the ntsys.ini file in the network version of NTSYSpc. It is now placed in the the NTSYSpc directory within a user’s Document and Settings directory rather than in the same directory as the program file. This change allows different users of the same computer to have their own copies of the ntsys.ini file. It also makes it possible to use NTSYSpc with the ntsys.exe file located on a server. A limitation of this change is that you may receive an error message such as the following if you do not have Windows 98 or higher, version 4.0 or later of MS Internet Explorer, or you have not installed its "Desktop update". Version 4.71 or later of SHELL32.DLL is now required.

Technical details about NTSYSpc ver. 2.1
Computational modules
CANPLS - Performs canonical correlation and partial least-squares analyses. Used to study correlations between two sets of variables.
CONSEN - Computes a consensus tree for two of two or more trees (such as multiple tied trees from SAHN or between two different methods). Several consensus indices are also computed to measure the degree of agreement between trees. Can read nexus tree files.
COPH - Produces a cophenetic value matrix (matrix of ultrametric values) from a tree matrix (produced, e.g., by the SAHN program). This matrix can be used by the MXCOMP program to test the goodness of fit of a cluster analysis to the similarity or dissimilarity matrix on which it was based. Can also produce path length distance matrices and phylogenetic covariance matrices.
CORRESP - Correspondence analysis. This is a useful way to investigate the structure of 2-way contingency table.
CPCA - Common principal components analysis of Flury (1984, 1988). Fits a single set of eigenvectors to a series of variance-covariance matrices.
CVA - Performs a canonical vectors analysis (a generalization of discriminant function analysis). Can also test closeness of each specimen to each group mean.
DCENTER - Performs a "double-centering" of a matrix of similarities or dissimilarities among the objects. The resulting matrix can then be factored to perform a principal coordinates analysis (a method for displaying relationships among objects in terms of their positions along a set of axes based on a dissimilarity matrix, see Gower 1966).
EIGEN - Computes eigenvector and eigenvalue matrices of a real symmetric similarity matrix. This program can be used to perform a principal components or a principal coordinates analysis by extracting eigenvectors (factors) from a correlation or variance-covariance matrix.
FOURIER - Computes Fourier and elliptic Fourier transformations and their inverses. Can be used on both 2D and 3D outline curves.
FOURPLOT - Plots outlines and their estimates based on Fourier coefficients.
MDSCALE - Nonmetric and linear multidimensional scaling analysis. This can be used as an alternative to PCA.
MOD3D - Plots a 3-way scatter diagram as an interactive 3D perspective view of a model with n "objects" at tops of wires attached from a base plane. The view can be rotated interactively. This program is often used to view the results of a principal components or principal coordinates analysis.
MST - Computes a minimum-length spanning tree from a similarity or dissimilarity matrix. This is useful for showing the nearest neighbors of objects based on their positions in a multidimensional space.
MXCOMP - Compares two symmetric matrices by computing their matrix correlation and then plotting a scatter diagram. Can also compare two matrices with the effects of a third held constant (the Smouse, Long, Sokal test). The statistics for a 2-way Mantel test are also computed. It can be used to compute the goodness of fit of a cluster analysis to a dataset (by comparing a cophenetic value matrix with a dissimilarity matrix).
MXPLOT - Plots 2-way scatter diagrams of rows or columns of a matrix.
NJOIN - Computes Saitou and Nei’s (1987) neighbor-joining method trees as estimated phylogenetic trees. Unweighted neighbor-joining trees can also be computed. As in the UPGMA module, checks can be made for the effects of ties.
OUTPUT - Formats matrices into pages for printing. Results can be pasted into most word processors. This formatted output is also useful for checking to make sure that an input file has been prepared in the correct format for NTSYSpc.
PLOT - Plot one or more variables against another.
POOLVC - Computes a pooled within-groups variance-covariance matrix from two or more data matrices. Can also perform a test for homogeneity of covariance matrices.
PROCRUSTES - Performs a Procrustes superimposition or a generalized Procrustes analysis to compute and average configuration of points and to align configurations to the average. Useful for comparing ordinations and in geometric morphometrics. Analyses can be performed for two or higher dimensional data.
PROCPLOT - Plots the results of a Procrustes analysis.
PROJ - Projects a set of objects onto one or more vectors—or onto a space orthogonal to a set of vectors. In principal components analysis one will project standardized data onto the eigenvectors of the correlation matrix in order to see the best (in a least-squares sense) low-dimensional view of a data set. The orthogonal projection option can be used to implement Burnaby’s (1966) method for size adjustment. Can also compute predictions using the results of a regression analysis.
MULREGR - Performs a regression, multivariate regression, multiple regression, and generalized least-squares regression.
SAHN - Performs the sequential, agglomerative, hierarchical, and nested clustering methods as defined by Sneath and Sokal (1973) . These include such commonly used hierarchical clustering methods as listed below. The program can find alternative trees when there are ties in the input matrix. complete-link (maximum method)
single-link (minimum method)
flexible clustering
UPGMA (unweighted pair-group method)
WPGMA (weighted pair-group method)
WPGM using centroid clustering (either similarities or dissimilarities)
WPGM using Spearman’s average

SIMGEND - Computes matrices of genetic distance coefficients from gene-frequency and DNA sequence data. The following coefficients can be selected. Cavalli-Sforza and Edwards (1967) arc distance
Balakrishnan and Sanghvi (1968) distance.
Cavalli-Sforza and Edwards (1967) chord distance.
Hillis (1984) distance
Swofford and Olsen’s (1990) suggestion to unbiass the distance by using same correction as in Nei’s distance.
Nei’s (1972) distance (default).
Nei’s (1978) unbiased distance. Formula as above but with denominator:
Prevosti (Wright, 1978 ) distance.
Rogers (1972) distance
Rogers distance as modified by Wright (1978
Jukes and Cantor (1969) distance modified for DNA sequence data.

SIMINT - Computes various similarity or dissimilarity indices for interval measure (continuous) data (e.g., correlation, distance, etc. coefficients). Bray-Curtis distance
Canberra metric
Chi-squared distance
Average taxonomic distance
Squared average distance
Euclidean distance
Euclidean distance squared
Manhattan distance
Penrose’s shape coefficient
Penrose’s size coefficient
Product-moment correlation
Cosine of angle
Sample size
Morisita (1959) index
Horn’s (1966) modification of Morisita index
Renkonen (1938) similarity
Variances and covariances
Inner product

SIMQUAL - Computes various association coefficients for qualitative data— data with unordered states (e.g., simple matching, Jaccard, phi, etc. coefficients). Hamann (1961) coefficient Rogers and Tanimoto (1960) distance
Simple matching coefficient
Dice (1945) coefficient
Jaccard (1908) coefficient
Kulcznski (1927) coefficients 1 and 2
Phi coefficient
Russel and Rao (1940) coefficient
Ochiai coefficient
Yule (1911) coefficient
also several unnamed coefficients from Sokal and Sneath (1961)

STAND - Performs a linear transformation of a data matrix so as to eliminate the effects of different scales of measurement. Several options for what gets subtracted off and what gets used as a divisor.
SVD - Computes a singular-value decomposition of a rectangular matrix. It allows you to compute principal axes and projections in a single step.
TPSWTS - Computes projections of the 2D or 3D coordinates of objects onto the principal warps of a thin-plate spline bending energy matrix (see Bookstein, 1991). This is done to enable a statistical analysis of the components of shape variation. Includes both 2D and 3D estimates of the uniform shape component.
TRANSF - Performs various linear and non-linear transformations of the rows or columns of a matrix. Computes Bookstein shape coordinates (both scaled and unscaled). Can also be used to delete rows or columns and alter the form of storage of some matrices.
TREE - Displays a tree (e.g., from a cluster analysis) as a phenogram or the results of the neighbor-joining method as a phylogenetic tree with branch lengths. Options are provided for scaling and scrolling through a tree interactively.

Data size limitations
Most modules in NTSYSpc do not have explicit dimension limits for objects or variables. The limitation will be disk space and time. Larger amounts of RAM will speed up to computations for very large datasets. With the present capacity and power of modern PCs, a data set with a few hundred samples or variables is considered a small dataset for most computations. However, the MDSCALE module must manipulate many matrices simultaneously and hence is more limited in the size of the matrix it can handle (512 variables is the maximum).