(完整)stata命令总结,推荐文档-FreeNAS中文网

admin 管理员组

文章数量: 887019

2024年2月29日发(作者：dw怎么让div居中)

stata11常用命令

注：JB统计量对应的p大于0.05，则表明非正态，这点跟sktest和swilk检验刚好相反；

dta为数据文件；

gph为图文件；

do为程序文件；

注意stata要区别大小写；

不得用作用户变量名：

_all _n _N _skip _b _coef _cons _pi _pred _rc _weight double

float long int in if using with

命令：

读入数据一种方式

input x y

1 4

2 5.5

3 6.2

4 7.7

5 8.5

end

su/summarise/sum x 或 su/summarise/sum x,d

对分组的描述：

sort group

by group:su x

%%%%%

tabstat economy,stats(max) %返回变量economy的最大值

%%stats括号里可以是：mean，count(非缺失观测值个数)，sum(总和)，max，min，range，

%% sd，var，cv(变易系数＝标准差/均值)，skewness，kurtosis，median，p1(1％分位

%% 数，类似地有p10, p25, p50, p75, p95, p99)，iqr(interquantile

range = p75 – p25)

_all %描述全部

_N 数据库中观察值的总个数。

_n 当前观察值的位置。

_pi 圆周率π的数值。

list

gen/generate %产生数列

egen wagemax=max(wage)

clear

use

by(分组变量)

set more 1/0

count %计数

gsort +x (升序)

gsort -x (降序)

sort x 升序；并且其它变量顺序会跟着改变

label var y "消费" %添加标签

describe %描述数据文件的整体，包括观测总数，变量总数，生成日期，每个变量的存储类型(storage type)，标签(label)

replace x5=2*y if x!=3 %替换变量值

replace age = 25 in 107 %令第107个观测中age为25

rename y2 u %改变变量名

drop in 2 %删除全部变量的第2行

drop if x==. 删去x为缺失值的所有记录

keep if x<2 %保留小于2的数据，其余变量跟随x改变

keep in 2/10 %保留第2-10个数

keep x1-x5 %保留数据库中介于x1和x5间的所有变量 (包括x1和x5)，其余变量删除

ci x1 x2,by(group) %算出置信区间,不过先前对group要先排序，即sort

group；

%by的意思逐个进行

cii 12 3.816667 0.2710343, level(90) %已知均值，方差，计算90%的置信区间

cii 10 2 %obs=10,mean=2,以二项分布形式，计算置信区间

centile x,centile(2.5 25 50 75 97.5) %取分位数

correlate/corr x y z %相关系数

pwcorr x y,sig %给出原假设r=0的命令

%如果变量非服从正态分布，则spearman x y

regress/reg mean year %回归方程建立 reg y x,noconstant %无常数项

predict meanhat %预测拟合值

predict e,residual %得到残差

estat hettest % 异方差检验

dwstat % Durbin-Watson自相关检验

vif % 方差膨胀因子

logit y x1 x2 x3 (y取0或1，是被解释变量，x1-x3是被解释变量) %logit回归

probit y x1 x2 x3 (y取0或1，是被解释变量，x1-x3是被解释变量) %probit回归

tobit y x1 x2 x3 (y取值在0和1之间，是被解释变量，x1-x3是被解释变量) %tobit回归

sktest e %残差正态性检验 p>0.05则接受原假设，即服从正态分布；

%% sktest是基于变量的偏度和斜度(正态分布的偏度为0，斜度为3)

swilk x %基于Shapiro-Wilk检验

%%p值越小，越倾向于拒绝零假设，也就是变量越有可能不服从正态分布

xi %生成虚拟变量

tabulat gender,summ(math) %用gender指标对math进行分类，返回两类math的mean、std、freq

tabulate=tab %gen f=int((shengao-164)/3)*3+164 组距为3

tabulate 变量名 [, generate(新变量) missing nofreq nolabel plot ]

%%%%%

generate(新变量) // 按分组变量产生哑变量

nofreq // 不显示频数

nolabel // 不显示数值标记

plot // 显示各组频数图示

missing // 包含缺失值

cell // 显示各小组的构成比(小组之和为 1)

column // 按栏显示各组之构成(各栏总计为 1)

row // 按行显示各组之构成(各行总计为 1)

%%%%%

求和，求最小？

mod(x,y) %求余数

means %返回三种平均值

di normprob(1.96)

di invnorm(0.05)

di binomial(20,5,0.5)

di invbinomial(20,5,0.5)

di tprob(10,2)

di invt(10.0.05)

di fprob(3,27,1)

di invfprob(3,27,0.05)

di chi2(3,5)

di invchi2(3,0.05)

stack x y z,into(e) %把三列合成一列

xpose,clear %矩阵转置

append using d: %把已打开的文件（x y z）跟0917里的（x y z）合并，是竖向合并，即观察值合并；

merge using D: %把已打开的文件（x y z）跟0917里的（a b）合并，是横向合并，即变量合并；

format x %9.2e %科学记数

format x %9.2f %2位小数

%产生随机数

%1 产生20个在(0，1)区间上均匀分布的随机数uniform()

set seed 100

set obs 20

gen r=uniform()

list

clear 清除内存

set seed 200 设置种子数为 200

set obs 20 设置样本量为 20

range no 1 20 建立编号 1 至 20

gen r=uniform() 产生在(0,1)均匀分布的随机数

gen group=1 设置分组变量 group 的初始值为 1

sort r 对随机数从小到大排序

replace group=2 in 11/20 设置最大的 10 个随机数所对应的记录

为第2组，即：最小的10个随机数所

对应的记录为第1组

sort no 按照编号排序

list 显示随机分组的结果

也可以list if group==1和list no if group==1

%2 产生10个服从正态分布N（100，6^2）的随机数invnorm(uniform())*sigma+u

clear 清除内存

set seed 200 设置种子数为 200

set obs 10 设置样本量为 10

gen x=invnorm(uniform())*6+100 产生服从 N(100，6^2)的随机数

list

画图

注意有些图前面要加

histogram 直方图

line 折线图

scatter 散点图

scatter y x,c(l) s(d) b2("(a)")

graph twoway connected y x 连点图

graph bar (sum) var2,over(var1) blabel(total) %条形图

. graph bar p52 p72,by(d)

. graph bar p52 p72,over(d)

. graph bar p52 p72,by(d) stack

. graph bar p52 p72,over(d) stack

////////////数据如下

%d p52 p72

%1 163.2 27.4

%2 72.5 83.6

%3 57.2 178.2

histogram x,bin(8) norm %画直方图，加正态分数线

graph pie a b o ab if area==1,plabel(_all percent) %画饼图

graph pie var2, over(var1) plabel(_all percent) %饼图

graph pie p52 p72,by(d) %饼图

graph box y1 %箱体图

qnorm x %qq图

lfit y x %回归直线

graph matrix gender economy math 多变量散点图

line yhat x||scatter y x,c(.l) s(O.) xline(12) yline(5.4) %线形图&散点图

有一些通用的选项可以给图形“润色”：

标题 title(“string”) （string可为任意的字符串，下同）

脚注 note(“string”)

横座标标题 xtitle(“string”)

纵座标标题 ytitle(“sting”)

横座标范围 xaxis(a,b) （a

纵座标范围 yaxis(a,b)

插入文字 text （该命令既要指定插入文字的内容，也要指定插入的位置）

插入图例 legend （该命令既要指定图例的内容，也要指定其位置）

绘制散点图和线条的两个主要的选择项为：

) //连接各散点的方式，c表示：

或简写为) . 不连接 (缺省值)

l 用直线连接

L 沿x方向只向前不向后直线连接

m 计算中位数并用直线连接

s 用三次平滑曲线连接

J 以阶梯式直线条连接

|| 用直线连接在同一纵向上的两点

II 同 ||, 只是线的顶部和底部有一个短横

s) // 表示各散点的图形，s 表示：

或简写为s) O 大圆圈 (缺省值)

S 大方块

T 大三角形

o 小圆圈

d 小菱形

p 小加号

. 小点

i 无符号

[varname] 用变量的取值代码表示

[_n] 用点的记录号表示

数学函数等都要与generate、replace、display一起使用，不能单独使用

程序文件do

use d:

reg y x

corr y x

line y x,saving(d:d4)

按ctrl+D执行

字符串操作函数：

length(s) %长度函数，计算s的长度, 如，disp

length("ab")的结果是2

substr(s,n1,n2) %子串函数，获得从s的n1个字符开始的n2个字符组成的字符串,

disp substr("abcdef",2,3)的结果是"bcd"

string(n) %将数值n转换成字符串函数，如，disp

string(41)+"f"的结果是"41f"

real(s) %将字符串s转换成数值函数，如，disp

real("5.2")+1的结果是6.2

upper(s) %转换成大写字母函数，如，disp upper("this")的结果是"THIS"

lower(s) %转换成小写字母函数，如disp lower("THIS")的结果是"this"

index(s1,s2) %子串位置函数，计算s2在s1中第一次出现的起始位置, 如果s2不

在s1中, 则结果为0。如，disp

index("this","is")的结果是3,

而index("this","it")的结果是0

trim(s) %去除字符串前面和后面的空格

ltrim(s) %去除字符串前面的空格

rtrim(s) %去除字符串后面的空格

di sign(x) %x>0时取1, x<0时取-1, x=0时取0；符号函数

di int(x) %去掉x的小数部分, 得到整数 (取整函数)

sum(x) %获得包括当前记录及以前的所有记录的x 的和。缺失值(missing value)当0处理;求和函数

max(x1,x2,...,Xn) 忽略缺失值;最大值函数

min(x1,x2,...,Xn) 忽略缺失值;最小值函数

float(x) %将x转换成浮点表示法。

gen yy=cond(x<2,10,11) %条件函数cond(x,a,b) x可以是一个条件, x非0(条件成立)时取a, x为0(条件不成立)时取b。

gen y1=recode(x,2,5) %归组函数recode(x,x1,x2,...xn)

gen y2=autocode(x,3,-2,9) %autocode(x,ng,xmin,xmax) 自动将区间（xmin,xmax）分成ng个等长的小区间，其结果是包含x值那个小区间的上界值

t检验：

gend=x-y

ttestd=0

ttestx=y

如果不配对

ttestx1=x2,unpaired

ttestx1=x2,unequalunpaired

已知样本均数、标准差和样本数进行t检验：

ttesti 21 1.28 0.92 0.2 %检验均值是否等于0.2

检验两组均数是否相同：

ttesti 11 10 1.9 14 12.8 2.3

检验变量x1和x2的方差是否相同(即：齐性)

sdtestx1=x2

一、配对设计的平均水平检验

当总体服从正态分布时，可以选用t检验，否则用非参符号秩检验

signrankd=0

二、平行对照设计的两组资料平均水平统计检验

如果两组资料的方差齐性和相互独立的，并且每组资料服从正态

分布，则用成组t检验，否则可以用成组Wilcoxon秩和检验

ranksum x, by(group) %2组资料中位数比较

kwallis x, by(group) %多组资料中位数比较

anova x t id %x为因变量，t跟id是因素

egenr=rank(x),by(id) %产生秩r

单因素方差分析:

单因素方差分析又称为OnewayANOVA，用于比较多组样本的均数是否相同，

并假定：每组的数据服从正态分布，具有相同的方差，且相互独立，则无

效假设Ho:各组总体均数相同。在STATA中可用命令：

oneway x group, mean bonferroni %bonferroni用于多组样本均数的两两比较检验

logrank t outcome, by(group) %单因素生存分析

两因素方差分析

多因素方差分析：anova y x1 x2 x1*x2

本文标签：变量函数检验字符串计算

版权声明：本文标题：(完整)stata命令总结,推荐文档内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1709202844h540032.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

技术交流 – FreeNAS中文网

(完整)stata命令总结,推荐文档

更多相关文章

阿里巴巴客服面试题及答案

云-HCNA考题集A卷

vue3 setup调用method

vue3 setup refs用法

IaaS技术规范

云计算平台的搭建与配置

SAS系统

AIGC创新应用的云计算架构设计

华为HCIA-Cloud认证考试题库

华为云计算HCNA-Cloudv30复习题-华为认证网络工程师试卷与试题

写惩罚

云计算的特点或特征.

如何在matlab工具箱中自定义激活函数及其使用

[乐意黎]Windows 里的环境变量以及%USERPROFILE%等变量设置

Django自带的分页函数Pagination使用

edge函数闪退 matlab,因电脑故障无意中解决了Edge浏览器闪退崩溃的问题(原创)

Windows XP刻录机不能刻盘显示函数不正确的解决办法

linux系统如何使用fork函数创建子进程

ChatGPT函数调用初体验：让ChatGPT具备抓取网页文本的能力

各种浏览器的UA字符串

发表评论

推荐文章

日常练习

调参资料总结

音乐播放器简单版加欢迎页面SP添加MySQ数据库存储

CBNData发布在线票务平台数据报告 淘票票份额升至第二

2024最新 Windows系统安装docker教程

热门文章

HTTP和HTTPS

电脑打死都连不上手机热点问题

W800

内蒙古工程学院无线网络设计与规划

《Java多线程编程核心技术》阅读摘要（一）

使用 LWUIT 的风格、主题和 Painter 特性

预约排队叫号系统，通过微信就可以实现叫号取号一系列流程 var str=“The rain in SPAIN stays mainly in the plain“；

MinIO在Windows的部署与简单使用

Mac 或 Windows 系统 F7 F8 按键不可用解决

win10安装centos子系统

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

苹果电脑windows系统换苹果系统

Win11系统崩溃错误修复指南：三种实用方法详解

CBNData发布在线票务平台数据报告淘票票份额升至第二