中国科学软件网-首页
Stata数据分析技术应用培训

为了大家能够更好的使用Stata软件,2019年11月8-11日,北京天演融智软件有限公司和武汉字符串数据科技有限公司(爬虫俱乐部)将在大连举办的《Stata数据分析技术应用培训》。欢迎感兴趣的朋友们报名参加。

工欲善其事,必先利其器。实证研究中的利器,其一是数据,其二是计量模型。但是一个学者的学术生涯中,很可能不会用到太多的模型,比如做宏观的老师很少用到微观计量的模型,用DiD或RDD的微观计量学者很少会用到DSGE。但是无论是宏观还是微观的学者,都会遇到数据,这些数据来自不同的来源或数据库,格式不同,需要各种神奇的合并整理。将不同来源的数据拼接起来,构建成你做回归的那个横平竖直的表格的过程,往往是最令人伤神的过程。著名的金融学家Randall Morck教授常常这样给学生讲:数据整理工作占你实证过程95%的时间,至于回归,其实就是一个下午喝杯咖啡的时间而已。

  其实实证的繁琐不仅仅是数据的整理,将实证结果报告出来也非常繁琐。试想你的实证研究可能包括近20张不同的表格,即便outreg2可以帮你将结果做成一张张的表格,把他们拼接起来的过程也是很讨厌的。尤其是论文常常要修改,哪怕是一个变量定义的变化,这些表格就需要推到了重来,这一手工整理的过程就不可避免地需要手工重复。

  今天,这一切都可以因Stata而变。Stata不仅仅是一个优秀的计量软件,广泛应用于经济、金融、会计、历史和生物学的研究中,更是一个优秀的数据整理工具。本期的《Stata数据分析技术应用培训》全面解析Stata软件在数据整理方面的强大功能。

 

讲师简介

李春涛 中南财经政法大学金融学院教授、博士生导师,香港大学金融学博士,主要研究领域是公司治理和企业创新,在《经济研究》、《金融研究》、Journal of Comparative Economics、Stata Journal、International Journal of Auditing等主流期刊上发表学术论文三十余篇。李老师是Stata统计软件的资深用户,有20多年的Stata编程经验,他有十多名学生正在或曾经在海外名校从事研究助理工作。

薛原 武汉字符串数据公司董事长、香港岭南大学商学院助理研究员、华中科技大学管理学院博士生,资深Stata专家,擅长Stata编程、正则表达式、字符串处理及网络爬虫技术。与李老师合作开发了chinagcode、chinaaddress、cnintraday、cnstock、subinfile、reg2docx、sum2docx、wordconvert等重要命令,实现了中文地址与经纬度之间的转换,中国上市公司股票代码和分时交易数据的获取以及修改文本文件,在《金融研究》发表过一篇文章。此外,薛原还参加过2017年的Stata用户会议(温州)和2019年的Stata用户会议(武汉),并分别介绍了中文地址转换经纬度的方法和动态网页的网络数据抓取方法。

 

培训对象

高等院校经管教师、硕士生、博士生、科研人员以及企事业单位数据分析人员。

 

课程介绍

课程采用Stata公司在今年6月26日推出的最新版Stata16软件进行教学,课程通过案例教学模式,旨在帮助大家在短期内掌握Stata的基本命令、编程、数据处理以及熟悉Stata核心的网络数据抓取技术,同时针对最新版Stata中的实用新功能也会做出详细介绍。专题式的讲解使你能在短时间内掌握Stata的精髓,精选的实例和翔实的配套资料能让你在课后快速拓展所学,并能够编写一些实用的Stata程序,为进一步学习和科研打下扎实的基础。

 

培训大纲

第一部分:数据读入与Stata16的多框架数据系统

1)   熟悉界面

2)   多框架系统的基本原理

3)   读入多个数据

4)   寻求帮助(在线帮助、搜索帮助等)

5)   DOS命令(cd、dir、erase、rm、shell等)

6)   shellout调用其它系统应用

7)   copy命令(文件操作、网页源代码获取等)

8)   Stata常用30个命令介绍

9)   日期定义(日期格式设置、日期函数等)

10)函数(字符串函数、随机函数、编程函数等)s

11)egen函数与常见统计量

12)txt、csv、excel等格式文件读入

13)Wind交易数据整理案例

14)基金经理变更数据整理案例

第二部分:宏与循环

1)   local与global概念与基本操作

2)   宏扩展函数

3)   while、foreach、forvalue循环

4)   跳出循环的continue 和continue, break

5)   批量处理多个目录下的多个文件(fs命令)

6)   批量处理多个变量的多个取值(levelsof命令)

7)   读入Excel文件的多个sheet

8)   NBER工作论文下载案例

9)   上交所年报爬取综合案例

10)CSMAR交易和财务数据整理案例

第三部分:数据库操作

1)   数据的纵向合并、横向合并与长宽变换

2)   insobs增加观测值

3)   expand

4)   fillin

5)   工企数据库运用案例

6)   Wind财务数据整理案例

7)   美国流行歌曲目录整理案例

8)   起死回生命令(preserve与restore)

9)   CSSCI期刊目录整理案例

10)label命令介绍

11)labelsof、label 的宏扩展函数

12)字符串处理(关键词、替换、提取等)

第四部分:Post命令

1)   Stata 16之前的post命令工作原理

2)   定义post

a)    找朋友的案例

3)   用post计算股价同步性和Beta

4)   基于网络数据的事件研究

5)   股本变更数据整理案例

6)   Frame post的工作原理

a)    使用frame计算同步性

b)    使用frame实现事件研究

c)    使用frame link替代merge

d)    使用多框架frame 替代事件研究中的矩阵

e)    使用frame 替代 preserve restore

第五部分:回归分析及结果输出

1)   putdocx命令输出内容至word文档

a)    编辑docx文件中的文字内容

b)    输出并编辑表格内容

c)    输出内存中的list结果

d)    输出矩阵

e)    输出绘图

2)   putdocx命令相关案例

a)    输出十进位制下的汉字unicode编码

b)    结合常用汉字生成随机汉字组成的段落

c)    爬取并输出陕西省人大代表信息

d)    添加footnote

e)    横页(Landscape)和竖页(portrait)交替出现

f)     添加段落

g)    从文本文件中添加内容

3)   实证结果输出

a)    描述性统计信息:sum2docx

b)    分组均值t检验:t2docx

c)    相关系数矩阵:corr2docx

d)    回归结果:reg2docx

4)   实证结果输出完整展示

第六部分:简单网络爬虫

1)   网络爬虫的基本原理

2)   Stata爬虫基本流程

a)    新浪财经的上市公司公告爬取

b)    新浪财经上市公司高管信息的爬取

c)    百度地图API的调用

3)   Chrome浏览器抓包功能的使用

a)    深交所信息披露考评数据抓取

4)   POST请求方式

a)    新浪财经港股交易数据

b)    命令行工具curl的使用

c)    Python接口的调用

5)   正则表达式

a)    正则表达式的基本思想(高级班会重点介绍)

b)    百度新闻搜索页面数量

 

培训时间:2019年11月8-11日(四天)  

培训地点:大连

培训费用:3600元/人,三人以上报名,优惠价3200元/人,学生报名3000元/人(须提供学生证);报名费含培训四天午餐,差旅及其他费用自理。

 

培训证书:1)结业证书(免费提供)  2)工业和信息化部颁发的《Stata数据分析技术应用初级培训》职业技术水平证书,该证书可作为岗位聘用、任职、定级、晋升依据。如果需要该证书的学员,请额外缴纳100元证书费,并提供身份证号和1张2寸照片。

 

报名方式

1)在线报名:登陆 科学软件网-培训-收费培训 频道,在线提交报名信息。

2)邮件报名:将您的姓名、单位名称、联系电话和邮箱地址 发邮件至

marketing@sciencesoftware.com.cn

 

 

联系我们

电话:010-82482889/62669215

Email:marketing@sciencesoftware.com.cn

网址:http://www.sciencesoftware.com.cn