关于假冒网站的声明

图书搜索:

Stata 环境下的数据管理实务手册

作  者:[美]迈克尔·N·米歇尔Michael N.Mitchell

出版时间:2016-05-31 字  数:522 千字
书  号:182391 ISBN:978-7-300-18239-1
开  本:16 包  装:平装
印  次:1-2 译 者:

定价:¥68.00

内容简介

本书展示了Stata在数据管理工作中的作用,而不仅仅是其在统计上的优势。全书共11章,第一章是简介,第二至五章是讨论数据管理的基本问题:读取和录入数据、数据清理、给数据加标签和创建变量。第六至八章讨论的是数据管理项目中较为常见的问题:合并数据、处理分组的观测值以及改变数据形状。第九章讨论的是有关数据管理编程的问题。这章描述了怎样组织构建数据分析以便其能被循环使用。第十章主要为扩展内容,介绍了怎样获取与本书相关的在线资源,如何寻找和安装其他Stata用户编写的程序,并推荐了一系列作为补充的在线资源。最后的附录列出了Stata操作中的一些基本要素。这些要素并不是关于某个特定的数据管理任务的,较为分散,但无处不在。

作者简介

迈克尔•N•米歇尔是一位医疗卫生服务领域的高级统计师。12年来,他一直在加州大学洛杉矶分校学术技术服务部门的统计咨询组工作。所著书籍有A Visual Guide to Stata Graphics ,Interpreting and Visualizing Regression Models Using Stata ,Stata for the Behavioral Sciences等。

章节目录

第一章 入门介绍
1.1 本书的使用
1.2 本书的概要
1.3 本书使用的案例
第二章 读取和录入数据
2.1 简 介
2.2 读入Stata数据
2.3 保存Stata数据
2.4 读取逗号或制表符作分隔符的文件
2.5 读取空格作分隔符的文件
2.6 读取固定格式文件
2.7 读取一条观测值包含多行原始数据的固定格式的文件
2.8 读取SAS XPORT文件
2.9 读取数据时的常见错误
2.10 在Stata数据编辑器中直接输入数据
2.11 保存逗号或制表符作分隔符的文件
2.12 保存空格作分隔符的文件
2.13 保存SAS XPORT文件
第三章 数据清理
3.1 简 介
3.2 数据的双录
3.3 单个变量检查
3.4 用分类变量检查分类变量
3.5 用连续变量检查分类变量
3.6 用连续变量检查连续变量
3.7 修正数据中的错误
3.8 识别重复录入
3.9 关于数据清理的总结性思考
第四章 给数据加标签
4.1 简 介
4.2 描述数据
4.3 给变量加标签 4.4 给取值加标签
4.5 标签的作用
4.6 用不同的语言给变量和取值加标签
4.7 给数据添加注释
4.8 格式化变量的显示
4.9 改变数据中的变量顺序
第五章 创建变量
5.1 简 介
5.2 创建和修改变量
5.3 数值表达式和函数
5.4 字符表达式和函数
5.5 重新编码
5.6 给缺失值编码
5.7 虚拟变量
5.8 日期变量
5.9 日期-时间变量
5.10 变量间的计算
5.11 个案间的计算
5.12 更多的使用egen命令的例子
5.13 把字符型变量转换成数值型变量
5.14 把数值型变量转换成字符型变量
5.15 变量重命名和变量排序
第六章 合并数据
6.1 简 介
6.2 添加数据
6.3 添加数据时存在的问题
6.4 一对一匹配合并数据
6.5 一对多匹配合并数据
6.6 合并多个数据
6.7 更新合并
6.8 合并数据时的其他选项
6.9 合并数据时的问题
6.10 连接数据
6.11 交叉合并数据
第七章 处理分组的观测值
7.1 简 介
7.2 为每个分组获取独立的结果
7.3 分组独立计算数值
7.4 组内计算:加下标的观测值
7.5 组内计算:跨观测值计算
7.6 组内计算:求和
7.7 组内计算:更多示例
7.8 比较by命令和tsset命令
第八章 改变数据形状
8.1 简 介
8.2 宽数据和长数据
8.3 长数据转换成宽数据
8.4 长数据转宽数据时的问题
8.5 宽数据转换成长数据
8.6 宽数据转长数据时的问题
8.7 多层次数据
8.8 延展数据
第九章 数据管理编程
9.1 简 介
9.2 对数据管理长期目标的建议
9.3 执行do文件和制作日志文件
9.4 数据检验的自动化
9.5 合并do文件
9.6 介绍Stata中的宏
9.7 使用Stata中的宏
9.8 通过变量循环实现命令的重复执行
9.9 通过数字循环实现命令的重复执行
9.10 任何数据管理都能用循环实现命令的重复执行
9.11 获取Stata命令保存的结果
9.12 把estimation命令的结果保存为数据
9.13 编写Stata程序
第十章 附加资源
10.1 本书的在线资源
10.2 搜索并安装其他程序
10.3 更多在线资源
附录 基础知识
A1.简 介
A2.Stata语法概述
A3.用by命令进行分组分析
A4.注释
A5.数据类型
A6.逻辑表达式
A7.函数
A8.用if和in对观测值进行分组
A9.用keep和drop选择观测值和变量
A10.缺失值
A11.变量列表
主题词表

精彩片断

有个滤油机公司曾经做过这么一则广告:一个机修工一边修理一台发动机一边说, 如果能够定期给发动机换油,就可以不用修理它。那个机修工说:“你可以现在花钱,也可以等将来再花钱。”这里的暗示是你要么现在花3美元在一个滤油器上,要么将来花3 000美元去修理发动机。我觉得这是一个很好的类比,双录数据的努力(成本)相当于广告中滤油器的费用。开始的数据双录代价很小(在数据录入过程中拿出一定的时间来清理数据),但如果一开始只是单录数据,后期就需要付出更大的代价来清理数据(检查所有变量中可能出现的错误和不一致的地方)。如果你自己正在录入一份问卷或拿到其他的已经搜集好的原始资料,我强烈建议进行数据双录。本节将介绍如何用 Stata实现数据的双录。
数据双录,顾名思义,就是把同一数据录入两次,且保存成两个不同的数据文件。然后把两个数据文件做比对。如果出现不一致的地方,就意味着数据录入时出错了,然后可以通过检查原始资料(如原始问卷)找到正确的取值来纠正发现的错误。如果比对以后没有出现不一致的地方,也不一定证明录入的数据是正确的;因为也有可能两次数据录入的时候出错的方式是一样的。在大多数情况中,很难想象在两次录入出现一模一样的错误,这种事情不会经常发生。比如,假设调查用的是纸笔问卷,答案都是手填的,且两次是同一个人录入。第一次录入的时候把数字4误认为数字9,如果是同一个录入员,有可能把以后遇到的所有4都误认为9。这一点提示我们:独立双录数据是必要的,这样能够减少录入数据时重复犯错的可能性。

书评

其他

 

作者其他图书

没有相关图书

人大出版社天猫旗舰店 | 书香缘电子书店 | 中国高校人文社科网 | 中国高校教材图书网 | 中国一考网 | 教研服务网络 | 人大社内网 | 人大芸窗职教学苑 | 友情链接
京ICP证130369号 新出网证(京)字029号 京公网安备110108002480号
地址:北京市海淀区中关村大街31号  有网站下载或登录的问题请联系:010-62516085
邮编:100080 联系电话:010-62514760 E-mail:club@crup.com.cn