您当前浏览器版本过低,为了不影响您的使用,建议您使用最新的谷歌浏览器、火狐浏览器、 360浏览器,更换浏览器后使用更流畅!(注意!双核浏览器请切换为极速模式)
工信部人工智能赋能中小企业典型应用场景案例(科研领域)

stata数据清洗教程

2021-11-24
9744

  stata数据清洗教程。在我们遇到数据异常的时候,应该怎么使用stata清理数据呢?本期艾思科蓝小编给大家带来了一期stata对异常数据的清洗教程,希望能帮到大家。

stata数据清洗教程.png

  对于数据中的异常值,我们通常的处理方式有以下几种:

  方法一:直接删除----适合缺失值数量较小,并且是随机出现的,删除它们对整体数据影响不大的情况。

  Stata会区分缺失值:数值型变量缺失以点(.)表示,字符型变量确实以双引号("")表示,不要与空字符型变量(“ ”)搞混。

  方法二:使用一个全局常量填充---譬如将缺失值用“Unknown”等填充,但是效果不一定好,因为算法可能会把它识别为一个新的类别,一般很少用。

  方法三:使用均值或中位数代替----优点:不会减少样本信息,处理简单。缺点:当缺失数据不是随机数据时会产生偏差.对于正常分布的数据可以使用均值代替,如果数据是倾斜的,使用中位数可能更好。

  方法四:插补法

  1)随机插补法----从总体中随机抽取某个样本代替缺失样本

  2)多重插补法----通过变量之间的关系对缺失数据进行预测,利用蒙特卡洛方法生成多个完整的数据集,在对这些数据集进行分析,最后对分析结果进行汇总处理

  3)热平台插补----指在非缺失数据集中找到一个与缺失值所在样本相似的样本(匹配样本),利用其中的观测值对缺失值进行插补。这样做的优点是:简单易行,准去率较高。缺点:变量数量较多时,通常很难找到与需要插补样本完全相同的样本。但我们可以按照某些变量将数据分层,在层中对缺失值实用均值插补

  4)拉格朗日差值法和牛顿插值法(简单高效,数值分析里的内容)

  方法五:建模法

  可以用回归、使用贝叶斯形式化方法的基于推理的工具或决策树归纳确定。例如,利用数据集中其他数据的属性,可以构造一棵判定树,来预测缺失值的值。

  以上方法各有优缺点,具体情况要根据实际数据分分布情况、倾斜程度、缺失值所占比例等等来选择方法。一般而言,建模法是比较常用的方法,它根据已有的值来预测缺失值,准确率更高。

  以上就是本期艾思科蓝小编分享的关于“stata命令”的所有内容啦,如需了解更多相关信息,请点击艾思科蓝关注我们,期待我们的再会。

Stata面板数据计量分析高级培训班.jpg

已收藏 0
点赞 0

学术会议

【双一流高校主办/往届3个月EI检索】第五届智能机械与人机交互技术学术会议(IHCIT 2026)
第五届智能机械与人机交互技术学术会议(IHCIT 2026)将于2026年8月21-23日于中国·成都召开,大会旨在聚焦“智能机械”与人机交互技术,探讨国内外最新研究进展。
2026-08-21
【IEEE出版|英国布鲁内尔大学主办】第七届计算机视觉与数据挖掘国际学术会议(ICCVDM 2026)
第七届计算机视觉与数据挖掘国际学术会议(ICCVDM 2026)定于2026年8月15-17日在英国伦敦召开。会议旨在为计算机视觉、数据挖掘等计算机领域的专家学者提供一个可交流学术成果、促进合作的平台
2026-08-15
【专家云集 | 征稿主题广 | 往届会后四个月检索】第二届人工智能与基础模型国际学术会议(AIFM 2026)
第二届人工智能与基础模型国际学术会议(AIFM 2026)将于2026年6月26-28日在新疆乌鲁木齐盛大召开,会议由中国科学院新疆理化研究所主办,欢迎各界人士到乌鲁木齐。
2026-06-26
IEEE出版|第五届人工智能、物联网和云计算技术国际会议(AIoTC 2026)
AIoTC 2025已见刊检索。AIoTC 2026主要围绕“人工智能、物联网和云计算技术”的最新研究展开,旨在荟聚世界各地该领域的专家、学者、研究人员及相关从业人员,分享研究成果
2026-07-17
【IEEE丨山东大学牵头六所高校合办】第八届电子工程与信息学国际学术会议(EEI 2026)
第八届电子工程与信息学国际学术会议(EEI 2026)将于2026年6月26日至28日在中国济南召开。EEI 2026将围绕“电子工程”、“信息学”与“计算机科学”等相关最新研究领域展开交流探讨。
2026-06-26
【工程院院士等大咖云集|连续3届稳定EI检索】第四届遥感、测绘与地理信息系统国际学术会议(RSMG 2026)
第四届遥感、测绘与地理信息系统国际学术会议(RSMG 2026)将于2026年7月10日至12日于西安召开。征稿:遥感、测绘、地理信息系统。环境遥感、光学遥感、图象数据处理技术、高光谱影像处理等,EI
2026-07-10
相关资讯

中国知网中的文献检索式是什么?

中国知网中的文献检索式是什么?什么是文献检索式呢?接下来艾思科蓝​小编带大家了解一下文献检索式,希望能对大家有所帮助。

20199

0

2021-11-16

Stata对数据缺失值的处理方法

Stata对数据缺失值有什么处理方法?怎么去解决数据缺失呢?下面艾思科蓝​小编给大家分享一下stata对数据缺失值的处理方法。

17654

0

2021-11-23

科研项目分工有哪些

清晰、合理的分工扮演着至关重要的角色。明确的分工不仅能提高效率,更能避免重复劳动和责任推诿,确保研究过程有条不紊。那么,一个典型的科研团队通常包含哪些角色,他们又分别承担着怎样的职责呢?本篇艾思科蓝小编就为大家介绍“科研项目分工有哪些”。

5701

0

2026-01-15

科研项目如何申报

对于很多刚踏入学术圈的青年教师和研究生来说,项目申报就像面对一道复杂的必答题,既关乎研究能否顺利开展,也影响着个人的学术发展路径。这个过程看似充满了各种条条框框,但只要理清思路、准备充分,成功获得资助并非遥不可及。想要在这场学术竞争中脱颖而出,清晰的规划和对细节的把握至关重要。本篇艾思科蓝小编就为大家介绍“科研项目如何申报”。

4875

0

2026-01-15

科研需要哪些设备

科研工作如同一场探险,想要深入未知、揭开谜题,除了研究者本身的智慧与毅力,也离不开一系列精良的“装备”。从观察微观世界的利器到处理海量数据的智能系统,这些工具共同构成了现代科学研究的基石。不同的学科领域对设备的需求千差万别,但一些核心的仪器和平台几乎是通用的。本篇艾思科蓝小编就为大家介绍“科研需要哪些设备”。

4939

0

2026-01-15

科研需要哪些环境

一项成功的科研事业,绝非仅靠单打独斗就能完成它更像一株需要精心培育的幼苗其能否茁壮成长、开花结果,极大地依赖于它所处的“生态环境”。这个环境是一个复杂的综合体,既包括有形的硬件支持,也涵盖无形的氛围塑造。那么,究竟什么样的土壤,才能让创新的种子得以萌发?本篇艾思科蓝小编就为大家介绍“科研需要哪些环境”。

4915

0

2026-01-15
立即开启