首页

文章

r语言将变量中的缺失值赋值怎么写

发布网友 发布时间:2022-04-19 09:56

我来回答

2个回答

热心网友 时间:2022-05-12 14:30

1、定义一个变量m,并使用函数c()进行对变量m赋值,使用的是“->”,如下图所示。

2、可以不使用函数,直接使用“->”进行赋值。

3、也可以倒过来赋值,将变量放在函数后面,还是使用“->”赋值。

4、可以使用assign对变量进行赋值,前面参数是被赋值的变量,后面是需要的对象。

5、定义一个变量w,使用函数c()进行赋值;定义一个变量c,取w变量的倒数。

6、定义变量k,使用函数c()进行赋值;再定义一个变量h,使用k进行赋值,就完成了。

热心网友 时间:2022-05-12 15:48

一.什么是缺失值,NA与NULL的区别

(1)NA表示数据集中的该数据遗失、不存在。在针对具有NA的数据集进行函数操作的时候,该NA不会被直接剔除。如x<-c(1,2,3,NA,4),取mean(x),则结果为NA,如果想去除NA的影响,需要显式告知mean方法,如 mean(x,na.rm=T);NA是没有自己的mode的,在vector中,它会“追随”其他数据的类型,比如刚刚的x,mode(x)为numeric,mode(x[4])亦然

(2) NULL表示未知的状态。它不会在计算之中,如x<-c(1,2,3,NULL,4),取mean(x),结果为2.5。NULL是不算数的,length(c(NULL))为0,而length(c(NA))为1。可见NA“占着”位置,它存在着,而NULL没有“占着”位置,或者说,“不知道”有没有真正的数据。

二.识别缺失值NA

在R语言中缺失值通常以NA表示,判断是否缺失值的函数是is.na。
另一个常用到的函数是complete.cases,它对数据框进行分析,判断某一观测样本是否完整。
下面我们读取VIM包中的sleep数据作为例子,它的样本数为62,变量数为10,由complete.cases函数计算可知完整的样本个数为42。

data(sleep, package="VIM")
dim(sleep)
sum(complete.cases(sleep))
#可以使用vim包的aggr函数以图形方式描述缺失数据
aggr(sleep)

上面的左图显示各变量缺失数据比例,右图显示了各种缺失模式和对应的样本数目,显示nond和dream经常同时出现缺失值。

三、识别缺失数据的模式

存在缺失数据情况下,需进一步判断缺失数据的模式是否随机。在R中是利用mice包中的md.pattern函数。

library(mice)
md.pattern(sleep)
上表中的1表示没有缺失数据,0表示存在缺失数据。第一列第一行的42表示有42个样本是完整的,第一列最后一行的1表示有一个样本缺少了span、dream、nond三个变量,最后一行表示各个变量缺失的样本数合计。

四、处理缺失数据

对于缺失数据通常有三种应付手段:
(1)当缺失数据较少时直接删除相应样本
删除缺失数据样本,其前提是缺失数据的比例较少,而且缺失数据是随机出现的,这样删除缺失数据后对分析结果影响不大。

(2)对缺失数据进行插补
用变量均值或中位数来代替缺失值,其优点在于不会减少样本信息,处理简单。但是缺点在于当缺失数据不是随机出现时会产成偏误。
多重插补法(Multiple imputation):多重插补是通过变量间关系来预测缺失数据,利用蒙特卡罗方法生成多个完整数据集,再对这些数据集分别进行分析,最后对这些分析结果进行汇总处理。可以用mice包实现。

(3)使用对缺失数据不敏感的分析方法,例如决策树。
基本上缺失数据处理的流程是首先判断其模式是否随机,然后找出缺失的原因,最后对缺失值进行处理。

exp 1

library(mice)
imp=mice(sleep,seed=1234)
fit=with(imp,lm(Dream~Span+Gest))
pooled=pool(fit)
summary(pooled)

#在R语言中实现方法是使用mice包中的mice函数,生成多个完整数据集存在imp中,再对imp进行线性回归,最后用pool函数对回归结果进行汇总。汇总结果的前面部分和普通回归结果相似,nmis表示了变量中的缺失数据个数,fmi表示fraction of missing information,即由缺失数据贡献的变异
ups快递客服电话24小时 贷款记录在征信保留几年? 安徽徽商城有限公司公司简介 安徽省徽商集团新能源股份有限公司基本情况 安徽省徽商集团有限公司经营理念 2019哈尔滨煤气费怎么有税? 快手删除的作品如何恢复 体育理念体育理念 有关体育的格言和理念 什么是体育理念 万里挑一算彩礼还是见面礼 绿萝扦插多少天后发芽 绿萝扦插多久发芽 扦插绿萝多久发芽 炖牛排骨的做法和配料 网络诈骗定罪标准揭秘 “流水不争先”是什么意思? mc中钻石装备怎么做 为什么我的MC里的钻石块是这样的?我想要那种。是不是版本的问题?如果是... 带“偷儿”的诗句 “君不见巴丘古城如培塿”的出处是哪里 带“奈何”的诗句大全(229句) 里翁行()拼音版、注音及读音 带“不虑”的诗句 “鲁肃当年万人守”的出处是哪里 无尘防尘棚 进出口报关流程,越详细越好。谢谢大家指教。 双线桥不是看化合价升多少就标多少的吗?为什么CL2+2KI=2KCL+I2中I失... 出师表高锰酸钾有画面了吗 2021年幼儿园新学期致家长一封信 电脑屏幕一条黑线怎么办? 销售代理商销售代理商的特点 商业代理商业代理的特征 如何看微信有没有开通微众银行 为什么微众没有开户 微众银行怎么开户 微众银行APP开户流程是什么? 唐古拉山海拔唐古拉山海拔是多少 怎么看待取消跳广场舞的人的退休金 如何选购新鲜的蓝田水柿? 恭城水柿柿树作用 创维洗衣机使用教程 创维全自动洗衣机怎么使用 自动开门器 狗羊属相婚姻相配吗 3岁的小孩不会说话怎么办 3岁孩子不会说话,应该挂什么科? 3岁小孩不会说话正常吗 鹿茸炖乌鸡怎么做? 新型冠状肺炎吃什么药可以预防 冰箱上电后一直响 食品生产许可证编号开头为“ G”。 r语言 (argument if of length zero)求解答 404 Not Found r语言中怎样查看函数源代码 洋葱OMALL和天猫国际的区别是什么呀?哪个比较靠谱啊? R语言 seq函数 如何查看R语言函数源代码 r语言中, == 和=,<-各自的区别 R语言自己定义一个函数.这个句子那里输错了……见图片 R语言里 len和length的区别 R语言怎么写函数 r语言中如何统计满足制定条件的行数? r语言中对象的类型和长度分别通过函数什么得到 r语言 length和ncol的区别 R语言之—字符串处理函数 手机微信怎样定时发消息 微信有没定时发送功能 怎样可以设置定时发送微信信息 芯片是我国科技的软肋,台积电若不给麒麟处理器代工,该怎么办? PMIC芯片上市公司有哪些? 江苏一盛荣芯片科技有限公司怎么样? R软件中x<-seq(-3,3,0.02)中三个数字代表什么意思 R语言regexpr中attr是什么意思啊 R语言“seq函数”是什么? 美拍视频怎么下载到电脑 美拍视频下载到电脑的方法 美拍网页版上的视频怎么下载到电脑上 美拍视频怎么下载保存到电脑? 请问如何将美拍的视频下载到电脑上呢? 美拍上的无水印高清视频怎么批量下载到电脑? 如何将美拍视频作者页中的视频都保存到电脑上? 美拍短视频要怎么保存视频到电脑上? 求助,美拍里的视频怎么导出到电脑上 如何在电脑上把别人的美拍视频下载下来 美拍上看到不错的视频,应该如何进行下载? 美拍视频怎么下载到电脑? 手机美拍视频怎么下载到电脑?电脑下载美拍视频方法介绍 美拍,拍好的视频要怎么保存到电脑里,急。 美拍视频怎么导入电脑 美拍上别人的视频怎么下载下来? 美拍视频怎么下载到电脑或者手机? 怎么用美拍保存到本地视频里,电脑版
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com