studyssmart -一体化学习应用程序。
4.8•+11k收视率
下载量超过300万次
免费的
你对这个应用有多满意?请按以下等级给它打分:
非常不满意
\(2\)有些不满意
既不满意也不不满意
\(4\)有点满意
(5)非常满意
你刚刚看到了分类变量!
记住,单变量数据,也称为单变量数据,是对总体或样本中的个体进行的观察。这些数据有不同的类型,比如定性的、定量的、分类的、连续的、离散的等等。特别是你们会看到分类变量,也常被称为分类数据。我们先来看一下定义。
变量称为A分类变量如果收集到的数据属于类别。
换句话说,名字告诉你它到底是什么!它是被分类的数据。分类变量是定性变量因为它们处理的是质量,而不是数量。
分类变量主要有两种类型,名义变量和序数变量。
分类变量称为分类变量序数如果它有一个隐含的命令。
序数的一个例子分类数据这将是本文开头的调查。它要求你在1到5的范围内对满意度进行评分,这意味着你的评分有一个隐含的顺序。请记住,数字数据是包含数字的数据,调查示例确实包含数字。因此,调查数据有可能是有序的,也有可能是数值的。
分类变量称为分类变量名义上的如果类别被命名。
假设一项调查问你住在什么样的房子里,你可以选择宿舍、房子和公寓。这些是命名类别的例子,这就是名义分类数据。换句话说,如果它有一个命名的类别,但不是按数字排序的,那么它就是一个名义分类变量。
在继续查看分类变量的更多示例之前,让我们先看看分类数据的一些优点和缺点。
有利的一面是:
结果非常直接,因为人们只有很少的选择。
因为选项是提前安排好的,所以不存在需要分析的开放式问题。分类数据称为分类数据混凝土因为这个性质。
分类数据比其他类型的数据更容易分析(而且分析成本更低)。
不利的一面是:
一般来说,你需要获得相当多的样本,以确保调查准确地代表总体。这样做可能代价高昂。
因为这些类别是在调查开始时列出的,所以它不是很敏感的。例如,如果在一项调查中只有两种头发颜色可供选择,即棕色头发和白色头发,那么人们将很难决定将自己的头发颜色归入哪一类(假设他们有头发颜色的话)。这可能会导致没有回应,人们会对自己的头发颜色做出意想不到的选择,从而扭曲数据。
你不能对分类数据进行定量分析!因为它不是数值数据你不能对它做算术。例如,你不能把一个满意度为\(4\)的调查结果加到满意度为\(3\)的调查结果上得到满意度为\(7\)。
你怎么样?收集分类数据?这通常是通过访谈(面对面或电话)或调查(在线、邮件或面对面)来完成的。无论哪种情况,所问的问题都是不开放式的。他们总是要求人们在一组特定的选项中做出选择。
如何分析分类数据?它通常是用比例或百分比完成的,可以是表格或图表。有关这些主题的更多信息,请参见分类数据表格和条形图。
让我们看一些分类数据的例子。
假设你对看一部电影很感兴趣,为了决定你是否要花钱,你问了一群朋友他们是否喜欢这部电影。在你的朋友中,15人喜欢这部电影,50人不喜欢。这里的变量是什么,它是什么样的变量?
解决方案
首先,这是分类数据。它分为两类,“喜欢”和“不喜欢”。数据集中有一个变量,即你的朋友对这部电影的看法。事实上,这是一个例子名义分类数据。
让我们看另一个例子。
回到电影的例子,假设你问你的朋友他们是否喜欢某一部电影,以及他们住在哪个城市。有多少变量,它们是什么类型的?
解决方案
就像前面的例子一样,你的朋友对这部电影的看法是一个变量,它是绝对的。因为你还问了你的朋友住在哪个城市,所以这里有第二个变量,它是他们居住的州名。美国只有这么多州,所以他们可以列为州的地方数量有限。因此,国家是第二个名义分类变量,你已经收集了数据。
让我们稍微改变一下你在调查中的问题。
现在假设你问你的朋友他们愿意花多少钱去看这部电影,你给了他们三个价格范围:低于5美元;5至10美元;而且超过10美元。这是什么数据?
解决方案
这仍然是分类数据,因为在你让你的朋友回答你的调查之前,你已经列出了他们可以回答的类别。但是这次是有序分类数据,因为您可以按价格(这是一个数字)对类别进行排序。
那么如何比较分类变量呢?
假设你问你的朋友他们是否喜欢某一部电影,以及他们是否付钱5美元以下,5美元至10美元之间,或10美元以上去看看。这些都是两个分类变量那么,你如何比较它们呢?有没有办法知道他们花多少钱去看电影是否影响了他们对这部电影的喜爱程度?
您可以做的一件事是查看数据的比较条形图,或双向表。你可以在文章条形图中找到更多的信息。另一种方法是更正式的统计检验,叫做卡方检验。这个主题可以在文章中找到分类数据分布的推理。
分类变量是指收集的数据不是测量值。例如,头发颜色是一种分类数据,但每周购买的产品磅数不是。
头发颜色,教育程度和顾客满意度在1到5的范围内都是分类变量。
名义上的分类变量是一个可以被归入类别的变量,但这些类别本质上不是有序的。例如,无论你是住在房子里,公寓里还是其他地方,都是绝对的,但它们没有与之相关的内在数字。
定量数据是表示数量的数据,比如以英寸为单位的高度。分类数据是按类别收集的数据,例如,如果一项调查询问某人是否身高低于4英尺,身高在4到6英尺之间,还是身高超过6英尺。
测量分类数据的最常用方法是使用图形显示的百分比,如条形图。
做好充分的准备,按时制定个人计划。
用游戏化的小测验测试你的知识。
在创纪录的时间内创建和查找抽认卡。
创造美丽的音符比以往任何时候都快。
把所有的学习材料放在一个地方。
上传无限的文件并在线保存。
确定你的学习优势和劣势。
设定个人学习目标,达到目标就能获得积分。
不要再用学习提醒来拖延时间。
赚取积分,解锁徽章和水平,同时学习。
在笔记中完全自动创建抽认卡。
使用我们的模板创建最漂亮的学习材料。
注册标记并做笔记。100%免费。