(一)通过提供信息的单位背景来辨别
一般来说,拥有强大专业技术力量的单位提供的该专业方面的信息和数据比较可靠。
(二)通过分析信息产生的过程来进行判别
(1)一般地,普查的数据比抽查的数据更全面准确。
(2)长期监测的数据比短期监测的数据准确,监测面大的数据比监测面小的数据代表性大,勘探密度大的数据比勘探密度小的数据准确性大,科学实验和利用仿真模拟计算的数据比一般推理的数据准确。
(三)用不同方法、不同渠道取得的数据进行验证
如卫星图片、航测数据用实测数据进行验证;市场需求容量用行业协会、主要企业、国家统计局的数据进行对比。
(四)对比计算不同时期、不同来源的数据差异,并进行适当修正
同样一个对象的数据,在不同国家、不同历史时期,由于包含的范围不同,计算的标准和口径可能有所不同,造成数据之间有很大的差异。 如要对比分析这些数据,必须弄清统计口径,否则就会出错。
(五)通过专家集体讨论辨别信息的准确性和可靠性
对于不同渠道得到的信息,可能存在因角度不同、口径不一、方法各异等而不一致,甚至相互矛盾。这时,可以采取专家集体讨论,弄清差异和矛盾的原因,并去伪存真,达成共识。
数据分析有极广泛的应用范围,这是一个扫盲贴。
典型的数据分析可能包含以下三个步:[list]1、探索性数据分析,当数据刚取得时,可能杂乱无章,看不出规律,通过作图、造表、用各种形式的方程拟合,计算某些特征量等手段探索规律性的可能形式,即往什么方向和用何种方式去寻找和揭示隐含在数据中的规律性。2、模型选定分析,在探索性分析的基础上提出一类或几类可能的模型,然后通过进一步的分析从中挑选一定的模型。
3、推断分析,通常使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断。数据分析过程实施数据分析过程的主要活动由识别信息需求、收集数据、分析数据、评价并改进数据分析的有效性组成。
一、识别信息需求识别信息需求是确保数据分析过程有效性的首要条件,可以为收集数据、分析数据提供清晰的目标。识别信息需求是管理者的职责管理者应根据决策和过程控制的需求,提出对信息的需求。
就过程控制而言,管理者应识别需求要利用那些信息支持评审过程输入、过程输出、资源配置的合理性、过程活动的优化方案和过程异常变异的发现。二、收集数据有目的的收集数据,是确保数据分析过程有效的基础。
组织需要对收集数据的内容、渠道、方法进行策划。策划时应考虑:[list]①将识别的需求转化为具体的要求,如评价供方时,需要收集的数据可能包括其过程能力、测量系统不确定度等相关数据;②明确由谁在何时何处,通过何种渠道和方法收集数据;③记录表应便于使用;④采取有效措施,防止数据丢失和虚假数据对系统的干扰。
三、分析数据分析数据是将收集的数据通过加工、整理和分析、使其转化为信息,通常用方法有:[list]老七种工具,即排列图、因果图、分层法、调查表、散步图、直方图、控制图;新七种工具,即关联图、系统图、矩阵图、KJ法、计划评审技术、PDPC法、矩阵数据图;四、数据分析过程的改进数据分析是质量管理体系的基础。组织的管理者应在适当时,通过对以下问题的分析,评估其有效性:[list]①提供决策的信息是否充分、可信,是否存在因信息不足、失准、滞后而导致决策失误的问题;②信息对持续改进质量管理体系、过程、产品所发挥的作用是否与期望值一致,是否在产品实现过程中有效运用数据分析;③收集数据的目的是否明确,收集的数据是否真实和充分,信息渠道是否畅通;④数据分析方法是否合理,是否将风险控制在可接受的范围;⑤数据分析所需资源是否得到保障。
一、数据分析思维
首先学会做基础数据分析并不难,掌握一些必要的知识就能很快上手,学习数据分析的路径如下共三部曲:数据类型的识别、研究方法的选择、结果分析。
(1) 数据类型的识别
数据类型是一切研究的基石,也是数据研究思维的最基本且最关键的思维。确认数据的真实准确性后,即完成数据清理后,可对数据类型进行区分,一切数据均可分为两种类型,包括定性数据和定量数据。
· 定量:数字有比较意义,比如数字越大代表满意度越高,量表为典型定量数据
· 定类:数字无比较意义,比如性别,1代表男,2代表女
(2)研究方法的选择
数据类型确认后,此时即可理解数据分析方法的选择。像SPSSAU在设计时,区分数据类型的同时,还区分X和Y。比如性别和是否吸烟的关系,X是性别,Y为是否吸烟。X和Y均为定类数据。此时则应该选择“交叉卡方”分析。
第一步即选对研究方法,即数据类型的识别。
第二步即结合研究目的进行分析,常见的研究目的包括:数据基本描述、影响关系研究、差异关系研究及其它关系。
请点击输入图片描述
(3)分析结果
分析基础比较薄弱,可使用SPSSAU进行分析,系统会自动生成指标解读报告。
请点击输入图片描述
二、分析思路模板
研究框架是分析的核心,一般可分为非量表和量表问卷,然后再对照着框架进行分析即可。
量表类问卷最大的特点是:非常多的量表题,而且量表题对应着‘变量’或者‘维度’。便于研究‘变量’间的关系情况。以及可以使用信度、效度、因子分析等方法。
非量表题其最大的特点为大部分为单选题、多选题或者排序填空题等,但很少 有出现量表题(是量表题是指类似答项为“非常不同意”,“比较不同意”,“中立”,“比较同意”和 “非常同意”之类的问题)更多是使用基本频数分析和交叉分析等,同时使用图形和表格进行多样化展示。
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它们分别从不同的角度对数据进行挖掘。
①分类。分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。它可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等,如一个汽车零售商将客户按照对汽车的喜好划分成不同的类,这样营销人员就可以将新型汽车的广告手册直接邮寄到有这种喜好的客户手中,从而大大增加了商业机会。
②回归分析。回归分析方法反映的是事务数据库中属性值在时间上的特征,产生一个将数据项映射到一个实值预测变量的函数,发现变量或属性间的依赖关系,其主要研究问题包括数据序列的趋势特征、数据序列的预测以及数据间的相关关系等。它可以应用到市场营销的各个方面,如客户寻求、保持和预防客户流失活动、产品生命周期分析、销售趋势预测及有针对性的促销活动等。
③聚类。聚类分析是把一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能小。它可以应用到客户群体的分类、客户背景分析、客户购买趋势预测、市场的细分等。
④关联规则。关联规则是描述数据库中数据项之间所存在的关系的规则,即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现,即隐藏在数据间的关联或相互关系。在客户关系管理中,通过对企业的客户数据库里的大量数据进行挖掘,可以从大量的记录中发现有趣的关联关系,找出影响市场营销效果的关键因素,为产品定位、定价与定制客户群,客户寻求、细分与保持,市场营销与推销,营销风险评估和诈骗预测等决策支持提供参考依据。
⑤特征。特征分析是从数据库中的一组数据中提取出关于这些数据的特征式,这些特征式表达了该数据集的总体特征。如营销人员通过对客户流失因素的特征提取,可以得到导致客户流失的一系列原因和主要特征,利用这些特征可以有效地预防客户的流失。
⑥变化和偏差分析。偏差包括很大一类潜在有趣的知识,如分类中的反常实例,模式的例外,观察结果对期望的偏差等,其目的是寻找观察结果与参照量之间有意义的差别。在企业危机管理及其预警中,管理者更感兴趣的是那些意外规则。意外规则的挖掘可以应用到各种异常信息的发现、分析、识别、评价和预警等方面。
⑦Web页挖掘。随着Internet的迅速发展及Web 的全球普及, 使得Web上的信息量无比丰富,通过对Web的挖掘,可以利用Web 的海量数据进行分析,收集政治、经济、政策、科技、金融、各种市场、竞争对手、供求信息、客户等有关的信息,集中精力分析和处理那些对企业有重大或潜在重大影响的外部环境信息和内部经营信息,并根据分析结果找出企业管理过程中出现的各种问题和可能引起危机的先兆,对这些信息进行分析和处理,以便识别、分析、评价和管理危机。
总的分两种:
1 列表法
将实验数据按一定规律用列表方式表达出来是记录和处理实验数据最常用的方法。表格的设计要求对应关系清楚、简单明了、有利于发现相关量之间的物理关系;此外还要求在标题栏中注明物理量名称、符号、数量级和单位等;根据需要还可以列出除原始数据以外的计算栏目和统计栏目等。最后还要求写明表格名称、主要测量仪器的型号、量程和准确度等级、有关环境条件参数如温度、湿度等。
2 作图法
作图法可以最醒目地表达物理量间的变化关系。从图线上还可以简便求出实验需要的某些结果(如直线的斜率和截距值等),读出没有进行观测的对应点(内插法),或在一定条件下从图线的延伸部分读到测量范围以外的对应点(外推法)。此外,还可以把某些复杂的函数关系,通过一定的变换用直线图表示出来。例如半导体热敏电阻的电阻与温度关系为,取对数后得到,若用半对数坐标纸,以lgR为纵轴,以1/T为横轴画图,则为一条直线。
极差
说明数据的波动幅度。
平均差 符合条件
定义:在一组数据x1,x2,…,xn中各数据与它们的平均数的差的绝对值的平均数即这组数据的“平均差”。平均差越大,数据离散程度越高。
方差
定义:在一组数据x1,x2,…,xn中,各数据与它们的平均数差的平方,它们的平均数,即为这组数据的方差。
一组数据方差的算数平方根即为这组数据的标准差。
方差和标准差越小 说明数据离散程度越低
据我所知,应该没有了
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
蜀ICP备2020033479号-4 Copyright © 2016 学习鸟. 页面生成时间:3.918秒