数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。
数据处理对数据(包括数值的和非数值的)进行分析和加工的技术过程。包括对各种原始数据的分析、整理、计算、编辑等的加工和处理。比数据分析含义广。随着计算机的日益普及,在计算机应用领域中,数值计算所占比重很小,通过计算机数据处理进行信息管理已成为主要的应用。
如测绘制图管理、仓库管理、财会管理、交通运输管理,技术情报管理、办公室自动化等。在地理数据方面既有大量自然环境数据(土地、水、气候、生物等各类资源数据),也有大量社会经济数据(人口、交通、工农业等),常要求进行综合性数据处理。
扩展资料:
数据处理的基本方式:
根据处理设备的结构方式、工作方式,以及数据的时间空间分布方式的不同,数据处理有不同的方式。不同的处理方式要求不同的硬件和软件支持。每种处理方式都有自己的特点,应当根据应用问题的实际环境选择合适的处理方式。
数据处理主要有四种分类方式:
1、根据处理设备的结构方式区分,有联机处理方式和脱机处理方式。
2、根据数据处理时间的分配方式区分,有批处理方式、分时处理方式和实时处理方式。
3、根据数据处理空间的分布方式区分,有集中式处理方式和分布处理方式。
4、根据计算机中央处理器的工作方式区分,有单道作业处理方式、多道作业处理方式和交互式处理方式。
参考资料来源:百度百科-数据处理
一、线路交换
所谓线路交换是通过网络中的节点在两个站之间建立一条专用的通讯线路。如图1的电话系统,这种线路交换系统,在两个站之间有一个实际的物理连接,这种连接是节点之间的连接序列。在传输任何数据之间都必须建立点到点的线路。如站1发送一个请求到节点2,请求与站点2建立一个连接,那么站点1到节点1是一条专用线路。在交换机上分配一个专用的通道连接到节点2再到站点2的通讯。至此就建立了一条从站点1经过节点2再到站点2的通讯物理通道。这样就可以将话音从站点1传送到站点2了,一般来说这种连接是全双工的,可以在两个方向传输话音(数据)。
二、报文交换
这种交换方式不需要在两个站点之间建立一条专用通路,如果一个站想要向站点2发送一个报文(信息的一个逻辑单位),它把站点2的地址(编码方式,叫做地址码)附加在要发送的报文上。然后把报文通过网络从节点到节点进行发送,在每个节点中(如要通过多个节点才能发送到站点2)完整地接收整个报文且暂存这个报文,然后再发送到下一个节点。在交换网中,每个节点是一个电子或机电结合的交换设备,每个节点通常是一台通用的小型计算机。它具有足够的存储容量来缓存进入的报文。一个报文在每个节点的延迟时间等于接收报文的所有位所需要的时间,加上等待时间和重传到下一节点所需要的排队延时时间。
报文交换有以下优点
1、线路效率较高,这是因为许多报文可以用分时方式共享一条节点到节点的通道。
2、不需要同时使用发送器和接收器来传输数据,网络可以在接收器可用之前暂时存储这个报文。
3、在线路交换网上,当通讯量变得很大时,就不能接受某些呼叫。而在报文交换上却仍然可以接收报文,只是传送延迟会增加。
4、报文交换系统可以把一个报文发送到多个目的地。
5、能够建立报文的优先权。
6、报文交换网可以进行速度和代码的转换,因为每个站都可以用它特有的数据传输率连接到其他点,所以两个不同传输率的站也可以连接,另外还可以转换传输数据的格式。
三、分组交换
分组交换方式兼有报文交换和线路交换的优点。其形式上非常像报文交换。主要差别在于分组交换网中要限制传输的数据单位长度,一般在报文交换系统中可传送的报文数据位数可做得很长,而在分组交换中,传送报文的最大长度是有限制的,如超出某一长度,报文必须要分割成较少的单位,然后依次发送,我们通常称这些较少的数据单位为分组。这就是报文交换与分组交换所不同之处。
变量变换也称变量代换,是将原数据X转换成它的某种函数值如lgX,X1/2等,其目的是使变换后的数据达到某种要求。例如运用方差分析作多个均数间的比较时,要求各样本所来自的总体分布是正态的,方差是相同的,以及处理的效应是可加的。如果样本所来自的总体偏离这三个条件太远,方法之一是进行变量变换,使之达到上述要求。又如求曲线回归方程时,常作变量变换,使之达到直线化的要求。此外,在计算过程中,常用变量变换达到简化运算的要求等等。应该指出的是,根据变换值进行统计分析,常用以说明原数据的信息,而且常需还原成原数据的单位。运用方差分析时,总体的非正态性、方差的非齐性和效应的不可加性这三者常常一起发生,往往经过某种变量变换改正其中之一时,可使其余两者亦有所改善。
变量变换的常用方法有对数变换、平方根变换、平方根反正弦变换、概率单位变换、logit变换、反双曲正切变换、倒数变换、乘方变换等。方法的选择要根据变换的目的和原数据的性质、分布特征,特别是变换后的效果。当变换所得数值仍未达到预期的要求时,应具体分析其原因,再按照资料的性质用不同的变换方法尝试,但不要盲目乱试。
科技成果转化主要有五种方式:①自行投资实施转化;②向他 人转让科技成果;③许可他人使用科技成果;④以科技成果作为合作条件,与他人共同实施转化;⑤以该科技成果作价投资,折算股份或者出资 比例。
其中,第一种方式属于科技成果持有人自行转化,即高等院校、科研 院所或企业等主体将其研发的科技成果应用于本单位的生产活动,此方 式的特点是没有中间环节,降低了成果转化的交易成本,但仅适合于研发 生产链条较为完善的主体。第二、第三种方式属于转移式转化,即科技成 果持有人通过许可、转让的方式将科技成果的使用权或所有权转移给技 术需求方,此方式是髙等院校、科研院所实现科技成果转化的主要方式。
第四、第五种方式属于合作转化方式,此方式有利于产、学、研单位以技术 为纽带形成利益共享、风险共担的合作机制。
② 数据分析为了挖掘更多的问题,并找到原因;③ 不能为了做数据分析而坐数据分析。
2、步骤:① 调查研究:收集、分析、挖掘数据② 图表分析:分析、挖掘的结果做成图表3、常用方法: 利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行挖掘。 ①分类。
分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。它可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等,如一个汽车零售商将客户按照对汽车的喜好划分成不同的类,这样营销人员就可以将新型汽车的广告手册直接邮寄到有这种喜好的客户手中,从而大大增加了商业机会。
②回归分析。回归分析方法反映的是事务数据库中属性值在时间上的特征,产生一个将数据项映射到一个实值预测变量的函数,发现变量或属性间的依赖关系,其主要研究问题包括数据序列的趋势特征、数据序列的预测以及数据间的相关关系等。
它可以应用到市场营销的各个方面,如客户寻求、保持和预防客户流失活动、产品生命周期分析、销售趋势预测及有针对性的促销活动等。 ③聚类。
聚类分析是把一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能小。它可以应用到客户群体的分类、客户背景分析、客户购买趋势预测、市场的细分等。
④关联规则。关联规则是描述数据库中数据项之间所存在的关系的规则,即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现,即隐藏在数据间的关联或相互关系。
在客户关系管理中,通过对企业的客户数据库里的大量数据进行挖掘,可以从大量的记录中发现有趣的关联关系,找出影响市场营销效果的关键因素,为产品定位、定价与定制客户群,客户寻求、细分与保持,市场营销与推销,营销风险评估和诈骗预测等决策支持提供参考依据。 ⑤特征。
特征分析是从数据库中的一组数据中提取出关于这些数据的特征式,这些特征式表达了该数据集的总体特征。如营销人员通过对客户流失因素的特征提取,可以得到导致客户流失的一系列原因和主要特征,利用这些特征可以有效地预防客户的流失。
⑥变化和偏差分析。偏差包括很大一类潜在有趣的知识,如分类中的反常实例,模式的例外,观察结果对期望的偏差等,其目的是寻找观察结果与参照量之间有意义的差别。
在企业危机管理及其预警中,管理者更感兴趣的是那些意外规则。意外规则的挖掘可以应用到各种异常信息的发现、分析、识别、评价和预警等方面。
⑦Web页挖掘。
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
蜀ICP备2020033479号-4 Copyright © 2016 学习鸟. 页面生成时间:2.990秒