首页 > 科技快讯 > 大数据分析领域有哪些分析模型?

大数据分析领域有哪些分析模型?

数据角度的模型一般指的是统计或数据挖掘、机器学习、人工智能等类型的模型,是纯粹从科学角度出发定义的。

1. 降维

在面对海量数据或大数据进行数据挖掘时,通常会面临“维度灾难”,原因是数据集的维度可以不断增加直至无穷多,但计算机的处理能力和速度却是有限的;另外,数据集的大量维度之间可能存在共线性的关系,这会直接导致学习模型的健壮性不够,甚至很多时候算法结果会失效。因此,我们需要降低维度数量并降低维度间共线性影响。

数据降维也被成为数据归约或数据约减,其目的是减少参与数据计算和建模维度的数量。数据降维的思路有两类:一类是基于特征选择的降维,一类是是基于维度转换的降维。

2. 回归

回归是研究自变量x对因变量y影响的一种数据分析方法。最简单的回归模型是一元线性回归(只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示),可以表示为Y=β0+β1x+ε,其中Y为因变量,x为自变量,β1为影响系数,β0为截距,ε为随机误差。

回归分析按照自变量的个数分为一元回归模型和多元回归模型;按照影响是否线性分为线性回归和非线性回归。

3. 聚类

聚类是数据挖掘和计算中的基本任务,聚类是将大量数据集中具有“相似”特征的数据点划分为统一类别,并最终生成多个类的方法。聚类分析的基本思想是“物以类聚、人以群分”,因此大量的数据集中必然存在相似的数据点,基于这个假设就可以将数据区分出来,并发现每个数据集(分类)的特征。

4. 分类

分类算法通过对已知类别训练集的计算和分析,从中发现类别规则,以此预测新数据的类别的一类算法。分类算法是解决分类问题的方法,是数据挖掘、机器学习和模式识别中一个重要的研究领域。

5. 关联

关联规则学习通过寻找最能够解释数据变量之间关系的规则,来找出大量多元数据集中有用的关联规则,它是从大量数据中发现多种数据之间关系的一种方法,另外,它还可以基于时间序列对多种数据间的关系进行挖掘。关联分析的典型案例是“啤酒和尿布”的捆绑销售,即买了尿布的用户还会一起买啤酒。

发布于:江西

相关推荐

大数据分析领域有哪些分析模型?
大数据分析和处理的方法
人民邮电出版社《大数据分析》
你应该知道的大数据分析前景
AI教你聊天?社交软件Mei针对聊天内容进行大数据分析
「观远数据」完成亿元级B轮融资,提供“BI+AI”商业智能大数据分析平台
世纪互联蓝云研究院新书《智能大数据分析新书》
专注于大数据分析和数字基建,「格蓝威驰」以金融量化科技切入资产管理领域
帮助企业构造消费者档案?意大利大数据分析平台「BigProfiles」完成160万美元融资
自研大数据分析技术,「安尔法」为采矿业打造智能运维系统

网址: 大数据分析领域有哪些分析模型? http://m.xishuta.com/newsview67878.html

所属分类:大数据分析