BI学习笔记(一)——创建SSAS项目

来源:本站原创 BI学习 超过20 views围观 0条评论

数据挖掘

 

数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于Association rule learning)的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

 

Microsoft SQL Server Analysis Services 包含创建复杂数据挖掘解决方案所需的如下功能和工具。

  • 一组行业标准数据挖掘算法。
  • 数据挖掘设计器,可用于创建、管理和浏览数据挖掘模型,并在随后使用这些模型创建预测。
  • 数据挖掘扩展插件 (DMX) 语言,可用于管理挖掘模型和创建复杂的预测查询。

可以组合使用这些功能和工具,以发现数据中存在的趋势和模式,然后使用这些趋势和模式对业务难题作出明智决策。

 

创建SSAS项目

 

环境约定:SQL Server 2005

示例库:Adventure Works DW

一、新建Analysis Services 项目

安装SQL Server2005会安装创建Analysis Services 项目的Visual Studio 2005 shell,打开程序新建商业智能项目,选择Analysis Services 项目:

创建Analysis Services 项目

 

二、项目组成

项目组成

数据源:主要是数据源,也就是我们使用了哪些数据库作为仓储数据库。我连接的是CubeTest.

 

数据源视图:从数据源里,使用的哪些表或视图。我这个库中没有什么表,把全部表全部导入。

 

多维数据集:即数据立方体Cube。

CUBE

多维立方体

在BI(Business Intelligence,业务智能)领域,CUBE是多维立方体的简称,主要用于支持联机分析应用(OLAP),为企业决策提供支持。Cube就象一个坐标系,每一个Dimension代表一个坐标轴,要想得到一个点,就必须在每一个坐标轴上取的一个值,而这个点就是Cube中的Cell。

维度:即Dimension。每个Cube依赖哪些维度来做统计,就需要在这里创建维度。在创建立方体的时候会帮助我们自动创建维度,但是有时候自动创建的维度并不能达到实际需要的要求,所以我们可以先建Dimension,再创建Cube。

 

挖掘结构:数据挖掘所需要的东东,SQL Server本身的数据挖掘技术有:

  • 决策树
  • 关联规则
  • 聚类分析
  • 逻辑回归
  • 神经网络
  • 时序
  • 顺序分析和聚类分析
  • 线性回归

 

分享到:

版权信息:原创文章:San 忆直的阳子
本文链接:http://www.yzcore.com/?p=57转载请注明转自San 忆直的阳子
如果喜欢:点此订阅本站