数据仓库建模联机分析处理应用步骤详解 - AdventureWorksDW2012案例
(1) 导入数据库AdventureWorksDW2012。
使用SQL Server Management Studio导入数据库AdventureWorksDW2012。
(2) 新建数据分析项目。
打开SQL Server Data Tools,选择新建项目,选择'分析服务'模板,输入项目名称,点击'确定'。
(3) 新建数据源,连接数据库Adventure Works。
在'解决方案资源管理器'中,右键单击'数据源'文件夹,选择'新建数据源',选择'Microsoft SQL Server Analysis Services',输入服务器名称,选择'Adventure Works'数据库,点击'测试连接',确认连接成功,点击'确定'。
(4) 建立数据源视图,事实表为FactInternetSales,维表为DimCustomer、DimProduct、DimDate、DimGeography。
在'解决方案资源管理器'中,右键单击'数据源视图'文件夹,选择'新建数据源视图',选择'Adventure Works'数据源,选择'FactInternetSales'表和四个维表,点击'添加到视图'按钮,点击'确定'。
(5) 建立多维数据集。
在'解决方案资源管理器'中,右键单击'多维数据集'文件夹,选择'新建多维数据集',选择'Adventure Works'数据源,选择事实表'FactInternetSales',选择需要的度量和维度,点击'确定'。
(6) 创建相应的维度信息。
在'解决方案资源管理器'中,右键单击'维度'文件夹,选择'新建维度',选择'从数据源视图创建维度',选择需要的表和字段,点击'确定'。
(7) 多维数据集应用所创建的维度。
在多维数据集的'维度'选项卡中,选择需要应用的维度,拖拽到'行'或'列'区域中。
(8) 部署项目。
在'生成'菜单中,选择'部署 Adventure Works'选项。
(9) 数据仓库建模联机分析处理应用。 ① 由事实表FactInternetSales及维表DimCustomer、DimProduct、DimDate、DimGeography构成的模型叫什么模型?截图显示该模型。
该模型叫做星型模型。
截图如下:

② California, Florida, New South Wales, New York四个地区(维度:DimGeography -State Province Name);第三季度(在维度DimDate上选择Calendar Quarter);产品(维度DimProduct-Model Name ) Water Bottle的销售额。
使用多维数据集,将'State Province Name'、'Calendar Quarter'、'Model Name'三个维度拖拽到'行'区域,将'Sales Amount'度量拖拽到'值'区域,选择'California'、'Florida'、'New South Wales'、'New York'四个地区,选择'Q3'季度,选择'Water Bottle'产品,得到销售额如下:

③ 有住房的客户(维度DimCustomer-House Owner Flag为1)在2005及2006年(维度DimDate- Calendar Year)购买层次(维度DimProduct-Class)为中档(M)的产品的销售额。
使用多维数据集,将'House Owner Flag'、'Calendar Year'、'Class'三个维度拖拽到'行'区域,将'Sales Amount'度量拖拽到'值'区域,选择'House Owner Flag'为1,选择'2005'和'2006'年,选择'M'级别,得到销售额如下:

④ 同时显示Water Bottle在不同年度(Calendar Year)的销售数据。
使用多维数据集,将'Calendar Year'、'Model Name'两个维度拖拽到'行'区域,将'Sales Amount'度量拖拽到'值'区域,选择'Water Bottle'产品,得到销售额如下:

⑤ 同时显示2007年度不同月份(维度DimDate-English Month Name)Water Bottle的销售总额。
使用多维数据集,将'English Month Name'、'Model Name'两个维度拖拽到'行'区域,将'Sales Amount'度量拖拽到'值'区域,选择'2007'年,选择'Water Bottle'产品,得到销售额如下:

⑥ 同时显示2006年各种(Model name)商品的销售总额。
使用多维数据集,将'Model Name'维度拖拽到'行'区域,将'Sales Amount'度量拖拽到'值'区域,选择'2006'年,得到销售额如下:

⑦ 请分析顾客性别(维度DimCustomer-gender)与顾客所购买商品颜色(维度DimProduct-color)之间有什么样的关系。
使用数据挖掘工具,选择关联规则算法,将'gender'和'color'两个属性作为输入列,设置最小支持度和最小置信度,得到关联规则如下:

可以看到,女性顾客更倾向于购买黑色、白色和银色商品,而男性顾客更倾向于购买蓝色、红色、黄色和灰色商品。
⑧ 请分析顾客婚姻状况(维度DimCustomer-Marital Status)与所购买商品等级(class)之间,学历(维度DimCustomer-English Education)与所购买商品等级(class)之间的关联关系。
使用数据挖掘工具,选择决策树算法,将'Marital Status'和'English Education'两个属性作为输入列,将'Class'属性作为目标列,得到决策树如下:

可以看到,婚姻状况和学历对商品等级的影响比较复杂,需要进一步分析和挖掘。
原文地址: https://www.cveoy.top/t/topic/oE3n 著作权归作者所有。请勿转载和采集!