微软数据挖掘开发:模型的验证与展示

验证数据挖掘模型

通常情况下,针对某个特定案例,我们不能准确定 位哪个挖掘算法是最准确的,所以我们会在一个挖掘结构中定义多个挖掘模型;通 过对多个挖掘模型的验证,得出最准确的那个。

DMX(Data Mining Extension)

DMX是用来从数据挖掘模型中查询数据的语言,看起来和SQL很 相似,不过这种语言学习起来很不容易(目前国内还买不到任何关于DMX的学习资 料),可能微软也意识到DMX写起来很困难推出了很多编写DMX的模板,主要针对 Model Content,Model Management,Prediction Queries 和Structure Content, 依据下图读者可以到SQL Server Mangement Studio中感受DMX。

开发:模型的验证与展示-">

从编程的角度来说,Prediction Queries 应该使用最多的,分享一下我自己 在写Prediction Queries的一些经验。 微软商业智能平台,SQL Server Reporting Services 是主要的报表展示平台,我们可以利用SSRS 里面提供的一 些UI界面帮助我们更好的编写DMX。现在我们需要查询哪些客户可能会买自行车, 可能购买的百分比是多少。关于怎么使用SSRS常见报表是属于这部分的内容,因 此这里直接进入 查询编辑器,如下图:

我们在选择了Case table之后,挖掘模型中的列会和 case table中的列自动关联起来,之后我们可以通过简单的拖拽,将需要显示的 Mining Model Columns 或者Case Table Columns 拖到下面的Matrix中,这个时 候我们点击按钮(Switch DMX code and UI)可以切换到DMX的代码界面。目前我就 得到了一个标准DMX Prediction Query,

SELECT
t.FirstName, t.LastName,
(Predict ([Bike Buyer])) as [PredictedValue],
(PredictProbability([Bike Buyer])) as [Probability]
From
[TM Decision Tree]
PREDICTION JOIN
OPENQUERY([Adventure Works DW],
'SELECT
[FirstName],
[LastName],
[CustomerKey],
[MaritalStatus],
[Gender],
[YearlyIncome],
[TotalChildren],
[NumberChildrenAtHome],
[HouseOwnerFlag],
[NumberCarsOwned],
[CommuteDistance]
FROM
[dbo].[DimCustomer]
') AS t
ON
[TM Decision Tree].[Marital Status] = t.[MaritalStatus] AND
[TM Decision Tree].[Gender] = t.[Gender] AND
[TM Decision Tree].[Yearly Income] = t.[YearlyIncome] AND
[TM Decision Tree].[Total Children] = t.[TotalChildren] AND
[TM Decision Tree].[Number Children At Home] = t.[NumberChildrenAtHome] 

AND
[TM Decision Tree].[House Owner Flag] = t.[HouseOwnerFlag] AND
[TM Decision Tree].[Number Cars Owned] = t.[NumberCarsOwned] AND
[TM Decision Tree].[Commute Distance] = t.[CommuteDistance]

在 上面代码的基础上,我们可以编辑,如我们需要利用输入参数控制显示数据;定义 参数@Buyer ,@Possible,这个时候我们可以通过添加一些简单的WHERE 条件即可 完成,如:

WHERE
  (Predict ([Bike Buyer]))=@Buyer AND
  PredictProbability([Bike Buyer]) > @Possible

当然通过改 变PREDICTION JOIN,我们也可以去掉一些对Predictable column 影响不大的 attributes。

是不是感觉比从零开始写起DMX容易了很多?

挖掘结 果展示

上面提到SQL Server Reporting Services 是微软商业智能平台首 选报表展示平台,但是并不意味我们必须使用它来展示报表,我们也可以利用 asp.net(C#/VB.net + ADOMD.net + DMX ),甚至是Excel(SQL Server 2005/2008 插件) 连接数据挖掘模型所在的SQL Server实例进行挖掘结果的展示。

以上是小编为您精心准备的的内容,在的博客、问答、公众号、人物、课程等栏目也有的相关内容,欢迎继续使用右上角搜索按钮进行搜索报表
, 微软
, 数据挖掘
, 模型
tree
,以便于您获取更多的相关知识。

时间: 2022-12-25

微软数据挖掘开发:模型的验证与展示的相关文章

C# web 开发 MVC 模型数据验证 必填项

问题描述 C# web 开发 MVC 模型数据验证 必填项 问题是: 在开发网站的时候.有一个页面是增加产品和编辑产品共用. 为了在编辑的时候.方便ID的获取.在页面上添加隐藏的绑定模型的控件. 在后台数据验证端.该字段并没有设置必填.而前台页面却提示必填.导致没法进行. input class="input-validation-error" data-val="true" data-val-number="字段 PlaProductId 必须是一个数字

软件工程中的开发模型

软件工程的开发模型:(自学材料总结) 1.瀑布模型,该模型是以文档作为驱动,一级一级的进行的开发,每一个阶段完成都会有一个文档产生,根据该文档在进行下一个阶段的开发,在开发过程中,用户看不见系统式什么样,只有开发完成的时候,系统才会整体提交. 优点:适合于功能和性能明确.完整.无重大变化的软件开发.大部分系统软件具有这些特性.   缺点:缺乏对付变化(这里的变化既有客户需求的变化,也有开发时技术的变化)的机制,使得开发完成后对软件升级维护带来较大的困难.缺乏灵活性,无法解决需求不明确模糊这样的问

九月份精彩网络讲座让您深入了解微软最新开发技术

网络|微软 最新开发技术发布日期: 8/19/2004 | 更新日期: 8/19/2004ASP.NET系列讲座让您深入接触Web应用开发 SharePoint Portal 开发讲座给您揭秘门户开发秘籍 深入浅出的讲解如何构建Windows Server 2003应用 请按以下步骤参加讲座: 第一步:获得账号.用此账号您可以参加微软在线的任何讲座.(已经注册账号的用户请进入第二步).请提供真实注册信息,以便我们会有赠品.资料等邮寄给大家.提交注册信息后,您即会收到注册确认邮件.如果注册信息经核

【软考点点】软件开发模型

    软件开发模型是软考上午题中必考的一个知识点.给出一定的条件,让我们判断属于哪一种开发模型.     典型的软件过程模型有瀑布模型.增量模型.演化模型(原型模型.螺旋模型).喷泉模型.基于构件的开发模型和形式化方法模型.下面我们一一来看看: --------------------------------------知识点积累------------------------------------------    [瀑布模型]     1.定义:将软件生存周期中的各个活动规定为依线性顺序

《BI那点儿事》数据挖掘各类算法——准确性验证

原文:<BI那点儿事>数据挖掘各类算法--准确性验证 准确性验证示例1:--基于三国志11数据库 数据准备: 挖掘模型:依次为:Naive Bayes 算法.聚类分析算法.决策树算法.神经网络算法.逻辑回归算法.关联算法提升图: 依次排名为: 1. 神经网络算法(92.69% 0.99)2. 逻辑回归算法(92.39% 0.99)3. 决策树算法(91.19% 0.98)4. 关联算法(90.60% 0.98)5. 聚类分析算法(89.25% 0.96)6. Naive Bayes 算法(87

微软的开发革命:从桌面到云计算

个人电脑的统治时代业已结束,敢于尝鲜的用户已经能通过网络,免费获得诸如谷歌的企业级在线应用服务,微软因此备感压力.特别在经济不景气时期,用户自然会衡量这些选择的优劣,使微软不得不对过去"购买许可"的传统商业模式进行反思. 按照"软件+服务"的战略,微软于2008年11月发布了云计算平台WindowsAzure,这个平台与遍布世界各地的巨型数据中心和网络一起构成全球化的平台基础.微软的客户.合作伙伴以及广大开发人员可以按照"随用随付费"的方式,在A

今天微软的开发平台到底是什么样子的?

尽管现在的"微软平台"的含义已经与往日大相径庭,但微软在纽约举办Connect 2016大会为开发人员制定了针对其平台的计划. 今天的口号是"任何开发人员,任何应用程序,任何平台",而几年前的主题是"Windows无处不在". Connect大会属于微软的开发人员部门,与由Windows部门举办的Build活动不同.因此,大会上的主题演讲也不那么关注Windows操作系统的开发. 微软同Windows的关系变得复杂.一方面,它有一个Windows

微软全球开发大会BUILD 2012今秋举行

微软全球开发大会2012开幕之前微软通过MWC 2012阐述了关于下一代视窗操作系统的一些 雏形,并且公开展示了Windows 8的消费者预览版.最近微软确认了会在10月26日发布Windows 8零售版.另外,本年度最大的开发者大会BUILD 2012将于十月底在微软总部园区举行.会议从10月30日延续到11月2日.微软希望能够借着Windows8发布的人气.按照计划,微软将会在10月26日正式对外发行新版操作系统Windows8.全球开发者将在这次大会上向微软提出有关Windows8开发的种

基于UML柔性开发模型之Java设计

一. 面向对象技术与UML语言 与传统的结构化软件开发技术不同,面向对象技术提出了对象的封装.继承.多态性.对象的覆盖等方法,而传统的程序表示方法(如:框图.NS图等),无法对面向对象这些新的特性加以描述表达.因此,面向对象技术的表达.面向对象技术的方法论也是面形对象技术必不可少的研究内容之一. 面向对象方法论从1986年Booch率先提出后,至今已有50种以上的方法论出现,常见的有Rumbaugh的对象模型技术OMT.Booch以及Yourdon的面向对象分析与设计(OOA/OOD).Jaco