通过SQL 2008管理非结构化数据

通过SQL Server 2008管理非结构化数据

SQL Server 技术文档

作者:Graeme Malcolm (内容主管)

技术审核员:Shan Sinha

项目编辑:Joanne Hodgins

发布日期:2007年8月

适用产品:SQL Server 2008

概述:数字化信息的增长为企业应当存储和访问业务数据的方法提供了启发。数据库作为业务应用程序的核心,必须能够同非结构化的数据进行集成,其中包括文档、图像、视频、以及其它多媒体格式。为了能够对信息生命周期进行管理,满足策略需求,并实施内容管理解决方案,企业需要存储和管理所有格式的数字化数据。

Microsoft SQL Server 2008提供了一套灵活的解决方案,对非结构化数据进行存储并将其同关系型数据相结合,从而围绕企业中的全部数据来构建一套全面的解决方案。

版权

该白皮书为初步文档,可能会在所述软件进行最后商业发布之前做完全修改。

本文档所包含的信息代表了在发布之日,Microsoft Corporation(微软公司)对所讨论问题的当前看法。因为Microsoft必须顺应不断变化的市场条件,故不应将本文档理解为Microsoft一方的承诺,Microsoft不保证所给出的信息在发布之日以后的准确性。

本白皮书仅用于提供信息。Microsoft对本文档中的信息不做任何明示、默示或法定的担保。

遵守所有适用的版权法律是用户的责任。在不对版权法所规定的权利加以限制的情况下,未得到Microsoft Corporation明确的书面许可,不得为任何目的、以任何形式或手段(电子的、机械的、影印、录制等等)复制、传播本文的任何部分,也不得将其存储或引入到检索系统中。

本文档可能涉及Microsoft的专利、专利申请、商标、版权或其它知识产权。除非Microsoft通过书面许可协议明确提供,此文档并没有授予您对这些专利、商标、版权或其它知识产权的任何许可。

除非特别说明,此处所述作为范例的公司、组织、产品、域名、电子邮件地址、徽标、人员、地点和事件均为虚构,不与任何真实的公司、组织、产品、域名、电子邮件地址、徽标、人员、地点或事件有任何联系,也不应据此进行任何臆测或推断。

Ó 2007 Microsoft Corporation. 保留所有权利。

Microsoft, Excel, SQL Server, 以及Windows是Microsoft Corporation在美国和/或其它国家的注册商标或商标。

所有其它商标均是其各自所有者的财产。

目录

导言1

非结构化数据的商业动力1

非结构化数据面临的挑战1

存储非结构化数据的挑战2

使用非结构化数据的挑战2

在SQL Server 2008中的非结构化数据的目标2

在SQL Server 2008中存储非结构化数据2

SQL Server BLOB3

FILESTREAM 属性3

远程BLOB存储API3

比较BLOB的存储选择4

在SQL Server 2008中搜索非结构化数据4

集成全文搜索5

结论5

时间: 2024-12-02 23:14:19

通过SQL 2008管理非结构化数据的相关文章

非结构化数据——RAID模式已过时

一份来自Novell公司Ponemon研究所针对对美国94个大型企业的调查显示,平均每个公司每年花在非结构化数据处理上的成本为210万美元:而一些受到严格监管的行业,比如金融.制药.通讯和医疗行业的成本最高,每年将达到250万美元:另一个来自Unisphere Research的调查则显示,62%的受访者表示非结构化信息的产生是不可避免的,在未来十年内将超过传统数据.此外有35%的人表示,在未来的36个月里,非结构化的信息量将超过传统的关系数据. 据IDC的预测,现在全球数据量每18个月就要翻一

分析非结构化数据的10个步骤

如今,数据分析正在成为企业发展的重要组成部分.企业必须对结构化和非结构化数据有所了解,才能更好地为业务发展做出正确决策.以下是帮助企业分析非结构化数据的10个步骤: 1.确定一个数据源 了解有利于小型企业的数据来源非常重要.企业可以使用一个或多个数据源来收集与其业务相关的信息.而从随机数据源收集数据并不是一个好办法,因为这可能会破坏数据,甚至丢失一些数据.因此,建议企业在开始收集数据之前调查相关数据源.企业可以采用一些在线大数据开发工具收集数据. 2.管理非结构化数据搜索工具 收集到的结构化或非

企业如何有效管理非机构化数据

随着非机构化数据,如音频.视频和图片类的数据量呈爆炸式增长,需要存储的数据量更是成几何数字上涨.但是很多企业仍采用传统数据存储方案,通过扩展存储系统来满足其非结构内容的存储需求.其实,无论NAS还是SAN,在面对http://www.aliyun.com/zixun/aggregation/13739.html">非结构化数据时,都存在着很多局限性,最主要的因素是导致管理复杂,成本居高不下,存储性能也受到一定限制.对企业来说,如何有效管理非结构化数据是一个非常棘手的问题. Forreste

如何管理非结构化互动数据

本文讲的是如何管理非结构化互动数据,[IT168 资讯]非结构化数据仍在持续增长,而且增长势头似乎毫不减弱.事实证明,对这类数据制定政策和分级将是一项异常艰巨的工作.而且大部分人事后并没有回顾和分析哪些数据应保存在哪里,保存多久的时间以及如何保证它们的安全性.在当前这种紧缩时代,这项工作也很艰巨. 这些近似命令如何执行? 如果我们用互动的方式来管理数据,会怎么样?  互动数据管理会在你保存数据的同时给那些数据制定政策和赋予信息,无需使用专门的文档管理软件.正如我们在 <George Crump:

通过企业内容管理(ECM)利用大量非结构化数据

如今的企业无一不受信息泛滥的困扰,这已经不是什么秘密.我们被大量不断增长的数据包围.许多机构内的非结构化内容(从打印文档到社交媒体文章)在无节制的增长.对于许多机构而言,非结构化内容已经占到总体企业信息的 80% 或更高比例.在对纸张密集型流程挥之不去的依赖以及个人和共同使用的数字内容的混乱扩散的驱动下,此类内容不断增长. 好消息是,企业内的人员.设备和系统生成的每一则信息均可用作竞争优势.前瞻性企业已经意识到,用户与内容之间的成功互动在提高业务成果方面发挥着重要的作用.例如,在许多企业中,客户

一种分布式非结构化数据副本管理模型

一种分布式非结构化数据副本管理模型 林 菲,张万军,孙 勇 针对云存储系统中数据副本管理的延时响应等问题,提出一种面向非结构化数据的分布式副本管理模型.该模型采用机架选举算法,通过提高每个机架能源利用率的方法降低系统整体能耗,为绿色数据中心提供技术保障.运用多路线性散列算法,将数据副本动态均匀地分布到不同机架的不同节点中,以提高系统性能.平衡负载和资源利用率.仿真实验结果证明,与传统的全局映射法相比,该模型可以达到较高的存储与负载平衡,具有良好的扩展性和可用性. 关键词:分布式:非结构化:数据副

非结构化数据存储与管理

问题描述 非结构化数据该怎么存储与管理呀?在网上看到的使用数据库或者数据库+文件系统,这在hadoop和swift中是如何体现的呢? 解决方案

MaxCompute上如何处理非结构化数据

0. 前言 MaxCompute作为阿里云大数据平台的核心计算组件,拥有强大的计算能力,能够调度大量的节点做并行计算,同时对分布式计算中的failover,重试等均有一套行之有效的处理管理机制. 而MaxCompute SQL能在简明的语义上实现各种数据处理逻辑,在集团内外更是广为应用,在其上实现与各种数据源的互通,对于打通整个阿里云的数据生态具有重要意义.基于这一点,最近MaxCompute团队依托MaxCompute2.0系统架构,引入了非结构化数据处理框架:通过外部表,为各种数据在MaxC

MaxCompute与OSS非结构化数据读写互通(及图像处理实例)

0. 前言 MaxCompute作为阿里巴巴集团内部绝大多数大数据处理需求的核心计算组件,拥有强大的计算能力,随着集团内外大数据业务的不断扩展,新的数据使用场景也在不断产生.在这样的背景下,MaxCompute(ODPS)计算框架持续演化,而原来主要面对内部特殊格式数据的强大计算能力,也正在一步步的通过新增的非结构化数据处理框架,开放给不同的外部数据. 我们相信阿里巴巴集团的这种需求,也代表着业界大数据领域的最前沿实践和走向,具有相当的普适性.在之前我们已经对MaxCompute 2.0新增的非