浅谈数据仓库技术
摘要:数据仓库的英文名称为DataWarehouse,简写DW。从数据仓库的概念上我们可以从两个方面理解,一方面,数据仓库是用来支持决策的,主要面向分析型数据处理,这一点有别于企业现有的操作型数据库。
(资料图片)
关键词:数据库,数据仓库,数据处理
1.数据仓库的定义
数据仓库的英文名称为Data Warehouse,简写DW。W.H.Inmon。我们把它的定义为:数据仓库是一个数据 集合,它的特点是:用于支持管理决策时它是面向主题的,集成的,相对稳定的,能够反映历史变化的。从数据仓库的概念上我们可以从两个方面理解,一方面,数据仓库是用来支持决策的,主要面向分析 型数据处理,这一点有别于企业现有的操作型数据库;另一方面,数据仓库对多个异构的数据源进行有效集成,在集成后又按照主题重新进行了组合,并且包含历史数据,尽管如此,却一般不再修改其存放在数据仓库里的数据。
2.数据仓库的特点
(1)面向主题。操作型数据库的数据组织面向事务处理任务,各个业务系统
之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织,一个主题通常与多个操作型信息系统相关。。
(2)集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数
据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须保证数据仓库内的信息是关于整个企业的一致的全局信息。
(3)相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时
发生变化。数据仓库的数据主要供企业决策分析只用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库之后,一般情况下将被长期保留,修改和删除操作很少,通常只需要定期的加载、刷新。。
(4)反映历史变化。操作型数据库主要关心当前某一个时间段内的数据,而
数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点到目前的各个阶段的信息,以对企业的发展历程和未来趋势做出定量分析和预测。
3.数据仓库的结构
如上图所示,整个数据仓库系统包含五个层次:
(1)数据源层。是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。。
(2)数据导入层。是数据在进入数据仓库前的一个临时存放区,通过数据调度工具将业务系统传送过来的数据表、文本文件等加载到临时存放区。
(3)数据服务层。是整个数据仓库系统的核心。针对现有各业务系统的数据,进行抽取、清理,并有效集成,按照主题进行组织。数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库(通常称为数据集市)。
(4)应用服务层。应用服务层的功能主要是建立多维数据集、进行OLAP分析、生成各种静态报表并以WEB方式提供各种功能的查询分析。
(5)用户层。根据对数据仓库需求的不同,数据仓库的用户可以分为普通用户、技术用户、高级管理用户这三类。不同用户对数据仓库访问的需求层次以及复杂度都是不同的,简单的需求是访问一些固定的静态报表和查询分析,复杂的可以通过前端展现的工具生产一些灵活、动态的即席查询报表,以满足业务部门一些临时的、迫切的报表需求。
4.相关的网站和论坛:
(1)数据仓库之路
(2)致力于打造最专业的中文数据仓库,商务智能社区
(3)商业智能和数据仓库爱好者
(4)数据挖掘研究院
5.研究和商业机构
(1) 北京大学移动通信数据仓库联合实验室
2006年5月由中国移动、北京大学、亚信集团联合建立,该实验室”是全球容量最大的数据仓库分析系统实验室,也有效的整合了三方得优势资源。中国移动通信目前构建了目前国际上最大的数据仓库系统,联合实验室的建立,既能推动中国移动自身数据仓库系统建设,也能明显推动数据仓库技术向纵深发展。
(2)中国人民大学数据仓库和商务智能实验室
2004年5月由中国人民大学和全球著名的数据仓库厂商NCRTeradata联合建立。该实验室承担了国家863计划、国家自然科学基金重点项目、教育部重点项目等国家重大科研任务。借助于NCRTeradata的优势技术,双方将通过密切的合作,共同开发具有中国行业特色的数据仓库和商务智能应用软件。
(3)北京汉端科技有限公司
北京汉端公司是一家专门从事商业智能信息化服务的企业,从1996年就开始专业做数据仓库,它在数据仓库领域是相当专业的,在这可以接触到最前沿的数据仓库技术。
(4)上证所金融创新实验室
2006由上海证券交易所成立,该实验室的数据全部来源于数据仓库系统。 上证所在推出金融新产品时,都曾通过数据仓库平台进行过测算和验证。通过实时数据仓库技术,为上证所的经营、监管、创新和服务决策提供数据支持,极大的提高了监管的效率和服务的性能,能够更好地服务市场和监管市场。
参考文献:
1伍小荣 伍庆华 数据仓库技术的研究现状和未来方向 [期刊论文] 现代电子技术2002(6)
2.向海华 数据库技术发展综述[期刊论文] 现代情报 2003(12)
3.王泽明浅谈数据仓库技术 [期刊论文] 计算机应用与软件2001-01-15
4.黄庆普 剖析数据仓库技术 [期刊论文] 华南金融电脑2003年11期
5.刘立波 数据仓库技术的研究与应用[期刊论文] 计算机工程与应用2002(15)
看了“万方数据库学术论文”的人还看:
1.北大保研文学学术论文
2.文献检索学习心得体会
3.浅谈中国古代教育思想论文
4.meta分析论文写作
5.大学生如何利用图书馆论文
Copyright © 2015-2022 人人创投网版权所有 备案号:粤ICP备18023326号-36 联系邮箱:8557298@qq.com