藏书吧 通过搜索各大小说站为您自动抓取各类小说的最快更新供您阅读!
藏书吧 >  离语 >   第288章 粽子!

数据仓库是一个面向主题的集成的相

对稳定的反映历史变化的数据集合Y用于支持管理决策

面向主题

2集成

3相对稳定

4反映历史变化

数据库是面向事务的设计Y数据仓库是面向主题设计的数据库

一般存储在线交易数据Y数据仓库存储的一般是历史数据数据

库是为捕获数据而设计Y数据仓库是为分析数据而设计的。

一个典型的数据仓库系统通常包含数据源数据存储和管理

oLAp服务器前端工具和应用等四个部分。

数据源x是数据仓库的基础系统的数据来源Y包含企业的各种内部数

据和外部数据内部数据包括存在于oLtp系统中的各种业务数据和办

公自动化系统中的各类文档数据外部数据包括各类法律法规市场信

息竞争对手信息及各类外部统计数据和其他相关文档等。

数据存储和管理x是数据仓库系统的核心是指在各业务系统基础上周

期性地对数据进行抽取按照主题进行重新组织Y最终确定数据仓库的物理存储结构Y同

时存储数据仓库的各种元数据?数据字典记录系统定义数据转换规

则数据加载频率及业务规则等?对数据仓库系统的管理Y就是对相

应数据库系统的管理Y通常包括数据的安全归档备份维护和恢复

等工作。

oLAp服务器x联机分析处理服务器将需要分析的数据按照多维数据模

型进行重组Y以支持用户随时多角度多层次进行数据分析Y发现数据

规律与趋势

前端工具和应用x数据查询工具自由报表工具数据分析工具数据

挖掘工具和各类应用系统。

实时主动数据仓库是一个集成的信息存储仓库Y既具备批量和周期性的数据

加载能力?采用EtL技术?Y也具备数据变化的实时探测传播和加载能力

?采用cdc技术?Y并能结合历史数据和新颖数据实现查询分析和自动规则

触发Y从而提供对战略决策和战术决策的双重支持。

数据整合。

不同数据源的数据被物理地集成到数据目标

利用EtL工具把数据源中的数据批量地加载到数据仓库就属于数据整

合。

数据联邦。

在多个数据源的基础上建立统一的逻辑视图Y对外界应用屏蔽数据

在各个数据源的分布细节

对应用而言Y只有一个数据访问入口Y但事实是被请求的数据只是

逻辑上的集中Y物理上仍然分布在各个数据源中

只有收到请求时Y数据仓库才临时从不同数据源获取相关数据Y进

行集成后提交给数据请求者。

数据传播。

数据在多个应用之间传播

在企业应用集成解决

方案中Y不同应用之间可以通过传播消息进行交互

4混合方式

对那些不同应用都使用的数据采用数据整合的方式进行集成Y而对

那些只有特定应用才使用的数据则采用数据联邦方式进行集成。

有多种技术可以为实时主动数据仓库提供数据集成服务Y比如脚本EtL

EAI和cdc但是Y只有部分技术能提供实时(连续)的数据集成x

?

1?脚本脚本是数据集成的一种快速解决方案Y其优点是Y使用灵活且比

较经济Y很容易着手开发和进行修改Y几乎任何操作系统和绝大部分dbmS都

可以使用脚本但是Y使用脚本也有很多问题Y比如Y耗费开发者的时间和

精力Y不好管理和操作Y以及不能满足服务水平协议?

等等。

有多种技术可以为实时主动数据仓库提供数据集成服务Y比如脚本EtL

EAI和cdc但是Y只有部分技术能提供实时(连续)的数据集成x

?

2?EtLEtL是实现大规模数据初步加载的理想解决方案Y它提供了高级

的转换能力EtL任务通常都是在 维护时间窗口进行Y在EtL任务执行期间Y

数据源默认不会发生变化Y这就使得用户不必担忧EtL任务开销对数据源的影

响Y但同时也意味着Y对于商务用户而言Y数据和应用并非任何时候都是可

用的。

有多种技术可以为实时主动数据仓库提供数据集成服务Y比如脚本EtL

EAI和cdc但是Y只有部分技术能提供实时(连续)的数据集成x

?

3?EAIEAI解决方案通常和EtL解决方案并存Y从而增强EtL的功能EAI

解决方案在源系统和目标系统之间进行连续的数据分发Y并且保证数据的成

功分发Y同时提供高级的工作流支持和基本的数据转换但是YEAI受到数据

量的限制Y因为EAI的初衷是为了实现应用的集成而不是数据的集成Y即它是

用来调用应用或者分发命令和消息的然而Y由于EAI具有在数据集成过程中

实时分发数据和维护数据一致性的特性Y所以也就能够提供实时数据获取的

能力Y而这种能力正是实时主动数据仓库所需要的。

有多种技术可以为实时主动数据仓库提供数据集成服务Y比如脚本EtL

EAI和cdc但是Y只有部分技术能提供实时(连续)的提供了连续变化数据的捕捉和分

发能力Y并且只需要很低的开销和时间延迟cdc在提交的数据事务上进行

操作Y从oLtp系统中捕获变化的数据Y再进行基本的转换Y最后把数据发送

到数据仓库中虽然在体系结构上Ycdc属于异步的Y但它表现出类似同步

的行为Y数据延迟只有不到1秒的时间Y同时能够维护数据事务的一致性。

EtL是将业务系统的数据经过抽取?

Extract?清洗转换?

transform?

之后加载?

Load?到数据仓库的过程Y目的是将企业中的分散零乱

标准不统一的数据整合到一起Y为企业的决策提供分析依据

EtL是指从原系统中抽取数据Y并根据实际商务需求对数据进行转换Y然

后把转换结果加载到目标数据存储结构中源和目标通常都是数据库和文

件Y也可以是消息队列等。

数据抽取

可以采用周期性的pull机制或者事件驱动的push机制

pull机制支持数据整合Y通常以批处理的方式工作

push机制通常采用在线方式工作Y可以把数据变化传播到目标数据存储

结构。

数据转换

包括数据重构和整合数据内容清洗或集成

数据加载

对整个目标数据存储结构进行刷新Y或者只是对目标数据存储进行增量更

新。

早期的EtL解决方案通常以固定的周期运行批处理工作Y从平面文件和

关系数据库中捕捉数据Y并把这些数据整合到数据仓库中最近这几年Y

商业EtL工具供应商已经对产品做了很大的改进Y对产品功能进行了扩

展Y具体如下x

1额外的数据源

2额外的目标

3改进的数据转换功能

4更好的管理

5更好的性能

6改进的可用性

7增强的安全性

8支持基于数据联邦的数据集成方法

数据抽取模块的功能x

1确定数据源Y即从哪些源系统进行数据抽取。

2定义数据接口Y对每个源文件及系统的每个字段进行详细说明。

3确定数据抽取的方式x是主动抽取还是由源系统推送Y是增量抽取。

还是全量抽取Y是每日抽取还是每月抽取。

数据清洗与切换

数据清洗与转换x

数据清洗主要是对不完整数据错误数据重复数据进行处理

数据转换包括如下操作

藏书吧推荐阅读:极乐合欢功盗墓:当吴小佛爷开始玩养成重生后娘娘宠冠后宫让你援助抗战,你成列强了?我捡来的小奶狗竟然是顶头上司恶性相依穿书救闺蜜,病娇夫君天天争宠如不成魔,怎去成仙蚕神商贾之女咋啦?小小世子照样拿捏反派弟子全舔狗?摆烂师尊浪浪浪综漫:无敌从加入轮回空间开始貌美继室摆烂后,禁欲权臣他慌了寻回的璀璨人生穿书七十年代:开局多一个老公王妃葬身火海,渣男王爷哭疯了时来允转梦境里我为主宰我有位面快穿系统,反手上交国家快穿之宠妃上位记武力值爆表!清冷美人是满级大佬被卖后,她只想苟在一亩三分地上穿越从一拳开始快穿:手撕渣男主,被男配宠上天闺蜜双穿!我们真的只是朋友!明天的明天是今天逃荒:有粮有钱心不慌奥特,我贝利亚只想咸鱼重生之不被书写的人生霍格沃茨的冒牌巫师校花曝光我在殡仪馆抓鬼现场四合院:万倍经验暴击,众禽慌了傲剑狂魔末世重生,开局打造顶级安全屋抗战:鬼子太太不想丈夫丢工作0幻梦0影踪0行异界大小姐重生,通通闪开!网王:从签到开始的网球传奇快穿带娃:开局精神控制躺赢末世快穿:苦逼钓鱼佬在年代文还债我靠捉鬼发家致富跟男主的病弱小叔互换身体后70闪婚军官后,国家给我做靠山一本随记本民俗诡事簿炮灰不走剧情,主角死活随便穿越农家种田遇上王爷美丽的圌山传穿成兽世娇雌,大佬们每天都在修罗场灵异悬疑小说集
藏书吧搜藏榜:野玫瑰欲又撩,太子爷失控诱捕我爹哪去了菟丝绕红缨玄学直播捉鬼忙,看看今晚谁塌房两只虫崽在垃圾星的日常生活乖乖的,不许逃没错,我的卡牌是辛弃疾怎么了我一个小刑警,你让我当鬼差帝少动情,顾大小姐三年抱俩离婚后她空降热搜末世:探寻龙头脉无限:开局成为海虎之弟南宫轩与上官洛儿倾城之恋爷,您夫人又管不住了月华倾心遮天之阴阳道以前上班的不成功日记人在斗罗,开局觉醒时间零美女天才中医与黏人总裁综穿:捣乱从甄嬛传开始恋综爆火后,哥哥他坐不住了海贼里的龙珠模拟器平安修行记蚀骨情深,顾总他上头了四合院:精神病面前禽兽算个球斗罗:佛道双魂,我玩转诸天横空出世的娇帝君火葬场女工日记骑行异事重生端木,我不吃牛肉我,赤犬大将,开局轰杀逃兵王废物公子神豪富婆,这点小钱洒洒水啦姐弟恋:好想和你一起长大女孩子会喜欢逗比的吧?不是吗?唉!又是一天把亲爹气的直跺脚!时不时吐血的我在柯南身边怎么活锦鲤四岁半捡的妹妹超旺家七零军婚:重生后被兵哥哥盯上了如意茶馆叶罗丽之重生归来,我依旧爱你当我在火影成为空律洪荒:我袁洪一心求稳,人间清醒带着抽卡系统穿综漫完了!订婚前夜禁欲战神闯我闺房女配给大反派生孩子后,男主疯了最后的任务,许我为妻我重生成为了曙光圣者崩坏:成为梅比乌斯的妹妹明月揽星辰
藏书吧最新小说:诸天:小玉你还小,别追了被害投湖,嫡女归来怒掀渣男龙椅叶老师又娇又撩,科技大佬婚后夜夜求名分太古无双神尊四合院谁都不要和我抢养老被甩后,我医武双绝,你求复合做什么?灵武苍天重生假少爷,从打猎带妻女发家开始穿成农家秀才的作精娘子修己心:如何做这个世界的旁观者小夫人会玄学,携崽炸翻豪门重生1993:我权势滔天废柴美女修仙记老婆打遍诸天万界,我无敌了噶我腰子?我靠氪金电子女友杀穿缅北互换婚书你提的,朕登九五你哭啥?王爷不近女色,我却孕吐三年新美人鱼传说娇软雌性万人迷,兽世老公宠宠宠民国奇探之路垚是我嫂子惯坏她茅山嘉乐之除魔卫道我对疯批男主手拿把掐那些年穿到七年后,和死对头结婚生崽了来世之后的复仇不装了!神医归来,前妻哭着求复合三岁福宝有空间,全家一起宠翻天和亲归来后,全城为我哭坟不许我摆烂,那我就杀穿崩铁:云骑小姐与普通的我魂穿孤女后,夫君成都督豆角和豆包致命偏宠,顾少步步诱哄首长你的洋媳妇儿来了,签收一下成婚当日我改嫁未来权臣!悦己者极乐永恒天老李沟的故事病弱美人靠着与摄政王亲嘴续命装娇弱扮深情,清冷权臣拿命宠规则:开局出现在神秘列车让你下山娶妻,你却无敌天下惊!嗜血将军夜夜在我怀里装乖巧最牛重生,人生回档在牙牙学语四合院:开局植物人,送大爷进局重生后,皇帝为我痛哭流涕禁欲霸总的契约婚姻叶小子修仙记三年不回,我穿七零退亲你又追来穿越红楼之寡妇李纨