第8题:
问答题
数据仓库索引技术包括哪些内容?
正确答案:
1、位索引技术(Bit-wise)
位索引技术在存储数据的方式上与传统的关系数据库有所不同:它不是以"行纪录"而是以"列"为单位存储数据,即对数据进行垂直分割。对于每一个记录的字段满足查询条件的真假值用1或0的方式表示,或者用多位二进制表示。
2、标识技术
使用标准的数据库技术来存储数据仓库是十分昂贵的。较好的替代方法是用基于标识的技术来存储数据仓库。利用关系数据库技术,当加入一个记录到系统中时,会追加此数据的一个物理代表块到磁盘上。而标识技术则是将某一属性中可能会重复出现的几个值,分别用不同的标识(例如数字)替代,这样数据仓库中存储的将不是具体的文字,而是体积较小的标识。使用这种方法可以减少每一条目的大小,从而大大减少数据量。当然,这种技术需要一一记录每一个标识所对应的意义,因此,数据越多,表示数据就越比标准的、基于记录的数据有利。
3、广义索引
即根据用户需求,在从数据库导入数据时预先为查询频率可能较高的数据建立索引。广义索引在处理最大值和最小值的问题时,效果是十分明显的,也较易于实现。在从数据库环境抽取数据,并向数据仓库中装载的同时,就可以根据用户的需要建立许多这样的索引,这样就不用为了这些内容而搜索数据仓库。在引入新的数据库内容时需要更新广义索引。
4、R-树索引
R-树索引支持多维数据建立索引,是一种面向多维空间对象的索引结构,是一种利用β-树的某些本质特征来处理多维数据的索引结构。我们可以将被β树索引的关系看作一维向量,一个记录是向量中某一点上的值。R-树索引中存储的信息与β-树索引不同。R-树内部结点中的键值则是多维空间中的一个区域,因此不仅要存储行标识信息,同时要存储被索引对象的边界信息。R-树的每棵子树覆盖的区域都在该结点的区域内,叶子结点中的记录指向它的键值所覆盖的空间对象,如点、块等。
由于OLAP的多维性质,用R树为它建立索引成为了自然的选择。多维数组的组织方式之一——方体树就是R树在多位数据中的一个应用。
虽然直观上可以将OLAP数据看做是多维的,但是这种多维数据与多维空间对象有较大的差别。例如我们需要按各种维的组合、度量和维的组合查询多维数据,而考察空间对象时则常从所有的维出发而根据部分维进行查询的情况不多。因此根据所有的维建立的R-树索引可以较好地满足多维空间对象查询需要,而利用它为多维数据建立索引仍有较大的不足。
解析:
暂无解析