最近生产环境,有两张普通表,由于检索性能的问题,需要转为分区表,而且是时间间隔interval分区,一张表2000万数据,一张表1.5亿数据,有俩方案,
方案1:在线重定义
方案2:新建分区表,用程序重新导入数据
由于这两张表对应的业务,属于技术投产,但库中存在业务投产的对象,因此建议我们使用方案2。
因为偶尔出现网络瞬断,导致程序和数据库网络断开,需要手工干预,所以导入操作持续了几小时,测试验证,业务操作,比之前有不小的提升,基本满足业务的需求。
针对这次变更,之前有些技术准备的工作,
《》
《》
《》
用程序写了夜维删除逻辑,使用如下SQL,定时执行,删除某月分区,
alter table a drop partition for (to_date(?,’yyyy-mm-dd’));
执行完成,发现一些DML操作,执行失败,提示错误,
ORA-01502: index ‘XX.PK_A’ or partition of such index is in unusable state
检索索引状态,果然主键索引,状态变为UNUSABLE,索引失效,所以无法执行DML的操作,
SQL select status, index_name, table_name from user_indexes where table_name='A'; STATUS INDEX_NAME TABLE_NAME -------- ------------------------ ------------------------- N/A IDX_A_01 A UNUSABLE PK_A A
对于分区删除,global索引会置为无效,要么重建索引,
alter index pk_t_a rebuild (online);
要么删除同时,使用update global indexes,更新global索引,
alter table a drop partition for (to_date(?,’yyyy-mm-dd’)) update global indexes;
1.5亿数据量,删除某一分区,加上update global indexes,执行时间几秒,基本满足要求。
注意上面user_indexes,有一条记录状态N/A,表示该索引是local,此时可以使用user_ind_partitions,检索local索引状态,
SQL select index_name, partition_name, status from user_ind_partitions; INDEX_NAME PARTITION_NAME STATUS --------------------- ------------------------------ --------------- IDX_A_01 P0 USABLE
千万级别以上的数据表,可以考虑分区表,但前提是要了解清楚,为什么要用分区,需求是什么样的,不是说用了分区,就一定会提升检索速度,一方面使用分区,可以便于对数据的管理,例如使用分区删除技术,可以快速删除历史数据,相比于用DELETE,效率会高不少,另一方面,如果业务上检索条件,可以带上分区键,就可以用上分区剪裁技术,会间接提升检索效率。但凡事要两面看,用了分区,例如执行了分区删除,表中global索引会失效,local索引不受影响,这就需要考虑如何补偿,若有检索条件,没有用上分区键,有可能需要跨分区检索,这和使用堆表相比较,就没什么优势可言了。因此任何技术,都有适用场景,合适的地方用合适的方法,这才是最重要的,才能体现出价值。
如果您觉得本文有帮助,欢迎关注转发:bisal的个人杂货铺,