志当存高远,功到自然成!

少年强则中国强,少年进步则中国进步!

BlogJava 首页 新随笔 联系 聚合 管理
  53 Posts :: 2 Stories :: 2 Comments :: 0 Trackbacks

首先,有一句话要认识 : 80%的性能问题由SQL语句引起。

经过看 SYBASE 的书,结合从 MSSQL 迁移过来的系统过程 ,发现以下几个问题比较重要:
     经验一、where 条件左边最好不要使用函数,比如 ★★★★★
           select ...     where     datediff(day,date1,getdate())>;0
           这样即使在 date1 列上建立了索引,也可能不会使用索引,而使用表扫描。
            这样的语句要重新规划设计,保证不使用函数也能够实现。通过修改,一个系统过程的运行效率提高大约100倍!此外不要使用诸如like '%ab',不能充分利用索引,而要在%前加字符
      经验二、两个比较字段最好使用相同数据类型,而不是兼容数据类型。比如 int 与 numeric(感觉一般不是太明显)★★

      经验三、复合索引的非前导列做条件时,基本没有起到索引的作用。★★★★★
            比如 create index idx_tablename_ab on tablename(a,b)
                update tablename set c = XX where b>;= XXX and ...
                在这个语句中,基本上索引没有发挥作用。 导致表扫描引起blocking 甚至运行十几分钟后报告失败。
                一定要认真检查 改正措施: 在接口中附加条件
                    update tablename set c = XX where a = XXX     and b>;= XXX
                 或者建立索引类似于
                    create index idx_tablename_ba on tablename(b,a)  
      经验四、 多个大表的关联查询,如果性能不好,并且其中一个大表中取的数据比较少,可以考虑将查询分两步执行。★★★★
             先将一个大表中的少部分数据 select * into #1 from largetable1 where ...
              然后再用 #1 去做关联,效果可能会好不少。(前提:生成 #1表应该使用比较好的索引,速度比较快)

      经验五、 tempdb 的使用。★★★★★
              最好多用 select into     ,这样不记日志 ,尤其是有大量数据的报表时。虽然写起来麻烦,但值得。
                create table #tmp1 (......)这样写性能不好。尤其是大量使用时,容易发生tempdb 争用。
      经验六、 系统级别的参数设置     ★★★★
               一定要估计一下,不要使用太多,占用资源     ,太少,发生性能问题。
                 连接数,索引打开个数、锁个数 等、 当然 ,内存配置不要有明显的问题,比如,procedure cache
                不够 (一般缺省20%,如果觉得太多,可以减少一些)。如果做报表经常使用大数据量读,可以考虑使用
                16Kdata cache

       经验七、索引的建立。很重要。★★★★★
                  clustered index     /nonclustered index 的差异,自己要搞清楚。各适用场合,另外如果
                clustered index 不允许 重复数,也一定要说明。
               索引设计是以为数据访问快速为原则的,不能 完全(!!) 参照数据逻辑设计的,逻辑设计时的一些东西,
              可能对物理访问不起作用

       经验八、统计数据的更新:大约10天进行 update statistics     ,sp_recompile table_name(★★★)

       经验九、强制索引使用 (★★★★)
             如果怀疑有表访问时不是使用索引,而且这些条件字段上建立了合适的索引,可以强制使用
               select * from tableA (index idx_name) where ...
              这个对一些报表程序可能比较有用。

       经验十、找一个好的监视工具 ★★★
             工欲善其事,比先利其器,一点都不错呀。
              我用 DBartisian 5.4 ,监视哪些表被锁定时间长, blocking 等
                  还有 sp_object_status 20:00:00 , sp_sysmon 20:00:00 等
       以上是我的一点经验,在不到一个月的时间内,我修改了20个左右的语句和系统过程     ,

         系统性能明显改善,cpu利用 高峰时大约50% 平时 不到30%IO 明显改善。所有月报表能顺利完成 5min 以内。

    经验十一: 综合以上对IN/EXISTS的讨论,我们可以得出一个基本通用的结论:IN适合于外表大而内表小的情况;EXISTS适合于外表小而内表大的情况。


         另外,系统中确认不使用的中间数据,可以进行转移。这些要看系统的情况哦
          最后祝你好运气。

以上为个人经验,欢迎批评指正!     

     呵呵 写完后忘记一个     一定要注意热点表 ,这是影响并发问题的一个潜在因素。!解决方法: 行锁模式 如果表的行比较小,可以故意增加一些不用的字段
     比如     char(200)     让一页中存放的行不要太多。


只有注册用户登录后才能发表评论。


网站导航:
博客园   IT新闻   Chat2DB   C++博客   博问