写SQL要注意的地方，如何写出高效的SQL语句

2016年04月17日 21:33:57 · 本文共 1,779 字阅读时间约 6分钟 · 4,974 次浏览

博客很久没更新了，因为上段时间在换工作，从石家庄换到了北京，跨省市搬家，还要找工作面试等等，现在终于稳定点了，可以写点东西分享给大家了。

这次换工作呢，工作内容还比较符合我的期望，比较特殊的岗位，开发2部，开发的第二梯队，虽然不是开发主要产品，但也开发点周边的系统模块，而且还有运维任务，运维任务，就更好玩了，不但能看到整个系统的源代码，还可以接触数据库甚至服务器，学到了很多之前没考虑过的问题，今天也跟大家分享一下我最近学到或者体会到的一些经验，就是写SQL查询时的一些注意和经验。

在之前我写SQL呢，就比较随意，没什么在乎的，能实现就可以了，但接触运维以后，赵老师呢告诉了我很多，而且强调了SQL中不能用 IN 或者 NOT IN，在其他公司面试时也问到了数据库建立索引的问题，所以今天了解一下索引和写SQL时的注意。

主要的思想的尽量利用索引加快查询速度，但某些写法会让数据引擎放弃使用索引，所以要注意一下写法：

1、应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描
2、应尽量避免在 where 子句中使用 or 来连接条件，否则将导致引擎放弃使用索引而进行全表扫描，如： select id from t where num=10 or num=20 可以这样查询： select id from t where num=10 union all select id from t where num=20
3、in 和 not in 也要慎用，否则会导致全表扫描，如： select id from t where num in(1,2,3) 对于连续的数值，能用 between 就不要用 in 了： select id from t where num between 1 and 3
4、下面的查询也将导致全表扫描： select id from t where name like ‘%abc%’
5、如果在 where 子句中使用参数，也会导致全表扫描。因为SQL只有在运行时才会解析局部变量，但优化程序不能将访问计划的选择推迟到运行时；它必须在编译时进行选择。然而，如果在编译时建立访问计划，变量的值还是未知的，因而无法作为索引选择的输入项。如下面语句将进行全表扫描： select id from t where num=@num 可以改为强制查询使用索引： select id from t with(index(索引名)) where num=@num
6、应尽量避免在 where 子句中对字段进行表达式操作，这将导致引擎放弃使用索引而进行全表扫描。如： select id from t where num/2=100 应改为: select id from t where num=100*2
7、应尽量避免在where子句中对字段进行函数操作，这将导致引擎放弃使用索引而进行全表扫描。如： select id from t where substring(name,1,3)=’abc’–name以abc开头的id select id from t where datediff(day,createdate,’2005-11-30′)=0–‘2005-11-30’生成的id 应改为: select id from t where name like ‘abc%’ select id from t where createdate>=’2005-11-30′ and createdate<’2005-12-1′
8、不要在 where 子句中的“=”左边进行函数、算术运算或其他表达式运算，否则系统将可能无法正确使用索引。
9、任何地方都不要使用 select * from t ，用具体的字段列表代替“*”，不要返回用不到的任何字段。
10、应尽量避免在 where 子句中对字段进行 null 值判断，因为要知道是不是 null ，就得扫描全表才知道，所以数据库引擎会自动放弃索引，进行全扫
11、先应考虑在 where 及 order by 涉及的列上建立索引
12、并不是所有索引对查询都有效，SQL是根据表中数据来进行查询优化的，当索引列有大量数据重复时,查询可能不会去利用索引，比如性别列，不是男就是女，那索引还有什么意义呢？
13、索引并不是越多越好，索引固然可以提高相应的 select 的效率，但同时也降低了 insert 及 update 的效率，因为 insert 或 update 时有可能会重建索引，所以最多 6个字段建立索引就足够了，再多就会适得其反。
14、应尽可能的避免更新索引数据列，因为索引数据列的顺序就是表记录的物理存储顺序，一旦该列值改变将导致整个表记录的顺序的调整，会耗费相当大的资源
15、尽量使用数字型字段，若只含数值信息的字段尽量不要设计为字符型，这会降低查询和连接的性能，并会增加存储开销。这是因为引擎在处理查询和连接时会逐个比较字符串中每一个字符，而对于数字型而言只需要比较一次就够了
16、在新建临时表时，如果一次性插入数据量很大，那么可以使用 select into 代替 create table，避免造成大量 log ，以提高速度；如果数据量不大，为了缓和系统表的资源，应先create table，然后insert

商业用途请联系作者获得授权。
版权声明：本文为博主「任霏」原创文章，遵循 CC BY-NC-SA 4.0 版权协议，转载请附上原文出处链接及本声明。
原文链接：https://www.renfei.net/posts/1003262

写SQL要注意的地方，如何写出高效的SQL语句

相关推荐