MySQL索引优化之适合构建索引的情况有哪些
结论
在where后面的过滤字段上建立索引(select/update/delete后面的where都是适用的),使用索引加快过滤效率,不用进行全表扫描
在具有唯一要求的字段上添加唯一索引,加快查询效率,查到即可直接返回
group by或者order by后面的字段添加索引,由于索引是排好序的,所以建立索引就等同于在查询之前已经是排好序了(这里需要注意建立的联合索引建立中字段的顺序,可以结合具体案例场景7进行学习)
在DISTINCT(去重字段)后面的字段添加索引,由于建立了索引,那么相同的数据就是挨在一起的,所以就可以进行快速的去重操作,否则可能就需要将相同的数据找出来在进行去重操作
在多表连接join的时候在连接的字段上建立索引(小表驱动大表)
取字符串一定前缀建立索引(不是用整个字符串作为索引,否则将会占用太大的空间)
在频繁使用的列上建立索引(可以建立联合索引,同时最频繁使用的字段应该在联合索引的最左侧,最左侧原则)
在区分度高的列上建立索引(主键的区分度最高,因为所有的键都是唯一的)
建立索引的场景
场景一:在where字段后面的字段建立索引
-- 描述:当where中有多个条件需要进行匹配的时候,那么可以创建联合索引,这样所有的条件都可以使用索引,大大提高了检索的效率 select * from student_info where student_id = 1; -- 当然数据量比较大的时候给where后面的字段添加索引 create index student_id_index on student_info (student_id)登录后复制
未添加索引前,耗费0.383秒,基本遍历整个表
添加索引后,耗费0.001秒,使用了索引(但是创建索引的时候会耗费一定时间)
在频繁的查询的业务中可以对where筛选的字段建立索引,如果where筛选的字段有多个还可以建立联合索引
场景二:在具有唯一性约束的字段上建立唯一索引(查找到目标即可返回不用继续查找)
select * from student_info where id = 1001; -- 因为学号是唯一的,所以可以在学号这个字段上添加唯一所用 create index id_unique on student_info(id);登录后复制
具有唯一性约束的字段上就可以建立唯一索引,虽然建立了唯一索引对insert操作有一定的影响(需要判断新增的数据是否已经在表中),但是建立唯一索引对于查询的效率是显著提升的,例如上面的例子,因为建立了唯一索引,一旦查找到id为1001的学生信息之后就不需要判断数据库中是否还有id等于1001的学生(只有唯一一份),直接返回信息即可,如果没有建立索引,那么就需要全表扫描
场景三:经常group by和order by的字段上建立索引(因为索引本身就是排好序的,相当于查询之前就已经进行了排序)
select * from student_info order by name; -- 这里就可以给name字段进行索引的添加 select * from student_info group by class_id; -- 这里就可以给class_id字段添加索引登录后复制
建立索引前,耗时0.501秒,使用的是所有数据在内存中排序
建立索引后,耗时0.01秒
场景四:在DISTINCT后面的字段添加索引(索引已经将相同的字段排好序,去重效率更高)
select distinct(student_id) from student_info; -- 这里就可以根据student_id字段建立索引 create index student_id_index on student_info;登录后复制
建立了索引,那么默认就是按照索引字段的升序排列的,那么相同值的字段也就排列在一起了,那么去重也就变得简单、高效
场景五:在join多表连接大表中的连接字段建立索引
SELECT s.course_id,NAME,s.student_id,c.course_name FROM student_info s JOIN course c ON s.`course_id` = c.`course_id` WHERE NAME = 'xiaoyuanhao'; -- 根据大表驱动小表的原则需要在student_info表的course_id字段上建立索引登录后复制
没有建立索引之前,耗时0.697s,没有使索引
建立索引后,使用了索引,耗时0.003s
小表驱动大表:
通过对小表进行逐一遍历,同时在大表中的连接字段建立索引即可加快查询,本案例中,每次取出课程表中course_id和学生表中学生的course_id进行连接操作,在学生表中对course_id建立索引即可
场景六:使用字符串的前缀建立索引
create table shop(address varchar(120) not null); alter table shop add index(address(12)); --这里只是对表中的address的前12个字符建立了索引,而不是整个字符串建立索引登录后复制
前缀建立索引的原因:
由于有些字符串很长,如果为整个字符串建立索引,那么索引将占用很大的空间
由于需要存储整个字符串,那么数据项就会很大,那么索引树的深度就会加深,检索速度下降
虽然可能出现在索引中两个字符串相同,但是再根据主键进行回表操作效率依然比较高
如何确定前缀索引中前缀的长度呢?(也就是如果前缀的长度太短,那么索引的区分度就很低,从多个字符串截取的前缀数据可能都是一样的,但是如果前缀索引的前缀过长,那么前缀索引的优点就消失了)
引入了区别度的概念,select count(distinct left(索引字段,前缀索引长度) / count(*) from xxx),该值越接近1,那么区分度就越明显,那么该索引长度就是所求的前缀索引长度
场景七:在频繁使用的列上建立索引或联合索引(频繁使用的字段应该在索引的左侧)
select * from xiaoyuanhao where age = 18; select * from xiaoyuanhao where age = 19 and sex = 'man'; select * from xiaoyuanhao where age = 10 and sex = 'man' and password = '123456'; -- 在这里实际上就可以建立age,sex,password的联合索引,只需要建立一个索引,这三个查询都是可以使用的 create index age_sex_password_index on xiaoyuanhao(age,sex,password); select * from student_info group by class_id order by name; -- 在这里可以建立class_id和name的联合索引,但是一定要注意索引的顺序,一定是要class_id在前,name在后,因为在select语句中执行的顺序是先group by 之后才是 order by 索引如果索引的字段顺序是相反的,那么就无法使用索引 create index class_id_name_index on student(class_id,name);登录后复制
索引建立需要符合顺序的原因:
索引字段的顺序如果是错误的,那么索引就会失效,因为索引实际上是排好序的,如果索引建立的时候是现根据name排好序之后在根据class_id进行排序,那么在面对需要先根据class_id排序再根据name排序的业务就无法进行使用
补充:
在select * from xxx where age = 19 and sex = ‘man’ and password = '123456’这里索引建立的顺序不一定是(age,sex,password)因为在实际执行的过程中,优化器会优化执行步骤会按照索引的顺序进行查询,但是group by 和 order by的执行顺序是无法改变的,索引必须严格的按照顺序建立索引,否则索引失效
【文章转自:扬州机房 http://www.558idc.com/yz.html欢迎留下您的宝贵建议】