ICode9

精准搜索请尝试: 精确搜索
首页 > 数据库> 文章详细

索引、索引和SQL语句优化策略、索引管理、并发控制、事务

2020-02-21 17:37:31  阅读:186  来源: 互联网

标签:语句 事务 name 使用 查询 索引 SQL


索引

索引:是特殊数据结构,定义在查找时作为查找条件的字段,在MySQL又称为键key,索引通过存储引擎实现

优点:
索引可以降低服务需要扫描的数据量,减少了IO次数
索引可以帮助服务器避免排序和使用临时表
索引可以帮助将随机I/O转为顺序I/O

缺点:
占用额外空间,影响插入速度

索引类型:
B+ TREE、HASH、R TREE
聚簇(集)索引、非聚簇索引:数据和索引是否存储在一起
主键索引、二级(辅助)索引
稠密索引、稀疏索引:是否索引了每一个数据项
简单索引、组合索引
左前缀索引:取前面的字符做索引
覆盖索引:从索引中即可取出要查询的数据,性能高

B+Tree索引:顺序存储,每一个叶子节点到根结点的距离是相同的;左前缀索引,适合查询范围类的数据

可以使用B+Tree索引的查询类型:
全值匹配:精确所有索引列,如:姓zhang,名san,年龄30
匹配最左前缀:即只使用索引的第一列,如:姓zhang
匹配列前缀:只匹配一列值开头部分,如:姓以z开头的
匹配范围值:如:姓li和姓zhang之间
精确匹配某一列并范围匹配另一列,如:姓z,名以s开头的
只访问索引的查询

B+Tree索引的限制
如不从最左列开始,则无法使用索引,如:查找名为xiaochun,或姓为g结尾

不能跳过索引中的列:如:查找姓wang,年龄30的,只能使用索引第一列

如果查询中某个列是为范围查询,那么其右侧的列都无法再使用索引:如:姓zhang,名s%,年龄30,只能利用姓和名上面的索引

注意:
索引列的顺序和查询语句的写法应相匹配,才能更好的利用索引
为优化性能,可能需要针对相同的列但顺序不同创建不同的索引来满足不同类型的查询需求

Hash索引
基于哈希表实现,只有精确匹配索引中的所有列的查询才有效,索引自身只存储索引列对应的哈希值和数据指针,索引结构紧凑,查询性能好
Memory存储引擎支持显式hash索引,InnoDB和MyISAM存储引擎不支持
适用场景:只支持等值比较查询,包括=, <=>, IN()
不适合使用hash索引的场景
不适用于顺序查询:索引存储顺序的不是值的顺序
不支持模糊匹配
不支持范围查询
不支持部分索引列匹配查找:如A,B列索引,只查询A列索引无效

R-Tree( Geospatial indexing )
MyISAM支持地理空间索引,可以使用任意维度组合查询,使用特有的函数访问,常用于做地理数据存储,使用不多
InnoDB从MySQL5.7之后也开始支持
全文索引(FULLTEXT)
在文本中查找关键词,而不是直接比较索引中的值,类似搜索引擎
InnoDB从MySQL 5.6之后也开始支持


索引和SQL语句优化策略

索引优化策略
避免冗余和重复索引
冗余索引:(A),(A,B)
重复索引:已经有索引,再次建立索引

独立地使用列:尽量避免其参与运算,独立的列指索引列不能是表达式的一部分,也不能是函数的参数,在where条件中,始终将索引列单独放在比较符号的一侧

左前缀索引:构建指定索引字段的左侧的字符数,要通过索引选择性来评估索引选择性:不重复的索引值和数据表的记录总数的比值

多列索引:AND操作时更适合使用多列索引,而非为每个列创建单独的索引

选择合适的索引列顺序:无排序和分组时,将选择性最高放左侧

只要列中含有NULL值,就最好不要在此例设置索引,复合索引如果有NULL值,此列在使用时也不会使用索引

尽量使用短索引,如果可以,应该制定一个前缀长度

对于经常在where子句使用的列,最好设置索引

对于有多个列where或者order by子句,应该建立复合索引

对于like语句,以%或者‘-’开头的不会使用索引,以%结尾会使用索引

尽量不要在列上进行运算(函数操作和表达式操作)

尽量不要使用not in和<>操作

SQL语句性能优化
查询时,能不要*就不用*,尽量写全字段名
大部分情况连接效率远大于子查询
多表连接时,尽量小表驱动大表,即小表 join 大表
在有大量记录的表分页时使用limit
对于经常使用的查询,可以开启缓存
多使用explain和profile分析查询语句
查看慢查询日志,找出执行时间长的sql语句优化

索引管理

创建索引:
CREATE INDEX [UNIQUE] index_name ON tbl_name (index_col_name[(length)],…);
ALTER TABLE tbl_name ADD INDEX index_name(index_col_name);
help CREATE INDEX;

删除索引:
DROP INDEX index_name ON tbl_name;
ALTER TABLE tbl_name DROP INDEX index_name(index_col_name);

查看索引:
SHOW INDEXES FROM [db_name.]tbl_name;

优化表空间:
OPTIMIZE TABLE tb_name;

查看索引的使用
SET GLOBAL userstat=1;
SHOW INDEX_STATISTICS;

通过EXPLAIN来分析索引的有效性
EXPLAIN SELECT * from test where name like ‘a%’
获取查询执行计划信息,用来查看查询优化器如何执行查询

id: 当前查询语句中,每个SELECT语句的编号
复杂类型的查询有三种:
    简单子查询
    用于FROM中的子查询
    联合查询:UNION
UNION查询的分析结果会出现一个额外匿名临时表

select_type:
简单查询为SIMPLE

复杂查询:
SUBQUERY 简单子查询
PRIMARY 最外面的SELECT
DERIVED 用于FROM中的子查询
UNION UNION语句的第一个之后的SELECT语句
UNION RESULT 匿名临时表

table:SELECT语句关联到的表

type:关联类型或访问类型,即MySQL决定的如何去查询表中的行的方式,以下顺序,性能从低到高

ALL: 全表扫描

ndex:根据索引的次序进行全表扫描;如果在Extra列出现“Using index”
表示了使用覆盖索引,而非全表扫描

range:有范围限制的根据索引实现范围扫描;扫描位置始于索引中的某一
点,结束于另一点

ref: 根据索引返回表中匹配某单个值的所有行

eq_ref:仅返回一个行,但与需要额外与某个参考值做比较

const, system: 直接返回单个行

possible_keys:查询可能会用到的索引

key: 查询中使用到的索引

key_len: 在索引使用的字节数

ref: 在利用key字段所表示的索引完成查询时所用的列或某常量值

rows:MySQL估计为找所有的目标行而需要读取的行数

Extra:额外信息

Using index:MySQL将会使用覆盖索引,以避免访问表
Using where:MySQL服务器将在存储引擎检索后,再进行一次过滤
Using temporary:MySQL对结果排序时会使用临时表
Using filesort:对结果使用一个外部索引排序

并发控制

锁粒度:
表级锁
行级锁

锁:
读锁:共享锁,只读不可写(包括当前事务) ,多个读互不阻塞
写锁:独占锁,排它锁,写锁会阻塞其它事务(不包括当前事务)的读和它锁

实现
存储引擎:自行实现其锁策略和锁粒度
服务器级:实现了锁,表级锁,用户可显式请求

分类:
隐式锁:由存储引擎自动施加锁
显式锁:用户手动请求

锁策略:在锁粒度及数据安全性寻求的平衡机制
显式使用锁

LOCK TABLES 加锁
tbl_name [[AS] alias] lock_type
[, tbl_name [[AS] alias] lock_type] …
lock_type: READ , WRITE

UNLOCK TABLES 解锁

关闭正在打开的表(清除查询缓存),通常在备份前加全局读锁
FLUSH TABLES [tb_name[,…]] [WITH READ LOCK]

查询时加写或读锁
SELECT clause [FOR UPDATE | LOCK IN SHARE MODE]

事务

事务Transactions
一组原子性的SQL语句,或一个独立工作单元
事务日志:记录事务信息,实现undo,redo等故障恢复功能
ACID特性:
A:atomicity原子性;整个事务中的所有操作要么全部成功执行,要么全部
失败后回滚

C:consistency一致性;数据库总是从一个一致性状态转换为另一个一致性状态

I:Isolation隔离性;一个事务所做出的操作在提交之前,是不能为其它事务所见;隔离有多种隔离级别,实现并发

D:durability持久性;一旦事务提交,其所做的修改会永久保存于数据库中

事务日志如何工作:
开始事务–>增删改查–>结束事务–>数据更新
事务中执行的动作会记录到事务日志,如果在结束事务前断电,下次启动时会发现该事务没有结束,则执行undo,数据不会更新

启动事务:
BEGIN
BEGIN WORK
START TRANSACTION

结束事务:
COMMIT:提交
ROLLBACK: 回滚
只有事务型存储引擎中的DML语句方能支持此类操作

自动提交:set autocommit={1|0} 默认为1,为0时设为非自动提交
显式请求和提交事务,而不要使用“自动提交”功能

事务支持保存点:savepoint
SAVEPOINT identifier
ROLLBACK [WORK] TO [SAVEPOINT] identifier
RELEASE SAVEPOINT identifier

事务隔离级别
从上至下更加严格
READ UNCOMMITTED 可读取到未提交数据,产生脏读

READ COMMITTED 可读取到提交数据,但未提交数据不可读,产生不可重复读,即可读取到多个提交数据,导致每次读取数据不一致

REPEATABLE READ 可重复读,多次读取数据都一致,产生幻读,即读取过程中,即使有其它提交的事务修改数据,仍只能读取到未修改前的旧数据。此为MySQL默认设置

SERIALIZABILE 可串行化,未提交的读事务阻塞修改事务,或者未提交的修改事务阻塞读事务。导致并发性能差

指定事务隔离级别:
服务器变量tx_isolation指定,默认为REPEATABLE-READ,可在GLOBAL和SESSION级进行设置
SET tx_isolation=’’
READ-UNCOMMITTED
READ-COMMITTED
REPEATABLE-READ
SERIALIZABLE

服务器选项中指定
[mysqld]
transaction-isolation=SERIALIZABLE

死锁:
两个或多个事务在同一资源相互占用,并请求锁定对方占用的资源的状态

事务日志:
事务日志的写入类型为“追加”,因此其操作为“顺序IO”;通常也被称为:预写式日志 write ahead logging
事务日志文件: ib_logfile0, ib_logfile1

zerocdn 发布了28 篇原创文章 · 获赞 1 · 访问量 1582 私信 关注

标签:语句,事务,name,使用,查询,索引,SQL
来源: https://blog.csdn.net/zerocdn/article/details/103934952

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有