读高性能MySQL(第4版)笔记06_优化数据类型(上)

这篇具有很好参考价值的文章主要介绍了读高性能MySQL(第4版)笔记06_优化数据类型(上)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

读高性能MySQL(第4版)笔记06_优化数据类型(上)文章来源地址https://www.toymoban.com/news/detail-707447.html

1. 良好的逻辑设计和物理设计是高性能的基石

1.1. 反范式的schema可以加速某些类型的查询,但同时可能减慢其他类型的查询

1.2. 添加计数器和汇总表是一个优化查询的好方法,但它们的维护成本可能很

1.3. 将修改schema作为一个常见事件来规划

2. 让事情尽可能小而简单是一个好主意

2.1. 尽量避免在设计中出现极端情况

2.2. 使用小的、简单的、适当的数据类型,并避免使用NULL,除非确实是对真实数据进行建模的正确方法

2.3. 尝试使用相同的数据类型来存储相似或相关的值,尤其是在联接条件中使用这些值时

2.4. 注意可变长度字符串,它可能会导致临时表和排序的全长内存分配不乐观

2.5. 如果可能的话,尝试使用整数作为标识符

2.6. 小心使用ENUM和SET类型

2.7. 避免使用BIT类型

3. 选择正确的数据类型对于获得高性能至关重要

3.1. 更小的通常更好

3.1.1. 尽量使用能够正确存储和表示数据的最小数据类型

3.1.2. 更小的数据类型通常更快,因为它们占用的磁盘、内存和CPU缓存的空间更少,并且处理时需要的CPU周期也更少

3.1.3. 在schema中的多个地方增加数据类型范围是一个痛苦且耗时的操作

3.1.4. 如果无法确定哪个数据类型是最好的,请选择你认为不会超过的最小数据类型

3.2. 简单为好

3.2.1. 简单数据类型的操作通常需要更少的CPU周期

3.2.2. 整型数据比字符型数据的比较操作代价更低

3.2.2.1. 字符集和排序规则(collation)使字符型数据的比较更复杂

3.2.2.2. 应该将日期和时间存储为MySQL的内置类型而不是字符串类型

3.2.2.3. 应该用整型数据存储IP地址

3.3. 尽量避免存储NULL

3.3.1. 最好指定列为NOT NULL,除非明确需要存储NULL值

3.3.2. 如果查询中包含可为NULL的列,对MySQL来说更难优化,因为可为NULL的列使得索引、索引统计和值比较都更复杂

3.3.3. 可为NULL的列会使用更多的存储空间,在MySQL里也需要特殊处理

3.3.4. 可为NULL的列改为NOT NULL带来的性能提升比较小

4. 整数类型

4.1. 整数(whole number)

4.1.1. TINYINT、SMALLINT、MEDIUMINT、INT或BIGINT

4.1.1.1. 使用8、16、24、32和64位存储空间

4.1.2. 整数类型有可选的UNSIGNED属性,表示不允许负值,这大致可以使正数的上限提高一倍

4.1.3. 有符号和无符号类型使用相同的存储空间,并具有相同的性能,因此可以根据数据实际范围选择合适的类型

4.1.4. 整数计算通常使用64位的BIGINT整数

4.1.5. 对于存储和计算来说,INT(1)和INT(20)是相同的

4.1.6. 一些大容量的场景,可以考虑使用BIGINT代替DECIMAL,将需要存储的货币单位根据小数的位数乘以相应的倍数即可

4.1.7. 存储财务数据并精确到万分之一分,则可以把所有金额乘以一百万,然后将结果存储在BIGINT里

4.1.8. 同时避免浮点存储计算不精确和DECIMAL精确计算代价高的问题

4.2. 实数(real number,带有小数部分的数字)

4.2.1. 不仅适用于带小数的数字,也可以使用DECIMAL存储比BIGINT还大的整数

4.2.2. 浮点类型通常比DECIMAL使用更少的空间来存储相同范围的值

4.2.3. FLOAT列使用4字节的存储空间

4.2.4. DOUBLE占用8字节,比FLOAT具有更高的精度和更大的值范围

4.2.5. 应该尽量只在对小数进行精确计算时才使用DECIMAL

5. 字符串类型

5.1. 字符串长度定义的不是字节数,是字符数

5.2. VARCHAR

5.2.1. 用于存储可变长度的字符串,是最常见的字符串数据类型

5.2.2. 它比固定长度的类型更节省空间,因为它仅使用必要的空间

5.2.3. 更少的空间用于存储更短的值

5.2.4. 需要额外使用1或2字节记录字符串的长度

5.2.4.1. VARCHAR(1000)的列则需要1002个字节,因为需要2字节存储长度信息

5.2.5. 节省了存储空间,所以对性能也有帮助

5.2.5.1. 由于行是可变长度的,在更新时可能会增长,这会导致额外的工作

5.2.6. 推荐使用场景

5.2.6.1. 字符串列的最大长度远大于平均长度

5.2.6.2. 列的更新很少,所以碎片不是问题

5.2.6.3. 使用了像UTF-8这样复杂的字符集,每个字符都使用不同的字节数进行存储

5.3. CHAR

5.3.1. 总是为定义的字符串长度分配足够的空间

5.3.2. 当存储CHAR值时,MySQL删除所有尾随空格

5.3.3. 如果需要进行比较,值会用空格填充

5.3.4. 推荐使用场景

5.3.4.1. 存储非常短的字符串

5.3.4.1.1. 对于非常短的列,CHAR也比VARCHAR更高效
5.3.4.1.2. 设计为只保存Y和N的值的CHAR(1)在单字节字符集中只使用1字节,但VARCHAR(1)需要2字节,因为还有一个记录长度的额外字节

5.3.4.2. 所有值的长度都几乎相同的情况

5.3.5. 对于经常修改的数据,CHAR也比VARCHAR更好,因为固定长度的行不容易出现碎片

5.4. 二进制字符串与常规字符串非常相似,但它们存储的是字节而不是字符

5.5. 填充也不同:MySQL填充BINANRY用的是\0(零字节)而不是空格,并且在检索时不会去除填充值

5.6. 字节比较的优势

5.6.1. 大小写不敏感

5.6.2. 二进制比较比字符比较简单得多,因此速度更快

5.7. BLOB和TEXT类型

5.7.1. 存储很大的数据而设计的字符串数据类型,分别采用二进制和字符方式存储

5.7.2. 字符类型

5.7.2.1. TINYTEXT、SMALLTEXT、TEXT、MEDIUMTEXT和LONGTEXT

5.7.2.2. TEXT是SMALLTEXT的同义词。

5.7.2.3. 有字符集和排序规则

5.7.3. 二进制类型

5.7.3.1. TINYBLOB、SMALLBLOB、BLOB、MEDIUMBLOB、LONGBLOB

5.7.3.2. BLOB是SMALLBLOB的同义词

5.7.3.3. 二进制数据,没有排序规则或字符集

5.7.3.4. 如果需要在检索后保持值不变,请小心使用BINARY类型,MySQL会使用\0将其填充到需要的长度

5.7.4. 当BLOB和TEXT值太大时,InnoDB会使用独立的“外部”存储区域,此时每个值在行内需要1~4字节的存储空间,然后在外部存储区域需要足够的空间来存储实际的值

5.7.5. 只对这些列的最前max_sort_length字节而不是整个字符串做排序

5.7.6. 不能将BLOB和TEXT数据类型的完整字符串放入索引,也不能使用索引进行排序

到了这里,关于读高性能MySQL(第4版)笔记06_优化数据类型(上)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数据库——MySQL高性能优化规范

    所有数据库对象名称必须使用小写字母并用下划线分割 所有数据库对象名称禁止使用 MySQL 保留(如果表名中包含查询时,需要将其用单引号括起来) 数据库对象的命名要能做到见名识意,并且最后不要超过 32 个字符 临时库表必须以 tmp_为前缀并以日期为后缀,

    2024年02月11日
    浏览(95)
  • 读高性能MySQL(第4版)笔记05_优化服务器设置

    2.1.3.1. MySQL只需要少量的内存就能保持一个连接(通常是一个相关的专用线程)打开 2.2.1.1. InnoDB缓冲池大小 2.2.1.2. 需要的内存比其他任何组件都多 2.2.1.3. 不仅缓存索引,还缓存行数据、自适应哈希索引、更改缓冲区、锁和其他内部结构等 2.2.1.4. InnoDB严重依赖缓冲池,应

    2024年02月09日
    浏览(45)
  • 读高性能MySQL(第4版)笔记04_操作系统和硬件优化

    4.9.2.1. 允许在内存中更改页面,而不用将更改刷新到磁盘,这通常涉及随机I/O,速度非常慢 4.9.2.2. 将更改的记录写入顺序日志文件,这样要快得多 4.9.2.3. 后台线程可以稍后将修改过的页面刷新到磁盘,这样做可以优化写操作的性能 5.11.2.1. 只有进行特殊的擦除操作之后,

    2024年02月09日
    浏览(34)
  • 《高性能MYSQL》-- 查询性能优化

    查询性能优化 深刻地理解MySQL如何真正地执行查询,并明白高效和低效的原因何在 查询的生命周期(不完整):从客户端到服务器,然后服务器上进行语法解析,生成执行计划,执行,并给客户端返回结果。 一条查询,如果查询得很慢,原因大概率是访问的数据太多 对于低

    2024年03月11日
    浏览(59)
  • 高性能MySQL实战(三):性能优化

    大家好,我是 方圆 。这篇主要介绍对慢 SQL 优化的一些手段,而在讲解具体的优化措施之前,我想先对 EXPLAIN 进行介绍,它是我们在分析查询时必要的操作,理解了它输出结果的内容更有利于我们优化 SQL。为了方便大家的阅读,在下文中规定类似 key1 的表示二级索引,key_

    2024年02月11日
    浏览(50)
  • MySQL高性能优化规范建议

    数据库命令规范 数据库基本设计规范 1. 所有表必须使用 Innodb 存储引擎 2. 数据库和表的字符集统一使用 UTF8 3. 所有表和字段都需要添加注释 4. 尽量控制单表数据量的大小,建议控制在 500 万以内。 5. 谨慎使用 MySQL 分区表 6.尽量做到冷热数据分离,减小表的宽度 7. 禁止在表中建

    2024年02月12日
    浏览(43)
  • 《高性能MySQL》——创建高性能的索引(笔记)

    索引(在MySQL中也叫做“键(key)”) 是存储引擎用于快速找到记录的一种数据结构。 索引对于良好的性能非常关键。尤其是当表中的数据量越来越大时,索引对性能的影响愈发重要。 在数据量较小且负载较低时,不恰当的索引对性能的影响可能还不明显,但当数据量逐渐增大时

    2024年02月07日
    浏览(96)
  • 读高性能MySQL(第4版)笔记08_创建高性能索引(上)

    2.4.2.1. 按照索引列中的数据大小顺序存储的 2.4.3.1. 键前缀查找只适用于根据最左前缀的查找 2.4.4.1. 在查询某些条件的数据时,存储引擎不再需要进行全表扫描 2.4.4.2. 通过比较节点页的值和要查找的值可以找到合适的指针进入下层子节点,这些指针实际上定义了子节点页中

    2024年02月08日
    浏览(36)
  • 读高性能MySQL(第4版)笔记09_创建高性能索引(下)

    1.4.4.1. InnoDB的二级索引在叶子节点中保存了记录的主键值,所以如果二级索引能够覆盖查询,则可以避免对主键索引的二次查询 7.1.5.1. 常见的类似错误通常是由于尝试使用rsync备份InnoDB导致的 7.3.3.1. 否则,对于范围查询、索引覆盖扫描等操作来说,速度可能会降低很多 7

    2024年02月08日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包