哈希索引

张威大约 4 分钟

查看索引类型

show indexes from student;

create index nameidx on student(name) using hash;
show create table student\G

哈希索引是基于的支持，底层结构就是，增删改查的时间复杂度都是，一断电或重启mysql服务器就没了，因为内存搜索，哈希表是最快的

而平衡树的增删改查的时间复杂度是O ( logn )，此外B+树索引是把磁盘上的存储的索引文件加载到内存上构建的数据结构。

选择哪种数据结构构建索引，我们主要看：

如果这个文件使用的是memory基于内存的存储引擎，然后我们创建的索引就是哈希索引，底层是通过链式哈希表实现的

create index nameidx on student(name);

构建链式哈希表：根据选定的哈希函数，把每一行记录的name字段作为参数来求一个哈希值，哈希值对桶的长度取模得到桶的序号（会产生哈希冲突），然后进行存储。

解决哈希冲突的方式：在桶里面用链表串起来（链地址法）

注意：虽然链式哈希表的桶看起来有顺序，实际上存储的。因为我们用哈希函数进行了计算，然后还进行了取模的操作，不可能说我输入的索引值的字典序小，就一定在小的桶里面

哈希表只能进行等值查找，比如：

select * from student name="zhangsan";

不能进行，比如：

select * from student name like "zhang%";

B+输入读取一个块（16K）可以放到相邻的4个页面上；而在哈希表中，不同元素，哪怕是15和16，通过求哈希值，模上桶的个数，最后存储的位置可能会相隔很远。如果用链式哈希表构建索引，一个桶里面的节点代表1次磁盘I/O，由于桶内元素也是没有顺序的，我们进行查找的时候都会遍历完所有的桶内节点，就会导致更多的磁盘I/O。

哈希索引只适用于小数据量的，在内存上的等值查询，处理不在磁盘的数据，并不能为我们减少磁盘I/O的次数！！！