博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python字典的实现原理
阅读量:5961 次
发布时间:2019-06-19

本文共 1180 字,大约阅读时间需要 3 分钟。

以下是自己的学习记录,算是一个总结。

接下来会依次对下面问题做一个解答:

    1. Python的dict和set为什么是无序的?
    2. 为什么不是所有的python对象都可以用作dict的键和set中的元素

要弄懂上面的问题,我们首先要了解Python内部是如何实现dict和set类型的。我们先来看看dict的内部结构,dict其实本质上是一个散列表(散列表即总有空白元素的数组,Python会保证至少有三分之一的数组元素是空的),dict的每个键都占用一个表元,而一个表元中又分为两个部分,分别是对键的引用和对值的引用。当我们存放一个对象的时候,首先会要计算这个元素的散列值,python中使用hash()方法来实现的,这也就回答了第二个问题,因为不是所有的python对象都可以使用hash来获取散列值,获取不到散列值也就不可能存放到dict中,所以只有可hash的对象才能够作为dict的键。值得注意的是内置的hash方法可以用于所有的内置类型对象的,所有用户自定义的对象默认都是可以作为键的,因为自定义对象的散列值是通过id()来获取的。例如:

class T(object):    passt = T()print(id(t))d = {t: 1}print(d)###  2133693018240###  {<__main__.T object at 0x000001F0CA03B080>: 1}

现在假设我们已经获取到了元素的散列值,接下来就该计算应当存放位置了,将散列值对数组长度进行取余,得到的结果就是存放位置的索引了。但是不同的key可能会得到相同的散列值,也就是哈希冲突的问题,python内部是使用开放寻址的方法来解决的,开放寻址法就不在此详细说了。关于为什么dict是无序的,这个是因为python内部会保证散列表至少有三分之一的位置为空,当我们增加元素的时候,python有可能会对散列表进行扩容,具体操作就是重新开辟一块更大的空间,将原有的元素添加到新表里面,这个过程中可能又会发生新的散列冲突,导致新的散列表中的键的次序发生变化。当然呢如果想要保存顺序也可以使用OrderedDict来处理

 

dict操作的时间复杂度:

操作 操作说明 时间复杂度
copy 复制 O(n)
get(value) 获取 O(1)
set(value) 修改 O(1)
delete(value) 删除 O(1)
search(in) 字典搜索 O(1)
iterration 字典迭代 O(n)

set集合和dict一样也是基于散列表的,只是他的表元只包含值的引用而没有对键的引用,其他的和dict基本上是一致的,所以在此就不再多说了。

转载于:https://www.cnblogs.com/FanMLei/p/10501005.html

你可能感兴趣的文章
Go defer 知识点
查看>>
【本人秃顶程序员】如何在代码中应用设计模式
查看>>
当你凝视黑洞的时候,它已经被玩坏了
查看>>
fluent python 读书笔记 2--Python的序列类型2
查看>>
依赖冲突时的解决方法
查看>>
学习笔记5
查看>>
富人为什么越富,穷人为什么越穷
查看>>
电子商务java b2b b2c o2o平台
查看>>
(五)java spring cloud版b2b2c社交电商spring cloud分布式微服务-路由网关(zuul)
查看>>
零基础学小程序007---小程序获取用户openid
查看>>
两年摸爬滚打 Spring Boot,总结了这 16 条最佳实践
查看>>
Laravel 5 5 使用 Jwt Auth 实现 API 用户认证以及无痛刷新访问令牌
查看>>
专注人工智能未来 十年后百度可能完全不一样?
查看>>
阿里开发者招聘节 | 面试题14:如何实现两金额数据相加(最多小数点两位)...
查看>>
企业分布式微服务云SpringCloud SpringBoot mybatis(八)消息总线(Spring Cloud Bus)
查看>>
logback pattern
查看>>
推荐的JVM参数
查看>>
PHP类UTF8编码内的繁简转换-繁体-简体
查看>>
晒晒工作中的静态文件大小控制制度
查看>>
当存储已成白菜
查看>>