20年资深程序员的Python“秘籍”,教你成为其中的“武林高手”
suiw9 2024-10-23 18:50 22 浏览 0 评论
我列出的这些有用的Python代码片段,为我节省了大量的时间,并且我希望他们也能为你节省一些时间。大多数的这些片段出自寻找解决方案,查找博客和StackOverflow解决类似问题的答案。下面所有的代码片段已经在Python 3中测试。
在Python中调用一个外部命令
有时你需要通过shell或命令提示符调用一个外部命令,这在Python中通过使用subprocess模块很容易实现。
只需要运行一条命令:
import subprocesssubprocess.call(['mkdir', 'empty_folder'])
如果想运行一条命令并输出得到的结果:
import subprocessoutput = subprocess.check_output(['ls', '-l'])
要说明的是上面的调用是阻塞的。
如果运行shell中内置的命令,如cd或者dir,需要指定标记shell=True:
import subprocessoutput = subprocess.call(['cd', '/'], shell=True)
对于更高级的用例,可以使用 Popen constructor。
Python 3.5引进了一个新的run函数,它的行为与call和check_output很相似。如果你使用的是3.5版本或更高版本,看一看run的文档,里面有一些有用的例子。否则,如果你使用的是Python 3.5以前的版本或者你想保持向后兼容性,上面的call和check_output代码片段是你最安全和最简单的选择。
美观打印
开发时使用pprint模块替代标准的print 函数,可以让shell输出的信息更具可读性。这使得输出到shell上的字典和嵌套对象更易读。
import pprint as ppanimals = [{'animal': 'dog', 'legs': 4, 'breeds': ['Border Collie', 'Pit Bull', 'Huskie']}, {'animal': 'cat', 'legs': 4, 'breeds': ['Siamese', 'Persian', 'Sphynx']}]pp.pprint(animals, width=1)
width参数指定一行上最大的字符数。设置width为1确保字典打印在单独的行。
按属性进行数据分组
假设你查询一个数据库,并得到如下数据:
data = [{'animal': 'dog', 'name': 'Roxie', 'age': 5},{'animal': 'dog', 'name': 'Zeus', 'age': 6},{'animal': 'dog', 'name': 'Spike', 'age': 9},{'animal': 'dog', 'name': 'Scooby', 'age': 7},{'animal': 'cat', 'name': 'Fluffy', 'age': 3},{'animal': 'cat', 'name': 'Oreo', 'age': 5},{'animal': 'cat', 'name': 'Bella', 'age': 4}]
通过动物类型分组得到一个狗的列表和一个猫的列表。幸好,Python的itertools有一个groupby函数可以让你很轻松的完成这些。
from itertools import groupbydata = [{'animal': 'dog', 'name': 'Roxie', 'age': 5},{'animal': 'dog', 'name': 'Zeus', 'age': 6},{'animal': 'dog', 'name': 'Spike', 'age': 9},{'animal': 'dog', 'name': 'Scooby', 'age': 7},{'animal': 'cat', 'name': 'Fluffy', 'age': 3},{'animal': 'cat', 'name': 'Oreo', 'age': 5},{'animal': 'cat', 'name': 'Bella', 'age': 4}]for key, group in groupby(data, lambda x: x['animal']):for thing in group:print(thing['name'] + " is a " + key)
得到的输出是:
Roxie is a dogZeus is a dogSpike is a dogScooby is a dogFluffy is a catOreo is a catBella is a cat
groupby()有2个参数:1、我们想要分组的数据,它在本例中是一个字典。2、分组函数:lambda x: x['animal']告诉groupby函数每个字典按动物的类型分组
现在通过列表推导式可以很容易地构建一个狗的列表和一个猫的列表:
from itertools import groupbyimport pprint as ppdata = [{'animal': 'dog', 'name': 'Roxie', 'age': 5},{'animal': 'dog', 'name': 'Zeus', 'age': 6},{'animal': 'dog', 'name': 'Spike', 'age': 9},{'animal': 'dog', 'name': 'Scooby', 'age': 7},{'animal': 'cat', 'name': 'Fluffy', 'age': 3},{'animal': 'cat', 'name': 'Oreo', 'age': 5},{'animal': 'cat', 'name': 'Bella', 'age': 4}]grouped_data = {}for key, group in groupby(data, lambda x: x['animal']):grouped_data[key] = [thing['name'] for thing in group]pp.pprint(grouped_data)
最后得到一个按动物类型分组的输出:
{'cat': ['Fluffy','Oreo','Bella'],'dog': ['Roxie','Zeus','Spike','Scooby']}
StackOverflow上这个问题的答案非常有帮助,当我试图找出如何以最Pythonic的方式分组数据时,这篇文章节省了我很多时间。
删除列表中的重复元素
Python中用一行代码快速简单的删除一个列表中的重复元素(不维持顺序):
x = [1, 8, 4, 5, 5, 5, 8, 1, 8]list(set(x))
这个方法利用了set是一个不同的对象的集合这一事实。然而,set不维持顺序,
因此如果你在乎对象的顺序,使用下面的技术:
from collections import OrderedDictx = [1, 8, 4, 5, 5, 5, 8, 1, 8]list(OrderedDict.fromkeys(x))
访问Python的For循环的索引
对于许多人来说这可能是常识,但这也是经常问的。Python的内置enumerate 函数提供索引和值的访问如下:
x = [1, 8, 4, 5, 5, 5, 8, 1, 8]for index, value in enumerate(x):print(index, value)
通过指定enumerate函数的start参数改变起始索引:
x = [1, 8, 4, 5, 5, 5, 8, 1, 8]for index, value in enumerate(x, start=1):print(index, value)
现在该索引从1到9而不是0到8
并行遍历2个集合
使用内置zip函数同时遍历2个列表,字典,等。下面是使用zip函数同时遍历2个列表的例子:
a = [1, 2, 3]b = [4, 5, 6]for (a_val, b_val) in zip(a, b):print(a_val, b_val)
将输出:
1 42 53 6
创建对象的Copy
Python中可以使用通用的copy函数复制一个对象。浅拷贝是通过使用copy.copy调用的:
import copynew_list = copy.copy(old_list)
深拷贝:
import copynew_list = copy.deepcopy(old_list)
这个StackOverflow问题对于复制一个列表的各种方法给出了很好的解释。如果你不熟悉浅拷贝和深拷贝之间的差异看一看这个解释。
浮点除法
通过将分子或分母转换为float类型,可以确保浮点除法:
answer = a/float(b)
字符串和日期相互转换
一个常见的任务是将一个字符串转换为一个datetime对象。使用strptime 函数这将很容易做到:
from datetime import datetimedate_obj = datetime.strptime('May 29 2015 2:45PM', '%B %d %Y %I:%M%p')
它的逆操作是转换一个datetime对象为一个格式化的字符串,对datetime对象使用strftime函数:
from datetime import datetimedate_obj = datetime.now()date_string = date_obj.strftime('%B %d %Y %I:%M%p')
有关格式化代码的列表和他们的用途,查看官方文档
解析JSON文件并写一个对象到JSON文件中
使用load函数可以解析JSON文件并构建一个Python对象。假定有一个叫做data.json的文件包括以下数据:
{"dog": {"lives": 1,"breeds": ["Border Collie","Pit Bull","Huskie"]},"cat": {"lives": 9,"breeds": ["Siamese","Persian","Sphynx"]}}import jsonwith open('data.json') as input_file:data = json.load(input_file)
现在data是一个对象,你可以操作它像任何Python对象一样:
print(data['cat']['lives'])output: 9
可以使用dump函数,将Python中的字典写入JSON文件中:
import jsondata = {'dog': {'legs': 4, 'breeds': ['Border Collie', 'Pit Bull', 'Huskie']}, 'cat': {'legs': 4, 'breeds': ['Siamese', 'Persian', 'Sphynx']}}with open('data.json', 'w') as output_file:json.dump(data, output_file, indent=4)
缩进参数美观打印JSON字符串以便输出更容易阅读。在这种情况下,我们指定缩进4个空格。
好了,以上内容是不是对你有很大作用呢?如果需要跟多关于Python的学习资料,可以关注并私信“01”免费领取
相关推荐
- 你要如何学习写一个数据库内核(如何实现一个最简单的数据库)
-
数据库这个方向上还有许多细分方向,每个细分方向上都有许多知识。...
- 每个大数据架构师都需要的6个基本技能
-
为了成为一名出色的大数据架构师,首先必须成为一名数据架构师,但这两种角色的职责各有不同。数据分为结构化和非结构化两种。尽管大数据为各种规模的组织提供了许多洞察和分析的机会,但处理起来非常困难,并且需...
- 警惕!Spring Data MongoDB SpEL表达式注入漏洞风险通告
-
漏洞描述近日,亚信安全CERT监控到SpringDataMongoDB存在表达式注入漏洞(CVE-2022-22980),该漏洞源于SpringDataMongoDB应用程序在使用带有SpEL...
- 既然有MySQL了,为什么还要有MongoDB?
-
大家好,我是哪吒,最近项目在使用MongoDB作为图片和文档的存储数据库,为啥不直接存MySQL里,还要搭个MongoDB集群,麻不麻烦?...
- 分布式系统核心概念及实现(分布式核心原理解析)
-
一、分布式系统核心概念1.分布式系统的定义分布式系统是由多个独立的计算机(节点)通过网络连接,协同完成任务的系统。这些节点可以是物理机、虚拟机或容器。...
- nosql之mongodb(nosql数据库是国产的吗)
-
什么是MongoDB?MongoDB是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统。...
- 如何治理非结构化数据?(非结构化化数据)
-
据调查,当前企业80%的数据为非结构化数据或半结构化数据,而结构化数据是他们管理的重点,非结构化数据却被忽视。然而,非结构化数据也有着它的价值。那么,如何治理非结构化数据?IDC调研显示,目前企业中8...
- Cloudera收购大数据加密初创企业Gazzang
-
Hadoop供应商Cloudera刚刚收购了专门研究下一代数据存储环境加密技术技术的初创企业Gazzang,但交易细节并未透露。这是Cloudera的第一笔重大收购。Gazzang成立于20...
- 全网最全95道MongoDB面试题1万字详细解析
-
1、mongodb是什么?MongoDB是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统。在高负载的情况下,添加更多的节点,可以保证服务器性能。MongoDB旨在给WEB应...
- mongodb——视图(mongodb object)
-
MongoDB视图是一个可查询的对象,其内容由其他集合或视图上的聚合管道定义。MongoDB不会将视图内容持久化到磁盘。当客户端查询视图时,MongoDB可以要求客户端拥有查询视图的权限。MongoD...
- mongodb的优缺点及应用场景(mongodb 优点 应用场景)
-
一、MongoDB是什么1、维基百科MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。...
- 5款Syslog集中系统日志常用工具对比推荐
-
一、为何要集中管理Syslog?Syslog由Linux/Unix系统及其他网络设备生成,广泛分布于整个网络。因其包含关键信息,可用于识别网络中的恶意活动,所以必须对其进行持续监控。将Sys...
- 跨平台、多数据库支持的开源数据库管理工具——DBeaver
-
简介今天给大家推荐一个开源的数据库管理工具——DBeaver。它支持多种数据库系统,包括Mysql、Oracle、PostgreSQL、SLQLite、SQLServer等。DBeaver的界面友好...
- 强烈推荐!数据库管理工具:Navicat Premium 16.3.2 (64位)
-
NavicatPremium,一款集数据迁移、数据库管理、SQL/查询编辑、智能设计、高效协作于一体的全能数据库开发工具。无论你是MySQL、MariaDB、MongoDB、SQLServer、O...
- 3 年 Java 程序员还玩不转 MongoDB,网友:失望
-
一、什么场景使用MongoDB?...
你 发表评论:
欢迎- 一周热门
-
-
Linux:Ubuntu22.04上安装python3.11,简单易上手
-
宝马阿布达比分公司推出独特M4升级套件,整套升级约在20万
-
MATLAB中图片保存的五种方法(一)(matlab中保存图片命令)
-
别再傻傻搞不清楚Workstation Player和Workstation Pro的区别了
-
Linux上使用tinyproxy快速搭建HTTP/HTTPS代理器
-
如何提取、修改、强刷A卡bios a卡刷bios工具
-
Element Plus 的 Dialog 组件实现点击遮罩层不关闭对话框
-
日本组合“岚”将于2020年12月31日停止团体活动
-
SpringCloud OpenFeign 使用 okhttp 发送 HTTP 请求与 HTTP/2 探索
-
tinymce 号称富文本编辑器世界第一,大家同意么?
-
- 最近发表
- 标签列表
-
- dialog.js (57)
- importnew (44)
- windows93网页版 (44)
- yii2框架的优缺点 (45)
- tinyeditor (45)
- qt5.5 (60)
- windowsserver2016镜像下载 (52)
- okhttputils (51)
- android-gif-drawable (53)
- 时间轴插件 (56)
- docker systemd (65)
- slider.js (47)
- android webview缓存 (46)
- pagination.js (59)
- loadjs (62)
- openssl1.0.2 (48)
- velocity模板引擎 (48)
- pcre library (47)
- zabbix微信报警脚本 (63)
- jnetpcap (49)
- pdfrenderer (43)
- fastutil (48)
- uinavigationcontroller (53)
- bitbucket.org (44)
- python websocket-client (47)