百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Python库大全(上)Python的所有库都在这里了,建议收藏

myzbx 2025-03-03 19:26 8 浏览

什么是Python

Python作为当然最热门的编程语言之一,拥有超高的人气,随着大数据和人工智能的发展,Python也与多种科技深深绑定。

什么是Python库

从代码角度讲:库就是一堆类(class)和函数(function)的集合。

从应用角度讲:库类似生活中的工具箱,箱子里有很多做其他事情必不可少的工具。举一个例子,如果你想抓取某网站的数据或图片,那么你就需要能处理相关底层网络连接的代码,而这些代码都已经被写好了,你只需要调用库里的函数或类,能够提高开发效率。

面对不同的情况,自然需要不同的工具箱,那么,都有哪些Python库呢?




大数据与科学计算

pycuda/opencl : GPU高性能并发计算Pandas,python实现的类似R语言的数据统计、分析平台。基于NumPy和Matplotlib开发的,主要用于数据分析和数据可视化,它的数据结构DataFrame和R语言里的data.frame很像,特别是对于时间序列数据有自己的一套分析机制,非常不错;

Open Mining : 商业智能(BI),Pandas的Web界面。blaze,NumPy和Pandas大数据界面。 SciPy,开源的Python算法库和数学工具包,SciPy包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算;

ScientificPython : 一组经过挑选的Python程序模块,用于科学计算,包括几何学(矢量、张量、变换、矢量和张量场),四元数,自动求导数,(线性)插值,多项式,基础统计学,非线性最小二乘拟合,单位计算,Fortran兼容的文本格式,通过VRML的3D显示,以及两个Tk小工具,分别用于绘制线图和3D网格模型。 此外还具有到netCDF,MPI和BSPlib库的接口;

NumPy : 科学计算库,提供了矩阵,线性代数,傅立叶变换等等的解决方案, 最常用的是它的N维数组对象. NumPy提供了两种基本的对象: ndarray(N-dimensional array object)和 ufunc(universal function object;

ndarray : 是存储单一数据类型的多维数组,而ufunc则是能够对数组进行处理的函数。 Cvxopt,最优化计算包,可进行线性规划、二次规划、半正定规划等的计算。 Numba,科学计算速度优化编译器。pymvpa2,是为大数据集提供统计学习分析的Python工具包,它提供了一个灵活可扩展的框架;

PyDy : Python动态建模函数库

SymPy : 符号数学的Python库

statsmodels : Python的统计建模和计量经济学

astropy : 天文学界的Python库

orange : 橙色,数据挖掘,数据可视化,通过可视化编程或Python脚本学习机分析;

RDKit : 化学信息学和机器学习的软件

Open Babel : 巴贝尔,开放的化学工具箱;

cclib : 化学软件包的计算函数库

Biopython : 免费的生物计算工具包

bccb : 生物学分析相关的代码集

bcbio-nextgen : 提供完全自动化、高通量、测序分析的工具包;

visvis : 可视化计算模块库,可进行一维到四维数据的可视化;

MapReduce : 是Google提出的一个软件[架构],用于大规模数据集(大于1TB)的并行运算。 概念“Map(映射)”和“Reduce(归纳)”,及他们的主要思想,都是从函数式编程语言借来的MapReduce函数库。Framworks and libraries for MapReduce.,PySpark,[Spark]的Python API。dpark,Spark的Python克隆,Python中的MapReduce框架。luigi,为批量工作,建立复杂的管道。mrjob,运行在[Hadoop],或亚马逊网络服务的,MapReduce工作。




人工智能与机器学习

NLTK(natural language toolkit) : 是python的自然语言处理工具包。2001年推出,包括了大量的资料库,以及自然语言处理方面的算法实现: 分词, 词根计算, 分类, 语义分析等;

Pattern : 数据挖掘模块,包括自然语言处理,机器学习工具,等等;

textblob : 提供API为自然语言处理、分解NLP任务。基于NLTK和Pattern模块;

jieba : 结巴,中文分词工具。snownlp,用于处理中文文本库;

loso : 中文分词函数库

genius : 中文CRF基础库,条件随机场(conditional random field,简称 CRF),是一种鉴别式机率模型,是随机场的一种,常用于标注或分析序列资料,如自然语言文字或是生物序列Gensim。一个相当专业的主题模型Python工具包,无论是代码还是文档,可用于如何计算两个文档的相似度LIBSVM。

scikits.learn : 构建在SciPy之上用于机器学习的 Python 模块。它包括简单而高效的工具,可用于数据挖掘和数据分析;

PyMC : 主要用来做Bayesian分析。Orange,基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能;

Milk : 机器学习工具箱,其重点是提供监督分类法与几种有效的分类分析:SVMs(基于libsvm),K-NN,随机森林经济和决策树。

PyMVPA(Multivariate Pattern Analysis in Python) : 是为大数据集提供统计学习分析的Python工具包,它提供了一个灵活可扩展的框架。它提供的功能有分类、回归、特征选择、数据导入导出、可视化等NuPIC,开源人工智能平台;

hebel : GPU加速,[深度学习]Python库;

gensim : 机器学习库

pybrain : 机器学习模块,它的目标是为机器学习任务提供灵活、易应、强大的机器学习算法;

pybrain : 包括神经网络、强化学习(及二者结合)、无监督学习、进化算法。以神经网络为核心,所有的训练方法都以神经网络为一个实例Mahout,是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序;

Mahout : 包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中;

Crab : 灵活的,快速的推荐引擎。python-recsys,娱乐系统分析,推荐系统。vowpal_porpoise,Vowpal Wabbit轻量级Python封装;

Theano : 用来定义、优化和模拟数学表达式计算,用于高效地解决多维数组的计算问题的python软件包。它使得写深度学习模型更加容易,同时也给出了一些关于在GPU上训练它们的选项;




数据分析

Chardet : 字符编码探测器,可以自动检测文本、网页、xml的编码;

colorama : 主要用来给文本添加各种颜色,并且非常简单易用;

Prettytable : 主要用于在终端或浏览器端构建格式化的输出

difflib : Python标准库,计算文本差异;

Levenshtein : 快速计算字符串的相似度

fuzzywuzzy : 字符串模糊匹配

esmre : 正则表达式的加速器

shortuuid : 一组简洁URL/UUID函数库

ftfy : Unicode文本工具7

unidecode : ascii和Unicode文本转换函数

xpinyin : 将汉字转换为拼音的函数库

pangu.py : 调整对中日韩文字当中的字母、数字间距;

pyfiglet : Python写的figlet程序,使用字符组成ASCII艺术图片;

uniout : 提取字符串中可读写的字符

awesome slugify :一个Python slugify库,用于处理Unicode。

python-slugify : 转换Unicode为ASCII内码的slugify函数库

unicode-slugify : 生成unicode内码,Django的依赖包。

ply : Python版的lex和yacc的解析工具

phonenumbers : 解析电话号码,格式,存储和验证的国际电话号码

python-user-agents : 浏览器的用户代理(user-agents)的解析器

sqlparse : SQL解析器

pygments : 一个通用的语法高亮工具

python-nameparser : 解析人名,分解为单独的成分;

pyparsing : 通用解析器生成框架

tablib : 表格数据格式,包括,XLS、CSV,JSON,YAML;

python-docx : docx文档读取,查询和修改,微软Word 2007 / 2008的docx文件;

xlwt/xlrd : 读写Excel格式的数据文件

xlsxwriter : 创建Excel格式的xlsx文件

xlwings : 利用Python调用Excel

csvkit : CSV文件工具包

marmir : 把Python[数据结构],转化为电子表格;

pdfminer : 从PDF文件中提取信息

pypdf2 : 合并和转换PDF页面的函数库

Python-Markdown : 轻量级标记语言Markdown的Python实现

Mistune : 快速、全功能的纯Python编写的Markdown解释器;

dateutil : 标准的Python官方datetime模块的扩展包,字符串日期工具,其中parser是根据字符串解析成datetime,而rrule是则是根据定义的规则来生成datetime;

arrow : 更好的日期和时间处理Python库

chronyk : 一个Python 3版函数库,用于解析人写的时间和日期;

delorean : 清理期时间的函数库

when.py : 为见的日期和时间,提供人性化的功能;

moment : 类似Moment.js的日期/时间Python库

pytz : 世界时区,使用tz database时区信息[数据库] ;

BeautifulSoup : 基于Python的HTML/XML解析器,简单易用, 功能很强大,即使是有bug,有问题的html代码,也可以解析;

lxml : 快速,易用、灵活的HTML和XML处理库,功能超强,在遇到有缺陷、不规范的xml时,Python自带的xml处理器可能无法解析。报错时,程序会尝试再用lxml的修复模式解析;

htmlparser : 官方版解析HTML DOM树,偶尔搞搞命令行自动表单提交用得上;

pyyaml : Python版本的YAML解释器

html5lib : 解析和序列化HTML文档和片段

pyquery : 类似[jQuery]的的HTML解释器函数库

cssutils : Python CSS库

MarkupSafe : XML或HTML / XHTML安全字符串标记工具

cssutils - ACSS library for Python., MarkupSafe - Implements a XML/HTML/XHTML bleach : 漂白,基于HTML的白名单函数库;

xmltodict : 类似JSON的XML工具包

xhtml2pdf : HTML / CSS格式转换器,看生成pdf文档;

untangle : 把XML文档,转换为Python对象,方便访问;




文件处理

Mimetypes : Python标准库,映射文件名到MIME类型;

imghdr : Python标准库,确定图像类型。python-magic,libmagic文件类型识别库,Python接口格式。path.py,os.path模块的二次封装;

watchdog : 一组API和shell实用程序,用于监视文件系统事件;

Unipath : 面向对象的文件/目录的操作工具包

pathlib : (Python 3.4版已经作为Python标准库),一个跨平台,面向path的函数库;

pickle/cPickle : python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象;

cPickle : 是[C语言]实现的版本,速度更快;

ConfigParser : Python标准库,INI文件解析器;

configobj : INI文件解析器。config,分层次配置,logging作者编写;

profig : 多格式配置转换工具

logging : Python标准库,日志文件生成管理函数库;

logbook : logging的替换品

Sentry : 实时log服务器。Raven,哨兵Sentry的Python客户端;

Sphinx : 斯芬克斯(狮身人面像),Python文档生成器;

reStructuredText : 标记语法和解析工具,Docutils组件。mkdocs,Markdown格式文档生成器;

pycco : 简单快速、编程风格的文档生成器;

pdoc : 自动生成的Python库API文档epydoc,从源码注释中生成各种格式文档的工具;




图像处理

PIL(Python Image Library) : 基于Python的图像处理库,功能强大,对图形文件的格式支持广泛,内置许多图像处理函数,如图像增强、滤波[算法]等Pillow,图像处理库,PIL图像库的分支和升级替代产品。Matplotlib,著名的绘图库,提供了整套和matlab相似的命令API,用以绘制一些高质量的数学二维图形,十分适合交互式地进行制图。brewer2mpl,有一个专业的python配色工具包,提供了从美术角度来讲的精美配色;

PyGame : 基于Python的多媒体开发和游戏软件开发模块,包含大量游戏和图像处理功能Box2d,开源的2d物理引擎,愤怒的小鸟就是使用了这款物理引擎进行开发的,Box2d物理引擎内部模拟了一个世界,你可以设置这个世界里的重力,然后往这个世界里添加各种物体,以及他们的一些物理特性,比如质量,摩擦,阻尼等等;

Pymunk : 类似box2d的开源物理图形模拟库OpenCV, 目前最好的开源图像/视觉库,包括图像处理和计算机视觉方面、[机器学习]的很多通用算法。SimpleCV,计算机视觉开源框架,类似opencv。VTK,视觉化工具函式库(VTK, Visualization Toolkit)是一个开放源码,跨平台、支援平行处理(VTK曾用于处理大小近乎1个Petabyte的资料,其平台为美国Los Alamos国家实验室所有的具1024个处理器之大型系统)的图形应用函式库;

Aggdraw : 开源图像库,几乎涵盖了2d image操作的所有功能,使用起来非常灵活Pycairo,开源矢量绘图库Cairo开罗的python接口,cairo提供在多个背景下做2-D的绘图,高级的更可以使用硬件加速功能。wand,Python绑定魔杖工具(MagickWand),C语言API接口;

thumbor : 智能成像工具,可调整大小和翻转图像;

imgSeek : 查询相似的图像

python-qrcode : 纯Python的二维码(QR码)生成器

pyBarcode : 创建条码,无需PIL模块;

pygram : Instagram 像图像过滤器

Quads : 基于四叉树的计算机艺术

nude.py : 裸体检测函数

scikit-image : scikit工具箱的图像处理库

hmap : 图像直方图工具

bokeh : 交互的Web绘图

plotly : Web协同的Python和Matplotlib绘制

vincent : 文森特,Python Vega的函数库

d3py :Python绘图库,基于D3.JS, ggplot -API兼容R语言的ggplot2.Kartograph.py,在Python绘制漂亮的SVG地图。pygal, SVG图表的创造者;

pygraphviz : Graphviz的Python接口

Fonttlools : ttf字体工具函数包,用于fontforge、ttx等字体软件;




数据库

MySQLdb : 成熟的[MySQL]数据库模块

Baresql : SQL数据库包ZODB,Python本地对象数据库,一个K-V对象图数据库;

pickledb : 简单和轻量级的K-V键值存储

TinyDB : 轻量级,面向文档的数据库;

mysql-python : MySQL的Python工具库

mysqlclient : mysql-python分支,支持Python 3

PyMySQL : 纯Python写的 MySQL驱动程序,兼容mysql-python;

mysql-connector-python : MySQL连接器,来自[Oracle],纯Python编写;

oursql : MySQL连接器,提供本地话指令语句和BLOBs支持;

psycopg2 : 最流行的Python PostgreSQL适配器

txpostgres : 于Twisted的异步驱动,用于PostgreSQL;

queries : psycopg2函数库,用于PostgreSQL;

dataset : 存储Python字典数据,用于SQLite,MySQL和PostgreSQL;

cassandra-python-driver : 开源分布式NoSQL数据库系统Apache Cassandra系统的Python驱动

pycassa : 简化的cassandra数据库Python驱动

HappyBase : 友好的Apache [Hbase]的函数库

PyMongo : MongoDB官方客户端

plyvel : LevelDB快速和功能丰富的Python接口

redis-py : redis客户端

py2neo : Python客户端(基于Neo4j的RESTful接口)

telephus : 基于Twisted的cassandra客户端

txRedis : 基于Twisted的Redis客户端

本篇介绍六种Python库,由于篇幅原因,其余内容下期更新。

相关推荐

攀升战境S5电竞主机评测:NVIDIA RTX 3060实力助阵,光追游戏走起

此次笔者将为玩家们推荐一款游戏主机——攀升战境S5。该主机是攀升电脑今年力推的游戏装备,主机采用一线品牌配件,特别是在显卡选用上严苛把关,精选GeForceRTX30系列显卡,玩家们大可以放心选购...

慎买-神牛闪光灯兼容性问题:神牛V350&松下S5M2

神牛V350和松下S5M2的兼容性问题。大家好,我是向往闪光灯人像的Fish。国庆期间,我购买了神牛V350闪光灯和神牛X2T引闪器,但这成为了我的噩梦。我原以为客服和松友们说这款闪光灯在松下S5M2...

Acer蜂鸟持续办公一整天(acer 蜂鸟s5)

移动办公在工作节奏日益加快的今天越来越普遍,目前大部分工作无法在手持设备上完成,笔记本依然是移动办公最明智的选择。为了实现移动办公,很多笔记本越做越轻薄,性能也越来越强,而续航却一直没有很大提升。笔者...

职业车手明年会骑什么?2021赛季各大世巡赛车队使用器材一览

新年的钟声即将敲响,意味着充满魔幻色彩的2020年即将过去。受新冠肺炎的影响,2020年的赛季非常不同寻常。因这一原因不得不延迟举行的各种比赛导致许多车队的赞助商无法得到足够曝光,这也间接导致了许多车...

三星部分手机系统升级路线图流出(三星系统在哪升级)

三星包括Note3和S5在内的手机在升级到4.4.2系统之后一直没有什么系统升级的消息,而最近流出的一张三星的系统升级路线图中出现了一共13台手机升级KTU84P(也就是Android4.4.4)...

索尼Xperia Z3配置大曝光:升级并不大

IT之家(www.ithome.com):索尼XperiaZ3配置大曝光:升级并不大索尼明天就会在IFA2014大会上发布其下代旗舰XperiaZ3智能手机,目前网上曝光了其原型机,并且机身背后...

不进反退 三星Exynos 5433只能运行32位模式?

三星GalaxyNote4将带有两个版本,除了国行使用的骁龙805以外,还有三星自家的Exynos5433版本。而这颗SoC的详细信息三星并没有公布,据外媒Anandtech称,他们从源码中确认...

尼康Z6III测评:对比EOS R6 II、A7M4、S5IIX

摄影器材测评网站DPReview刚刚发布了尼康Z6III的完整图文测评,该机获得金奖评级,得分达到91%。以下是该文章的摘录——尼康Z6III核心规格:2400万像素“部分堆栈式”传感器RAW连拍:机...

赛默飞Ion S5首批数据公布,玩爆前任PGMTM系列

北美时间9月1日,赛默飞发布了两款最新的NGS系统IonS5和IonS5XL,旨在提供更加简捷的靶向测序流程。10月29日IonS5测序仪的首批实验数据产生于阜外医院。阜外医院研究人员选用了主...

Excel技巧:快速制作批量文件夹,省时省力,加强工作效率

大家好,如果公司领导要求按人员姓名制作文件夹,以一人一档的形式呈现人员档案,办公人员一个一个制作费时费力,而且效力低下,今天为大家介绍快捷制作批量文件夹的方法下面我们用图片来进行演示操作打开表格,选...

国行、港版、美版Apple watch各版本售价一览

今天凌晨,苹果牌手表正式发布,苹果开始正式进入可穿戴设备领域,除了功能和外观,我相信大家更关心的是价格问题了,小编就将国行、港版、美版的Applewatch售价做一总结,以供参考。国行:美版:港版:...

松下全画幅微单S5和S1到底哪里不一样?

Hello,我是ET,欢迎大家来到我的“相机笔记”。————9月2日晚,松下正式发布了第4款全画幅微单LUMIXS5。这一篇,我们主要来说松下LUMIXS5和LUMIXS1到底有哪些区别...

融会贯通之典范 神舟S7-2021S5评测

便携、性能、续航,这简简单单的六个字道出了这么些年来笔记本电脑的设计方向,可是由于底层技术、模具设计等等原因,这三点并不能很好的融合在一起。虽说闻道有先后,术业有专攻,但能够有一台融会贯通的产品,不是...

三国志战略版:S5赛季装X指南,开荒不是一成不变,需要因地制宜

大家好我是零氪玩家花席,S5赛季已经开始,因为S5赛季的野地阵容和S4赛季没有区别,所以S5赛季开荒相对不难。你在S4有经验,并且多了很多武将和战法,还能用150赛季功勋兑换7500战法点。S5赛季新...

聊聊松下S5M2和S5M2X的区别(松下s5k和s5c有什么区别)

先简单说下哪里不同:12bitRAWHDMI外录支持直接将视频录制到USB-SSD上多了All-Intra和ProRes编码支持有线/无线IP推流,USB网络连接黑化的机身不过要特别强调一下,S5...