💡 作者:韩信子@ShowMeAI
📘 数据分析实战系列:https://www.showmeai.tech/tutorials/40
📘 本文地址:https://www.showmeai.tech/article-detail/394
📢 声明:版权所有,转载请联系平台与作者并注明出处
📢 收藏ShowMeAI查看更多精彩内容
如果你是数据科学家、数据分析师、机器学习工程师,或者任何 python 数据从业者,你一定会高频使用 pandas 这个工具库——它操作简单功能强大,可以很方便完成数据处理、数据分析、数据变换等过程,优雅且便捷。
📘 Python数据分析实战教程
在本文中,ShowMeAI给大家汇总介绍 21 个 Pandas 的提示和技巧,熟练掌握它们,可以让我们的代码保持整洁高效。
如果我们希望对操作,但是不希望改变原始,我们可以使用制作副本,如下例所示:
如果你想获得 Pandas 的一列的计数统计,可以使用和组合,如果要获取2列或更多列组成的分组的计数,可以使用和组合。如下所示:
大家都知道,我们可以使用获取列里的取值计数,但是,如果要获取列中某个值的百分比,我们可以添加至参数设置来完成:
我们知道可以通过很方便进行字段取值计数,但是自动忽略缺失值,如果要对缺失值进行计数,要设置参数。
如下例所示,如果我们要对列的取值统计并进行计数过滤,使用会报错,使用是恰当的方法,如下例所示:
Markdown 是一种轻量级标记语言,用于使用纯文本编辑器创建格式化文本。我们有时候会想在 markdown 格式中打印一个,这时可以使用功能:
我们经常会使用对数据进行分组并统计每组的聚合统计信息,例如计数、平均值、中位数等。如果您想将分组后的数据字段整合成列表,可以使用,如下示例:
类似于上例,如果你想把一个中某个字符串字段(列)展开为一个列表,然后将列表中的元素拆分成多行,可以使用和组合,如下例:
如果要计算两个 DataFrame 的行或列之间的相关性,可以使用:
交叉制表支持我们分析多个变量之间的关系,可以使用功能:
我们可以使用功能进行数据过滤,它支持以简洁的方式叠加很多个条件。
如果要将 DataFrame 从宽表格式转换为长表格式,可以使用。 如下例,我们可以使用将多列(“Aldi”、“Walmart”、“Costco”)转换为一列(“store”)的值。
我们经常会使用分组聚合的功能,如果要为聚合分配新名称,可以使用方法:
对两个 DataFrame 进行联合操作,实现合并的功能。
方法根据 DataFrame 的行索引和列索引,对比两个 DataFrame 中相同位置的数据,优先取非空的数据进行合并。
如果调用方法的 df1 中数据非空,则结果保留 df1 中的数据,如果 df1 中的数据为空值且传入方法的 df2 中数据非空,则结果取 df2 中的数据,如果 df1 和 df2 中的数据都为空值,则结果保留 df1 中的空值(空值有三种:、 和 )。
即使两个 DataFrame 的形状不相同也不受影响,联合时主要是根据索引来定位数据的位置。
我们可以根据名称中的子字符串过滤 pandas DataFrame 的列,具体是使用 pandas 的功能。
对于 DataFrame 中的列,我们可以调整其数据类型,使用可以快速将它转换为我们需要的数据类型。
在我们处理数据的时候,有时需要根据某个列进行计算得到一个新列,以便后续使用,相当于是根据已知列得到新的列,这个时候函数非常方便。
我们可以使用可用于快速合并来自各种网站的表格,我们不用关心它是如何抓取网站HTML的。
如果我们需要对数据字段进行排序,可以使用,但是它会对所有数据排序,如果我们要获取最大或者最小的 n 个数,可以利用和。
这里用到的数据集是 🏆IMDB电影评分数据集,大家可以通过 ShowMeAI 的百度网盘地址下载。
🏆 实战数据集下载(百度网盘):公✦众✦号『ShowMeAI研究中心』回复『实战』,或者点击 这里 获取本文 [65]资深数据科学家整理的21个Pandas技巧 『imdbratings数据集』
⭐ ShowMeAI官方GitHub:https://github.com/ShowMeAI-Hub
pandas 的函数可以返回字段每个取值的排名。
在以下示例中,创建了一个新的排名列,该列按学生的分数对学生进行排名:
可以为 dataframe 添加颜色样式,增加更多的可读性。Pandas 具有 style 属性,可以设置颜色应用于 DataFrame。
📘 Python数据分析实战教程 :https://www.showmeai.tech/tutorials/40📘 数据科学工具库速查表 | Pandas 速查表:https://www.showmeai.tech/article-detail/101
版权声明
本文仅代表作者观点,不代表xx立场。
本文系作者授权xx发表,未经许可,不得转载。
评论列表
发表评论