当前位置: 首页 > news >正文

企业网站建设高端品牌西安招聘网

企业网站建设高端品牌,西安招聘网,网站建设 部署与发布视频教程,电视剧排行榜百度搜索风云榜文章目录 1. 介绍transform:apply: 2. 应用示例示例数据使用transform进行向量化操作使用apply进行更复杂的操作性能比较 3. 示例输出使用 transform 进行向量化操作使用 apply 进行更复杂的操作 4. transform再举例示例数据使用transform计算平均销售额…

文章目录

  • 1. 介绍
      • `transform`:
      • `apply`:
  • 2. 应用示例
      • 示例数据
      • 使用`transform`进行向量化操作
      • 使用`apply`进行更复杂的操作
      • 性能比较
  • 3. 示例输出
      • 使用 `transform` 进行向量化操作
      • 使用 `apply` 进行更复杂的操作
  • 4. transform再举例
      • 示例数据
      • 使用`transform`计算平均销售额
      • 输出

1. 介绍

在Pandas中,transformapply都可以用于对分组数据进行操作,但它们有不同的使用场景和性能特性:

transform

  1. 返回与输入相同大小的DataFrametransform函数应用于每个分组后,会将结果广播到原始数据的大小,这通常使得transform更高效。
  2. 性能优化transform通常会尝试用更高效的内部机制来执行向量化操作。
  3. 限制:由于结果会被广播到原始数据的大小,因此transform应用的函数应返回标量值或与输入组相同大小的数组。

apply

  1. 更为通用apply适用于更复杂的操作,包括改变DataFrame的大小。
  2. 灵活性apply可以用于执行更多种类的操作,例如,可以返回DataFrame、Series或标量。
  3. 可能性能较低apply的通用性通常意味着它在性能上不如transform高效,尤其是在需要广播结果到原始数据大小的场景。

因此,当操作可以使用transform完成时,通常更推荐使用transform,以获取更好的性能。当需要更大的灵活性时(例如,改变输出的形状或进行更复杂的计算),则可以使用apply

2. 应用示例

当然,以下是一些应用示例来说明transformapply的不同用途和性能特性。

示例数据

假设我们有以下DataFrame,它表示三个不同产品在不同日期的销售额:

import pandas as pddata = {'Date': ['2021-01-01', '2021-01-01', '2021-01-02', '2021-01-02', '2021-01-03', '2021-01-03'],'Product': ['A', 'B', 'A', 'A', 'B', 'C'],'Revenue': [100, 150, 200, 50, 300, 400]}
df = pd.DataFrame(data)

使用transform进行向量化操作

如果我们想要在原DataFrame中添加一个新列,该列表示每个产品的总销售额,我们可以使用transform

df['Total_Revenue_By_Product'] = df.groupby('Product')['Revenue'].transform('sum')

transform将自动广播每个组的结果(即每个产品的总销售额)到该组内所有行。

使用apply进行更复杂的操作

假设我们想要获得每个产品最高单日销售额的日期,这是一个更复杂的操作,可以使用apply

def get_max_revenue_date(group):return group.loc[group['Revenue'].idxmax(), 'Date']max_revenue_date = df.groupby('Product').apply(get_max_revenue_date)

这里,apply允许我们对每个组使用更复杂的函数,并且返回一个与输入形状不同的结果。

性能比较

通常,在可以使用transform的场合,使用transform会更高效。例如,如果我们有一个非常大的DataFrame,使用transform来计算组平均值通常会比使用apply更快。

3. 示例输出

当然,让我说明一下各个示例的输出。

使用 transform 进行向量化操作

如果我们运行这段代码:

df['Total_Revenue_By_Product'] = df.groupby('Product')['Revenue'].transform('sum')

df 会被更新,新增了一个列 Total_Revenue_By_Product,它包含每个产品的总销售额,并会广播到该产品的所有记录。

更新后的 df 如下:

         Date Product  Revenue  Total_Revenue_By_Product
0  2021-01-01       A      100                       350
1  2021-01-01       B      150                       450
2  2021-01-02       A      200                       350
3  2021-01-02       A       50                       350
4  2021-01-03       B      300                       450
5  2021-01-03       C      400                       400

如您所见,产品A、B、和C的总销售额分别是350、450和400,这些值被广播到了每一行对应的产品。

使用 apply 进行更复杂的操作

如果我们运行这段代码:

def get_max_revenue_date(group):return group.loc[group['Revenue'].idxmax(), 'Date']max_revenue_date = df.groupby('Product').apply(get_max_revenue_date)

max_revenue_date 会是一个 Series,其中包含每个产品销售额最高的日期:

Product
A    2021-01-02
B    2021-01-03
C    2021-01-03
dtype: object

这里,我们可以看到产品A、B、和C销售额最高的日期分别是 2021-01-022021-01-032021-01-03

4. transform再举例

当然,下面是另一个使用transform的例子。这次,我们将计算每个产品的平均销售额,并将该信息添加为新的列。

示例数据

我们还是使用相同的数据集:

data = {'Date': ['2021-01-01', '2021-01-01', '2021-01-02', '2021-01-02', '2021-01-03', '2021-01-03'],'Product': ['A', 'B', 'A', 'A', 'B', 'C'],'Revenue': [100, 150, 200, 50, 300, 400]}
df = pd.DataFrame(data)

使用transform计算平均销售额

df['Average_Revenue_By_Product'] = df.groupby('Product')['Revenue'].transform('mean')

运行这行代码后,df会更新,新增一个列Average_Revenue_By_Product,其中包含每个产品的平均销售额。

输出

更新后的df会是这样:

         Date Product  Revenue  Average_Revenue_By_Product
0  2021-01-01       A      100                  116.666667
1  2021-01-01       B      150                  225.000000
2  2021-01-02       A      200                  116.666667
3  2021-01-02       A       50                  116.666667
4  2021-01-03       B      300                  225.000000
5  2021-01-03       C      400                  400.000000

如您所见,产品A、B、和C的平均销售额分别是约116.67、225和400,这些值被广播到了每一行对应的产品。

http://www.yayakq.cn/news/748539/

相关文章:

  • 网站建设详细需求文档网页制作的基本步骤和教程
  • 烟台网站建设精通臻动传媒广州网站制作知名 乐云践新
  • 广州住建网站东莞公司网上推广
  • 高端定制网站做炫光素材的网站
  • 网站多语言界面建设方案简洁 网站模板
  • 做网站的图片要求大小wordpress注册邮箱设置
  • 多语言建设外贸网站制作照片的软件app
  • 网站建设手机端管网网上销售平台怎么做
  • 网络公司做网站的合同饰品做商城网站模式
  • 手机在线制作表白网站济南网络公司招聘
  • mc做弊端网站电销卡购买平台
  • 网站如何在百度韶山seo快速排名
  • 漳州市住房城乡建设局网站简单展示网站模板
  • 软件开发网站开发嘉定网站设计制作托管维护
  • 下载了网站模板怎么用网站建设软件kan
  • 滤芯网站怎么做wordpress建局域网
  • 网站 布局网页设计师的发展前景
  • 免费网站建设推广在哪个网站做外贸生意好
  • 贵阳网站设计找哪家wordpress更改固定连接404
  • 宿迁交通工程建设有限公司网站百度做自己的网站
  • 房地产网站建设意义绍兴网站建设费用
  • 网站服务器是什么微信公众平台模板制作
  • 手机网站打不开是什么原因造成的平台公司拿地
  • 厦门网站建设外贸一键搭建论坛
  • 外国人做中国数学视频网站wordpress移动端标签
  • php网站开发注意问题影视公司网站设计
  • 做网站小语种翻译多少钱广州个性化网站建设
  • 贵州企业网站建设北京网页制作设计公司
  • 企业网站要求工作室项目推荐
  • 台州网站注册 公司wordpress 动态加载