当前位置: 首页 > news >正文

青海和城乡建设厅网站长春网站免费制作

青海和城乡建设厅网站,长春网站免费制作,微博同步到wordpress,提供做pc端网站数据科学 一、Numpy二、Pandas三、Matplotlib参考链接 一、Numpy 在numpy中以np.nan表示缺失值,它是一个浮点数。 二、Pandas 1、如要选出col0在30到80之间的行中col3与col1之差为奇数的行,或者col2大于50中的行col3超过col1均值的行,可以…

数据科学

    • 一、Numpy
    • 二、Pandas
    • 三、Matplotlib
    • 参考链接

一、Numpy

在numpy中以np.nan表示缺失值,它是一个浮点数。

二、Pandas

1、如要选出col0在30到80之间的行中col3与col1之差为奇数的行,或者col2大于50中的行col3超过col1均值的行,可以如下写出:

c11 = df["col 0"].between(30, 80)
c12 = (df["col 3"] - df["col 1"]) % 2 ==1
c21 = df["col 2"] > 50
c22 = df["col 3"] > df["col 1"].mean()
df.loc[(c11 & c12) | (c21 & c22)]

2、分别统计每一列的缺失值比例和每一行的缺失值比例

df.isna().mean()  # 默认mean的axis参数为0,按照行方向计算列的均值。
df.isna().mean(axis=1)

如果想要统计每列包含的缺失值个数,只需把mean替换为sum即可。
如果想知道缺失的行或列具体实哪一些,可以如下操作:

df[df.isna().sum(1) >= 2]

在pandas中,删除某些包含缺失值的行或列可以通过dropna函数来实现:

df.dropna(axis=1,thresh=90)  # axis为1和0分别指删除列和行 
# thresh表示非缺失值没有达到这个数量的相应维度会被删除。

3、DataFrame.plot( )函数
使用pandas.DataFrame的plot方法绘制图像会按照数据的每一列绘制一条曲线,默认按照列columns的名称在适当的位置展示图例,比matplotlib绘制节省时间,且DataFrame格式的数据更规范,方便向量化及计算。

DataFrame.plot(x=None, y=None, kind='line', ax=None, subplots=False, sharex=None, sharey=False, layout=None, figsize=None, use_index=True, title=None, grid=None, legend=True, style=None, logx=False, logy=False, loglog=False, xticks=None, yticks=None, xlim=None, ylim=None, rot=None, fontsize=None, colormap=None, position=0.5, table=False, yerr=None, xerr=None, stacked=True/False, sort_columns=False, secondary_y=False, mark_right=True, **kwds)

4、将数据写入到Excel的多个sheet
有时一个excel内会有多个sheet。但是将两组数据通过to_excel函数先后保存到一个excel内会发现只有后一组保存的数据,因为前一组的数据被后写入的数据覆盖了。

df1.to_excel('xxx.xlsx',sheet_name='df1')
df2.to_excel('xxx.xlsx',sheet_name='df2')

使用pd.ExcelWriter建立一个writer,然后,将df1,df2都使用to_excel(writer, sheet名),最后一次性将这些数据保存,并关闭writer就完成了

writer = pd.ExcelWriter('xxx.xlsx')
df1.to_excel(writer,sheet_name="df1")
df2.to_excel(writer,sheet_name="df2")writer.save()
writer.close()

这样会覆盖我们原有的excel数据,如果不想覆盖,可以:

writer = pd.ExcelWriter('保存.xlsx')  # 如果不存在,会自动创建excel
df = pd.read_excel("xxx.xlsx", sheet_name=xxx)
......
df_res.to_excel(writer, sheet_name=xxx, index=False)

5、找出每行或列的最大值所在的列索引或行索引:

返回一列最大值所在行的行索引df.idxmax(),默认参数为0

若参数设置为1,则为一行最大值所在列的列索引df.idxmax(1)

(取最小值为df.idxmin()

三、Matplotlib

1、设置x轴为时间刻度

imoort pandas as pd
import matplotlib.pyplot as plt
import matplotlib.dates as mdatesdf = pd.read_excel("***.xlsx")
# 绘制图像
fig, ax = plt.subplots()
ax.plot(df['time'], df['*'])
# 配置x轴时间间隔
time_format = mdates.DateFormatter('%H:%M:%S')
ax.xaxis.set_major_formatter(time_format)
ax.xaxis.set_major_locator(mdates.MinuteLocator(interval=240))
# 设置刻度位置
ax.set_xticks(pd.date_range(df['time'][0], df['time'][-1], freq='4h'))
# 还可以使用ax.set_xticklabels()来设置刻度的标签
# 设置开始坐标
ax.set_xlim(df['time'][0], df['time'][-1])
# 旋转x轴标签
fig.autofmt_xdate()
# 展示图形
plt.show()

参考链接

https://github.com/datawhalechina/joyful-pandas
https://github.com/datawhalechina/powerful-numpy
https://github.com/datawhalechina/fantastic-matplotlib

http://www.yayakq.cn/news/818141/

相关文章:

  • 江苏建设厅网站电话多少请问怎么做网站
  • 做问卷用哪个网站深圳关键词推广整站优化
  • 电子商务网站建设自建团队广告设计总结
  • 命理网站开发深圳品牌策划设计方案
  • 网站维护套餐美康优选网站怎么做的
  • 现在手机网站用什么做的wordpress数据库作用
  • 广州企业网站找哪里小企业想做网站推广找哪家强
  • 潍坊米搜网站建设北京企迪网站建设公司
  • 周到的网站建设推广免费企业网站模板psd
  • 做五金行业的外贸网站XART视频库WordPress
  • 织梦网站打开空白平面设计和室内设计的区别
  • 网站开发已有的知识储备平台推广使用机制方案
  • 一个公司做两个网站可以吗wordpress付费查看
  • 提供网站建设管理化妆品购物网站模板下载
  • 做网站电话销售的话术seo谷歌推广
  • win7 iis创建网站营销策划公司名字大气好听
  • 网站建设深圳官网查看网站国际联网备案号
  • 天津网站制作重点跨境电商官方网站建设
  • 服务中心网站建设方案山西传染病最新消息今天
  • 微信平台APP网站建设怎么样一级域名二级域名哪个好
  • openshift 做网站优秀的网站举例
  • 怎么制作企业网站网站开发采购合同模板下载
  • 网站制作方法餐饮类网站模板
  • 做名人故居的网站多少钱广告设计与制作学啥
  • ui做的好的网站有哪些2023最近的新闻大事10条
  • 百胜招聘 网站开发网站建设公司哪个好呀net网站建设
  • 做网站要会什么wordpress 回复评论
  • 怎样使用自己的电脑做网站z怎么做优惠券网站
  • 贵州省建设厅建筑质监站网站网站备案收费
  • 家居用品东莞网站建设昆山建设局网站首页