当前位置: 首页 > news >正文

宁夏建设主管部门网站网站建设微信运营公司

宁夏建设主管部门网站,网站建设微信运营公司,文案类的网站,双11主机 wordpress 2015pandas 是基于NumPy 的一种工具#xff0c;该工具是为解决数据分析任务而创建的#xff0c;这篇文章主要介绍了10分钟快速入门Pandas库,重点介绍pandas常见使用方法#xff0c;结合实例代码介绍的非常详细#xff0c;需要的朋友可以参考下目录Pandas的介绍pandas 是基于Num…pandas 是基于NumPy 的一种工具该工具是为解决数据分析任务而创建的这篇文章主要介绍了10分钟快速入门Pandas库,重点介绍pandas常见使用方法结合实例代码介绍的非常详细需要的朋友可以参考下目录Pandas的介绍pandas 是基于NumPy 的一种工具该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现它是使Python成为强大而高效的数据分析环境的重要因素之一。2008年WesMcKinney开发出的库专门用于数据挖掘的开源python库以Numpy为基础借力Numpy模块在计算方面性能高的优势基于matplotlib能够简便的画图独特的数据结构数据处理的时候经常性需要整理出表格在这里介绍pandas常见使用参考链接10 minutes to pandas https://pandas.pydata.org/docs/user_guide/10min.html#min数据结构Pandas常见的就两种数据类型Series和DataFrame可以对应理解为向量和矩阵前者是一维的后者是二维的。在DF中类似统计学中的数据组织方式一行代表一项数据一列代表一种特征用这种方式记忆能够帮你更好理解DF。需要注意的是在DF中index是行column是列。导入导出数据常使用.csv格式的文件我们在导入数据的时候使用pd.read_csv()在导出数据的时候用df.write_csv(“/data/ymz.csv”).1234567891011121314151617# 读入数据In [144]: pd.read_csv(foo.csv)Out[144]: Unnamed: 0 A B C D0 2000-01-01 0.350262 0.843315 1.798556 0.7822341 2000-01-02 -0.586873 0.034907 1.923792 -0.5626512 2000-01-03 -1.245477 -0.963406 2.269575 -1.6125663 2000-01-04 -0.252830 -0.498066 3.176886 -1.2755814 2000-01-05 -1.044057 0.118042 2.768571 0.386039.. ... ... ... ... ...995 2002-09-22-48.017654 31.474551 69.146374-47.541670996 2002-09-23-47.207912 32.627390 68.505254-48.828331997 2002-09-24-48.907133 31.990402 67.310924-49.391051998 2002-09-25-50.146062 33.716770 67.717434-49.037577999 2002-09-26-49.724318 33.479952 68.108014-48.822030 [1000rows x 5columns]12# 写出数据In [143]: df.to_csv(foo.csv)对数据进行操作对数据操作包括增创建删改查。增加数据创建数据相比较Series我们更常使用DataFrame数据类型常使用的创建DataFrame类型有两种一种是使用data创建注意data得是一个二维list/array等一种是使用字典创建。1. 使用data创建DF1234567891011121314151617181920# 使用data导入In [5]: dates pd.date_range(20130101, periods6) In [6]: datesOut[6]: DatetimeIndex([2013-01-01, 2013-01-02, 2013-01-03, 2013-01-04, 2013-01-05, 2013-01-06], dtypedatetime64[ns], freqD) In [7]: df pd.DataFrame(datanp.random.randn(6, 4), indexdates, columnslist(ABCD)) In [8]: dfOut[8]: A B C D2013-01-01 0.469112-0.282863-1.509059-1.1356322013-01-02 1.212112-0.173215 0.119209-1.0442362013-01-03-0.861849-2.104569-0.494929 1.0718042013-01-04 0.721555-0.706771-1.039575 0.2718602013-01-05-0.424972 0.567020 0.276232-1.0874012013-01-06-0.673690 0.113648-1.478427 0.5249882. 使用字典创建DF1234567891011121314151617181920# 使用字典In [9]: df2 pd.DataFrame( ...: { ...: A: 1.0, ...: B: pd.Timestamp(20130102), ...: C: pd.Series(1, indexlist(range(4)), dtypefloat32), ...: D: np.array([3] *4, dtypeint32), ...: E: pd.Categorical([test, train, test, train]), ...: F: foo, ...: } ...: ) ...: In [10]: df2Out[10]: A B C D E F0 1.02013-01-02 1.0 3 test foo1 1.02013-01-02 1.0 3 train foo2 1.02013-01-02 1.0 3 test foo3 1.02013-01-02 1.0 3 train foo3. 增加一行数据1使用loc在行尾增加增加一行数据的方法有loc, iloc, append, concat, merge。这里介绍一下locloc[index]是在一行的最后增加数据。但是你需要注意loc[index]中的index如果与已出现过的index相同则会覆盖原先index行若不相同则才会增加一行数据。2使用concat将两个DF合并concat()也是一个增加数据常用的方法常见于两个表的拼接与爬虫使用中作用类似于append()但是append()将在不久后被pandas舍弃所以还是推荐使用concat()。4. 增加一列数据增加一列数据的方法直接用[]便可例子如下Series用的比较少案例如下1234567891011In [3]: s pd.Series([1, 3, 5, np.nan, 6, 8]) In [4]: sOut[4]: 0 1.01 3.02 5.03 NaN4 6.05 8.0dtype: float64删除数据对于删除数据我们使用drop()方法并指定参数为index行或者column列1. 删除一行数据2. 删除一列数据改动数据改动一行列数据常用loc()和[]方法。1. 改动一行数据改动一行我们使用loc[][…]进行更改。2. 改动一列数据改动一列数据我们使用[]进行更改。查找数据在查找数据的时候我们常使用[]来查看行列数据配合.T来将矩阵转置。也可以使用head()tail()来查看前几行和后几行数据。1. 查看特定行数据使用.loc[index]来查看特定行数据或者[]。建议使用.loc[]方法或者.iloc[]方法loc[]通过行的名字寻找iloc[]通过索引寻找。使用类似[0:2]来查看特定行数据和python中list使用类似。这个方法其实是调用了__getitem__()方法。2. 查看特定列数据我们需要使用两层[]嵌套来访问数据例如[ [“j”, “i”] ]。3. 查看特定元素确定第几行第几列后使用.loc()方法或者.iloc()方法查找。1b a.loc[ 1, dir_name]常用操作数据分析时常用的两个操作转置和计算统计量。1. 转置使用.T便可以完成。2. 计算统计量使用.describe()。3. 舍弃一列中多余重复数据使用.drop_duplicates()1id_df self.frames_meta_sub[[time_idx, pos_idx, slice_idx]].drop_duplicates()4. 将特定列转成numpy后处理使用.to_numpy()方法将你所选择的数据全部转成二维的或者一维的ndarray需要注意的是to_numpy()并不仅仅局限于数字字符串也是可以转换的虽然这样开销比较大ndarray能存储字符串这会让你处理数据的过程变得异常简单。有几个维度取决于你取了几行或者几列。12df df[ [channel] ]ar df.to_numpy()5. 取出dataframe中特定位置的值要取出 DataFrame 中特定位置的值可以使用 .loc 或 .iloc 方法具体取决于您想要使用的索引类型。如果您使用标签索引例如行和列都使用标签名称则可以使用 .loc 方法。例如如果您有一个名为 df 的 DataFrame它具有行标签为 row_label列标签为 column_label 的元素则可以使用以下代码获取该元素的值1value df.loc[row_label, column_label]如果您使用整数位置索引例如行和列都使用整数位置则可以使用 .iloc 方法。例如如果您有一个名为 df 的 DataFrame它具有第一个行和第一个列的元素则可以使用以下代码获取该元素的值1value df.iloc[0, 0]请注意索引从零开始因此第一个行和第一个列的位置为 0。到此这篇关于10分钟快速入门Pandas库的文章就介绍到这了。点击拿去
http://www.yayakq.cn/news/4783/

相关文章:

  • 企业做网站报价公司名字大全两个字
  • 单页营销网站后台省级示范校建设专题网站
  • 网站建设教程 mysql长尾关键词什么意思
  • 期末成绩管理网站开发背景网站建设策划报价
  • 国外做直播网站公司企业网站维护
  • 贵阳网站备案核验点照相高端网站
  • 网站开发频道构架网络规划设计师视频教程下载
  • 沈阳市城市建设网站高端网站 设计
  • 网站建设丽水网站建设套路
  • 兰州做家教去哪个网站比较好宝宝投票网站怎么做
  • 电商网站建设目的及网站的优势肥西网站推广公司
  • 建一个网站大约多少钱网站建设 青少年宫
  • 洛阳有做网站开发的吗曼奇立德原画培训多少钱
  • 网页 网站免费域名注册永久
  • 网站建设与维护 前台温州网站升级
  • 做网站用什么配置的vps南昌微信网站建设
  • 网站建设怎么谈长春建筑学院
  • 租房网站开发文献综述模板二次网站开发
  • 紫网站建设合肥做网站推荐 晨飞网络
  • 阿里云建站售前咨询门户资源分享网站模板
  • 查派网站建设wordpress分表分库插件
  • 网站打不开是怎么回事深圳做自适应网站
  • 想学习网站建设微信软文范例100字
  • 公司网站的栏目设置国内做的好的帽子网站
  • html中文美食网站模板公司主页格式
  • 厦门市城市建设档案馆的网站宾馆酒店网站建设方案
  • 外贸自助建站微商城运营的主要工作
  • 开网站做淘宝客烟台网站制作山海云
  • 天津网站排名方案wordpress做导航网站
  • 专业建站公司的业务内容江苏省质量建设厅网站