当前位置: 首页 > news >正文

高淳建设局网站西安建设工程信息网官网xiancin

高淳建设局网站,西安建设工程信息网官网xiancin,东莞公司注册地址变更流程,绵阳门户网站建设读取合并单元格并保留合并信息 读取合并单元格并保留合并信息清除各单元格的空格和换行符,并去除列名中的空格和换行符 读取合并单元格并保留合并信息 当我们只是使用 pandas 的 read_excel 方法读取 Excel 文件时,我们可能会遇到一个很棘手的问题&…

读取合并单元格并保留合并信息

  • 读取合并单元格并保留合并信息
  • 清除各单元格的空格和换行符,并去除列名中的空格和换行符

读取合并单元格并保留合并信息

当我们只是使用 pandas 的 read_excel 方法读取 Excel 文件时,我们可能会遇到一个很棘手的问题:合并单元格的信息将会丢失,从而导致我们的数据出现重复或缺失的情况。

在本篇文章中将介绍使用 pandas 正确地读取包含合并单元格的 Excel 表格,支持 xlsx 和 xls。

import pandas as pd
from openpyxl import load_workbook
from xlrd import open_workbookdef read_xlsx(file, sheet_name=None, header=None):"""读取 xlsx 格式文件。"""excel = pd.ExcelFile(load_workbook(file), engine="openpyxl")sheet_name = sheet_name or excel.sheet_names[0]sheet = excel.book[sheet_name]df = excel.parse(sheet_name, header=header)for item in sheet.merged_cells:top_col, top_row, bottom_col, bottom_row = item.boundsbase_value = item.start_cell.value# 1-based index转为0-based indextop_row -= 1top_col -= 1# 由于前面的几行被设为了header,所以这里要对坐标进行调整if header is not None:top_row -= header + 1bottom_row -= header + 1df.iloc[top_row:bottom_row, top_col:bottom_col] = base_valuereturn dfdef read_xls(file, sheet_name=None, header=None):"""读取 xls 格式文件。"""excel = pd.ExcelFile(open_workbook(file, formatting_info=True), engine="xlrd")sheet_name = sheet_name or excel.sheet_names[0]sheet = excel.book[sheet_name]df = excel.parse(sheet_name, header=header)# 0-based indexfor top_row, bottom_row, top_col, bottom_col in sheet.merged_cells:base_value = sheet.cell_value(top_row, top_col)# 由于前面的几行被设为了header,所以这里要对坐标进行调整if header is not None:top_row -= header + 1bottom_row -= header + 1df.iloc[top_row:bottom_row, top_col:bottom_col] = base_valuereturn df

注:来源https://alanlee.fun/2023/04/27/pandas-read-excel-with-merged-cells/

清除各单元格的空格和换行符,并去除列名中的空格和换行符

在数据处理过程中,字符串中的多余空格和换行符常常会影响数据的整洁性以及后续分析。使用 .replace(‘\n’, ‘’).strip() 可以有效地去除换行符和前后空格,但这并不能解决中间空格的问题。为了解决这一问题,,通过使用字符串处理方法实现的 remove_spaces 函数能够高效地去除 Pandas DataFrame 中每个单元格及其列名的空格和换行符,同时也会移除字符串中的所有空格(包括字与字之间的空格)


def remove_spaces(df):"""去除 DataFrame 中各单元格的空格和换行符,并去除列名中的空格和换行符。"""# 处理列名df.columns = [col.replace('\n', '').strip() if isinstance(col, str) else col for col in df.columns]# 处理各单元格,去掉所有空格,包括中间的空格和换行符return df.apply(lambda col: col.map(lambda x: x.replace('\n', '').replace(' ', '') if isinstance(x, str) else x))
http://www.yayakq.cn/news/830345/

相关文章:

  • 广东电子商务网站建设价格个人摄影网站模板
  • 邢台网站优化建设曲阜市网站建设
  • 别人做的网站打不开杭州外贸建站
  • 网站推广成功案例wordpress主页空白
  • 网站开发服务合同模板网站怎么做展现量
  • 营销型网站重要特点是?互联网公司经营范围
  • h5做招聘网站可以吗wordpress主题如何用
  • 中国建设银行官网站网点西安企业建站在哪里做
  • 南宁 网站建设百度怎么建设网站
  • 网站优化推广方案金华高端网站建设公司
  • 太仓公司做网站淮南建设局网站备案
  • 查询企业年报的网站企业需求发布平台
  • 禹城市建设局网站优化网站链接的方法
  • 网站开发语言php5.1深圳建设厅网站官网
  • 上海闵行网站制作公司上海产品网站建设
  • 东莞企业网站建设设计中信建设有限责任公司是国企吗
  • 八年级上册信息书怎么做网站中小企业建设网站策略
  • 网站做付费推广都需要问什么wordpress主题站
  • 做网站公司的年终总结彩票娱乐网站建设开发
  • 富德生命人寿保险公司官方网站wordpress卡片阴影
  • 做网站公司哪家公司好佛山新网站建设代理商
  • 电子商务网站建设考试wordpress恢复页面
  • 网站建设玖金手指排名14外发加工费计入什么科目
  • 从零开始建网站手机网站首页
  • 村级网站建设 不断增强如何做互联网网站
  • 哈尔滨专业建网站方案网站常州建设
  • 鼓楼做网站价格深圳南山企业网站建设报价
  • 湖北手机网站建设免费不收费的app
  • 网站备案资料申请wordpress 修改网页
  • 专业微网站建设公司哪家好长沙移动网站建设