当前位置: 首页 > news >正文

青岛开发区网站制作站开发技术培训

青岛开发区网站制作,站开发技术培训,视频营销的策略与方法,不收费的网站文章目录 一. 问题描述二. 解决方案2.1 官方文档2.2 XML格式不规范 一. 问题描述 今天接到一个新需求&#xff0c;hive表里面有个字段存储的是XML类型数据 数据格式: <a><b>bb</b><c>cc</c> </a>二. 解决方案 2.1 官方文档 遇到不懂的…

文章目录

  • 一. 问题描述
  • 二. 解决方案
    • 2.1 官方文档
    • 2.2 XML格式不规范

一. 问题描述

今天接到一个新需求,hive表里面有个字段存储的是XML类型数据

数据格式:

<a><b>bb</b><c>cc</c>
</a>

二. 解决方案

2.1 官方文档

遇到不懂的问题,首先上官方文档查询相关文档,然后照着官网的demo改改,一般就能解决问题了

官方文档地址:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+XPathUDF
丰富的XML相关函数及测试用例

代码:

-- 求路径 a/b下面的值
SELECT xpath_string ('<a><b>bb</b><c>cc</c></a>', 'a/b') LIMIT 1 ;

测试记录:

hive> > SELECT xpath_string ('<a><b>bb</b><c>cc</c></a>', 'a/b') LIMIT 1 ;
OK
bb
Time taken: 1.477 seconds, Fetched: 1 row(s)
hive> 

2.2 XML格式不规范

因为Hive不支持XML数据格式,后端写入数据库存的是一个String类型,此时格式就没那么规范了,会有一些特殊字符

解析xml报错,原来是有特殊字符
https://stackoverflow.com/questions/730133/what-are-invalid-characters-in-xml

xml不符合规范的字符
https://blog.csdn.net/u014589856/article/details/107151252
image.png

通过正则表达式删除特殊字符:

  1. 下面几个是常用的特殊字符
@&$#%
regexp_replace(the_gifts,'[@&$#%]','')
  1. 只保留 大小写字母 数字 及中文 以及 xml标签
regexp_replace(the_gifts,'(^[a-z]+|[A-Z]+|[0-9]+|[\\u4E00-\\u9FA5]+[</>])','')
http://www.yayakq.cn/news/510627/

相关文章:

  • 做竞价的网站需要做外部链接吗怎么开发游戏
  • 贸易网站建设公司做个人网站到哪里做
  • 请网站制作公司费用二维码图片生成器在线制作
  • 门户网站安全建设dns服务器 域名不存在时 跳转到指定网站
  • 足彩网站怎样做推广中山免费建网站
  • 网站营销 海外国外设计搜索网站
  • 朔州网站建设价格低泰安房产信息网官网
  • 企业手机微网站系统php北京海淀区区号
  • 江苏网站推广公司哪家好福州建站模板
  • 电子商务网站建设自建团队深圳网站优化公司哪家好
  • 成都网站建设木木科技辽宁省城乡建设网站
  • 网站 被刷流量中山网站建设文化报价
  • 腾讯云域名备案需要提供网站建设方案书做印刷网站公司哪家好
  • 手机网站开发还是调用安平县建设局网站
  • 郴州建设公司网站asp wordpress
  • 佛山伦教网站设计明天上海全面封控
  • 山西省财政厅门户网站三基建设长沙好的做网站品牌
  • 昆山制造网站的地方对网站建设有什么样意见
  • 静宁网站建设wordpress文章html
  • 大淘客可以做几个网站设计网页的心得体会与总结
  • 电子商务网站建设 李洪心网站建设说明书模板
  • 北京建网站公司怎么样wordpress开发工资
  • 北仑网站建设如何维护网站建设
  • 陕西建设集团韩城公司网站怎样做后端数据传输前端的网站
  • 邢台建设网站建设工程行业网站有哪些
  • 保定做网站的公司上海搜索引擎优化1
  • 网站推广策略和效果评价wordpress js插件开发
  • 福建省建设网站商城网站风格
  • 青海建设厅通报网站网站配色教程
  • 天猫店的网站怎么做的怎么快速仿wordpress站