当前位置: 首页 > news >正文

网站搭建心得体会我要自学网app免费版

网站搭建心得体会,我要自学网app免费版,沧州网站网站建设,模板下载网站网上所有代码都无法完全克隆单个网页,不是Css,Js下载不下来就是下载下来也不能正常显示,只能自己写了,记得点赞~ 效果如图: 源码与所需的依赖: pip install requests pip install requests beautifulsoup4…

网上所有代码都无法完全克隆单个网页,不是Css,Js下载不下来就是下载下来也不能正常显示,只能自己写了,记得点赞~

 效果如图:

源码与所需的依赖:

pip install requests
pip install requests beautifulsoup4 lxml 
requests.packages.urllib3.disable_warnings()
pip install urllib3
pip install pyOpenSSL requests[security] urllib3[secure]
import os
import time
import requests
from urllib.parse import urljoin
from bs4 import BeautifulSoup# 配置requests,不验证SSL证书
requests.packages.urllib3.disable_warnings()
session = requests.Session()
session.verify = False  # 不推荐,仅用于测试目的def sanitize_filename(filename):return "".join(i for i in filename if i not in "\/:*?<>|").split('?')[0]def ensure_dir(file_path):if file_path:directory = os.path.dirname(file_path)if directory and not os.path.exists(directory):os.makedirs(directory)def download_resource(url, dest_folder, local_path):try:r = session.get(url, stream=True)r.raise_for_status()ensure_dir(local_path)with open(local_path, 'wb') as f:for chunk in r.iter_content(chunk_size=8192):f.write(chunk)return Trueexcept requests.exceptions.RequestException as e:print(f"Error downloading {url}: {e}")return Falsedef update_resource_links(soup, tag, attribute, base_url, dest_folder, sub_folder):resources = soup.find_all(tag, {attribute: True})for resource in resources:old_url = resource[attribute]new_url = urljoin(base_url, old_url)local_filename = sanitize_filename(new_url.split('/')[-1])local_path = os.path.join(dest_folder, sub_folder, local_filename)full_local_path = os.path.abspath(local_path)if download_resource(new_url, dest_folder, full_local_path):resource[attribute] = os.path.join(sub_folder, local_filename).replace('\\', '/')def save_complete_webpage(url, dest_folder):response = session.get(url)response.raise_for_status()# 尝试从响应头部或内容中获取编码if response.encoding is None:response.encoding = response.apparent_encodingsoup = BeautifulSoup(response.content, 'html.parser', from_encoding=response.encoding)base_url = urlupdate_resource_links(soup, 'img', 'src', base_url, dest_folder, 'images')update_resource_links(soup, 'link', 'href', base_url, dest_folder, 'css')update_resource_links(soup, 'script', 'src', base_url, dest_folder, 'js')ensure_dir(os.path.join(dest_folder, 'index.html'))with open(os.path.join(dest_folder, 'index.html'), 'w', encoding=response.encoding) as file:file.write(soup.prettify())if __name__ == "__main__":timestamp = str(int(time.time()))[-5:]  # 获取当前时间戳的最后5位数字target_url = input("请输入网址:")  # 目标网址destination_folder = f'downloaded_website_{timestamp}'  # 添加时间戳后5位的本地文件夹路径save_complete_webpage(target_url, destination_folder)print(f"已完整,保存到{destination_folder}文件夹中")

 

http://www.yayakq.cn/news/836992/

相关文章:

  • 宁波建设信息港网站在家做网站设计挣钱吗
  • 一些做设计素材的网站保定seo排名外包
  • 北京网站维护工程咨询公司
  • php做网站安装做旅游网站目的和意义
  • 建站公司排名logo设计在线生成免费无水印
  • 网站 广州花店网站设计
  • 仿中国加盟网站源码网站建设年度汇报
  • 云霄网站建设福州网站建设价格
  • 网站页面头部设计说明如何建立一个网站来卖东西
  • 商会联盟网站建设方案微信小程序怎么收费
  • 网站全网建设 莱芜网站建设维护费会计科目
  • 选择大连网站建设木渎建设局网站
  • 淘宝自己建的网站做类似于58同城的网站
  • 网站被别人域名绑定怎么做装修网站平台
  • 昆明公司网站开发通信网络维护是做什么的
  • 网站建设哪个公司wordpress手机显示不出主题
  • 广元建设网站icp备案网站接入信息
  • 织梦cms做电影网站广州企业年报网上申报入口
  • 网站首页策划怎么做wordpress 无法处理图像.请返回重试.
  • 招远网站开发微信小程序开发和网站开发的区别
  • 百度推广整体优化网站西安seo代理计费
  • 网站的建设需要多少钱网页设计网站规划
  • 哈尔滨专业优化网站个人基于php的微网站开发
  • 个人网站免备案吗网站 备案 拍照
  • 江苏网站建设费用建网站和软件需要什么
  • 优化志愿网站外贸网站建设和seo
  • 网站开发 定制 合同 模板江门小程序制作
  • 国家工程建设信息网站团建拓展网站建设需求分析
  • 邢台本地信息网天津seo网络营销
  • 承德网站建设怎么建设的网页制作文字素材