当前位置: 首页 > news >正文

视频网站自己怎么做的搬家公司价目表

视频网站自己怎么做的,搬家公司价目表,女装网站功能的建设,自动跳转短网址目录 一、HTML是什么? 二、最简HTML文件结构 三、必须掌握的5个基础标签 四、标签的嵌套规则 五、爬虫关注的关键属性 动手练习:创建你的第一个网页 七、学习爬虫前的准备 八、常见问题解答 一、HTML是什么? 定义:HTML&am…

目录

一、HTML是什么?

二、最简HTML文件结构

三、必须掌握的5个基础标签

四、标签的嵌套规则

五、爬虫关注的关键属性

动手练习:创建你的第一个网页

七、学习爬虫前的准备

八、常见问题解答


一、HTML是什么?

  • 定义:HTML(HyperText Markup Language)是用于创建网页的标记语言。
  • 核心特点
    • 由一系列**标签(Tags)**组成,例如 <p> 表示段落。
    • 浏览器会解析这些标签并渲染成你看到的网页。

二、最简HTML文件结构

<!DOCTYPE html>  <!-- 声明文档类型为HTML5 -->
<html>           <!-- 根标签,包裹整个页面 -->
<head>           <!-- 头部:存放元信息(标题、字符编码等) --><meta charset="UTF-8">  <!-- 定义字符编码为中文 --><title>我的第一个网页</title>  <!-- 网页标题(显示在浏览器标签页) -->
</head>
<body>           <!-- 主体:显示在页面上的内容 --><h1>欢迎!</h1><p>这是一个段落。</p>
</body>
</html>

保存为.html文件并用浏览器打开即可看到效果


三、必须掌握的5个基础标签

  • 标题标签<h1><h6>(重要性递减)

<h1>主标题</h1>  <!-- 通常一个页面只用一次 -->
<h2>次级标题</h2>
  • 段落标签<p>
<p>这是一个段落。</p>
  • 链接标签<a>
<a href="https://www.example.com">点击这里</a>  <!-- href属性指向链接地址 -->
  • 图片标签<img>
<img src="cat.jpg" alt="一只猫">  <!-- src是图片路径,alt是替代文本(图片无法显示时出现) -->
  • 换行标签<br>
第一行<br>第二行  <!-- 强制换行(不需要闭合标签) -->

四、标签的嵌套规则

  • 正确嵌套:标签必须按顺序闭合,不能交叉。
<p><strong>加粗的文字</strong></p>  <!-- 正确 -->
<p><strong>错误的示范</p></strong>  <!-- 错误! -->

五、爬虫关注的关键属性

  • id属性:唯一标识一个元素(用于精准定位)

<div id="main-content">主要内容区域</div>
  • class属性:定义元素的类名(可重复使用)
<p class="text-red">红色文字</p>
  • href/src属性:链接或资源的地址(爬虫重点抓取目标)
<a href="detail.html">详情页</a>
<img src="images/logo.png">

动手练习:创建你的第一个网页

  1. 用记事本或VS Code新建一个文件,命名为 test.html

      2. 粘贴以下代码:

<!DOCTYPE html>
<html>
<head><meta charset="UTF-8"><title>爬虫练习页</title>
</head>
<body><h1>热门电影</h1><ul><li class="movie"><a href="/movie/1">肖申克的救赎</a></li><li class="movie"><a href="/movie/2">阿甘正传</a></li></ul><img src="poster.jpg" alt="电影海报">
</body>
</html>
  • 用浏览器打开,观察效果。按 F12 打开开发者工具,点击元素查看HTML结构。

七、学习爬虫前的准备

  1. 理解开发者工具

    • 按 F12 打开,点击 Elements 标签查看网页HTML源码。
    • 按 Ctrl+Shift+C 选择页面上的元素,自动定位到对应代码。
  2. 观察规律

    • 爬虫需要的数据(如电影名称、链接)通常包裹在特定标签和class中。
    • 例如:上述练习中的电影名都在 <li class="movie"> 下的 <a> 标签里。

八、常见问题解答

Q:为什么有些网页用浏览器看到的内容和爬虫抓取的不一样? A:因为部分网页通过JavaScript动态加载数据,此时需用Selenium等工具模拟浏览器操作。

Q:爬虫需要学完所有HTML知识吗? A:不需要!优先掌握标签、id/class属性、链接和数据的包裹规律即可。

http://www.yayakq.cn/news/998624/

相关文章:

  • 小网站关键词搜什么wordpress 4.9.4 漏洞
  • 国内高校网站建设的调查外贸营销活动方案
  • 威海 医院网站建设海报字体手绘转换器
  • 中文域名 网站买好域名和云主机后怎么做网站
  • 国企怎么做网站天津快速建站模板
  • 做宴会网站outlook企业邮箱
  • 广东网站备案要多久hao123主页怎么删除
  • 如何看网站排名在建立网站站点的过程中
  • 哪家网站建设电话谷歌seo专员
  • seo人员要先对网站进行诊断怎么做网站文字图片
  • wordpress建手机网站吗总结企业网站建设的流程
  • 南通做网站软件信息流投放平台有哪些
  • 哈尔滨建站的网站网页建设一个聊天类的网站
  • 宜昌哪里有专业做网站的带有互动的网站开发
  • 加强网站建设 基本措施海外网络专线免费
  • 网站开发工程师证书有用吗搜索百度网址版搜索
  • 网站建设与管理的网页本溪兼职网站建设招聘
  • 商派商城网站建设公司织梦动漫网站模板
  • 手游网站建设的宗旨大数据营销网站
  • 做网站流程内容网站打开显示域名错误
  • 提供零基础网站建设教学培训宝应县网络推广公司
  • 品牌商城网站开发用织梦系统做的2个网站要把它都上传到服务器上吗
  • 石家庄做网络推广的网站企业网站官网制作
  • 网站开发 设置背景图片房山新农村建设网站
  • 网站开发时什么时间适合创建视图抖音账号权重查询
  • 开源商城网站网站建设与管理案例教程第三版答案
  • 网站建设毕业设计中期检查设计招聘信息
  • 做学校子网站网站建设与管理基础
  • 移动网站建设制作58同城济南网站建设
  • 进入网上商城seo入门讲解