网页源代码 vs Elements：静态页面、动态页面与 DOM 更新

先说结论

网页源代码和 Elements 不是一回事。

网页源代码：服务器最初返回的 HTML 文档。
Elements 面板：浏览器当前实时渲染出来的 DOM 结构。

这两个内容经常很像，但它们的来源、用途和变化方式都不一样。

网页源代码是什么

网页源代码是浏览器从服务器拿回来的原始 HTML。

它的特点是：

来自网络响应。
通常是静态文本。
反映的是页面最初的返回结果。

你可以把它理解成“施工图纸”。它告诉你浏览器最开始收到了什么，而不是页面最后变成了什么。

Elements 面板是什么

Elements 面板展示的是浏览器当前正在使用的 DOM。

它的特点是：

会随着 JavaScript 改变而变化。
会反映当前页面真实结构。
可以看到动态插入、删除或修改后的内容。

这也是为什么你在页面上改一个元素的文本，Elements 会立刻更新，但网页源代码通常不会变。

为什么两者会不一样

原因很简单：JavaScript 会在页面加载后继续修改 DOM。

可能的情况有三种：

HTML 一开始就把数据写好了。
JavaScript 后面请求接口，再把数据插入页面。
JavaScript 修改了原有节点的内容或结构。

所以你在页面上看到的内容，不一定是服务器最初返回的 HTML 里就有的。

`$0` 是什么

在开发者工具里，你选中的那个元素，控制台里可以用 $0 直接引用。

这在调试时非常方便，比如：

快速查看当前选中元素。
修改元素文本。
临时测试样式和结构。

它本质上就是浏览器给你的一个便捷入口，帮助你更快操作当前选中的节点。

静态页面和动态页面怎么区分

静态页面

静态页面指的是：目标数据直接写在 HTML 里，浏览器拿到源代码就能看到。

这种页面的特点是：

数据在源代码里能找到。
不依赖复杂的 JavaScript 渲染。
直接请求 HTML 往往就能拿到主要内容。

动态页面

动态页面指的是：页面内容由 JavaScript 后续生成或填充。

这种页面的特点是：

源代码里可能看不到目标数据。
Elements 里通常能看到最终结果。
需要进一步分析 JavaScript 或 Network 请求。

怎么快速判断一个页面属于哪一种

你可以按下面这几个步骤看：

先在页面上找到目标数据。
打开网页源代码，看数据是否已经存在。
如果源代码没有，再去 Elements 面板找。
如果 Elements 里有，说明内容大概率是动态生成的。
再切到 Network 面板，刷新页面，看是不是接口返回了这些数据。

这套方法对爬虫分析非常实用，因为它直接决定你下一步该怎么抓数据。

为什么爬虫一定要分清这两个视图

很多爬虫问题，根源不是“代码写错了”，而是找错了数据来源。

如果你把源代码当成最终页面，就可能：

误以为数据不存在。
错过真正返回数据的接口。
在错误的 HTML 结构上浪费时间。

所以，先分清“源代码”和“实时 DOM”，你后面的分析效率会高很多。

一个非常实用的判断口诀

你可以记成这样：

源代码看起点，Elements 看结果。

如果页面上有数据，源代码没有，那就优先考虑 JavaScript 动态渲染。如果页面上和源代码一致，那它更像静态页面。

和浏览器加载流程的关系

这篇内容其实是上一节的延伸。

浏览器先拿到 HTML，再加载资源，再执行 JavaScript。而 Elements 面板展示的，就是这一整套过程结束后的最终状态。

所以你在学完页面加载流程之后，再回头看源代码和 Elements，就会突然清楚很多。

总结

网页源代码、Elements、静态页面、动态页面，这四个概念一定要一起理解：

源代码是服务器返回的原始 HTML。
Elements 是浏览器当前实时 DOM。
静态页面的数据通常在 HTML 里。
动态页面的数据通常由 JavaScript 后续生成。

这篇文章读完后，你在分析网页时，应该能更快判断： 是直接看 HTML，还是要去找 JavaScript 和接口。

配合前两篇一起看，会更完整：

网页源代码和 Elements 有什么区别？静态页面与动态页面怎么判断

先说结论

网页源代码是什么

Elements 面板是什么

为什么两者会不一样

`$0` 是什么

静态页面和动态页面怎么区分

静态页面

动态页面

怎么快速判断一个页面属于哪一种

为什么爬虫一定要分清这两个视图

一个非常实用的判断口诀

和浏览器加载流程的关系

总结

读完这一节，去靶场里验证一下。

本分类更多文章

先说结论

网页源代码是什么

Elements 面板是什么

为什么两者会不一样

$0 是什么

静态页面和动态页面怎么区分

静态页面

动态页面

怎么快速判断一个页面属于哪一种

为什么爬虫一定要分清这两个视图

一个非常实用的判断口诀

和浏览器加载流程的关系

总结

读完这一节，去靶场里验证一下。

本分类更多文章

`$0` 是什么