HTML - 了解 URL



Web 上的每个文档都有一个唯一的地址。此地址称为 Uniform Resource Locator (URL)

多个 HTML/XHTML 标签包括 URL 属性值,包括超链接、内嵌图像和表单。它们都使用相同的语法来指定 Web 资源的位置,而不管该资源的类型或内容如何。这就是为什么它被称为统一资源定位器。

URL 元素

URL 由多个部分组成,每个部分都向 Web 浏览器提供信息以帮助查找页面。学习 URL 的各个部分更容易,如果您查看下面给出的示例 URL,则有三个关键部分:方案、主机地址和文件路径。以下部分将讨论它们中的每一个:

http://www.qikepu.com/index.html

方案

该方案标识要链接到的协议和 URL 的类型,从而标识应如何检索资源。例如,大多数 Web 浏览器使用超文本传输协议 (HTTP) 来传递信息以与 Web 服务器通信,这就是 URL 以 http:// 开头的原因。

还有其他可用的方案,您可以根据自己的要求使用其中任何一种:

协议 描述
http://

超文本传输协议 (HTTP) 用于从 Web 服务器请求页面,并将这些页面从 Web 服务器发送回浏览器。

https://

安全超文本传输协议 (HTTPS) 使用数字证书对浏览器和 Web 服务器之间发送的数据进行加密。

ftp://

文件传输协议是在 Web 上传输文件的另一种方法。虽然 HTTP 由于与浏览器的集成而在查看 Web 站点时更为流行,但 FTP 仍然是在 Web 上传输大型文件以及将源文件上载到 Web 服务器的常用协议。

file://

用于指示文件位于本地硬盘或 LAN 上的共享目录中。

主机地址

主机地址是可以找到网站的位置,可以是 IP 地址(介于 0 和 255 之间的四组数字,例如 68.178.157.132),或者更常见的是网站的域名,例如 www.qikepu.com。请注意,“www” 实际上并不是域名的一部分,尽管它经常用于主机地址。

文件路径

文件路径始终以正斜杠字符开头,并且可能由一个或多个目录或文件夹名称组成。每个目录名称都由正斜杠字符分隔,文件路径可能以文件名结尾。下面是 html 目录中可用的文件名index.html:

https://www.qikepu.com/html/index.html

URL 的其他部分

使用凭据是为网站受密码保护的部分指定用户名和密码的一种方式。凭据位于主机地址之前,并且它们与主机地址之间用 @ 符号分隔。请注意用户名与密码之间是如何用冒号分隔的。以下 URL 显示用户名 admin 和密码 admin123:

https://admin:admin123@qikepu.com/admin/index.htm

使用上述 URL,您可以对管理员进行身份验证,如果提供的 ID 和密码正确无误,则管理员将有权访问 admin 目录中index.htm可用文件。

您可以使用 telnet URL 连接到服务器,如下所示:

telnet://user:password@qikepu.com:port/

另一个重要信息是 Web 服务器端口号。默认情况下,HTTP Server 在端口 80 上运行。但是,如果您在任何其他端口号上运行服务器,则可以按如下方式提供,假设服务器在端口 8080 上运行:

https://www.qikepu.com:8080/index.htm

片段标识符可以在文件名之后使用,以指示浏览器应立即转到页面的特定部分。以下是到达第 html_text_links.htm 页顶部的示例。

https://www.qikepu.com/html/html_text_links.htm#top

您可以使用 URL 将一些信息传递给服务器。当您在网页上使用表单(如搜索表单或在线订单)时,浏览器可以将您提供的信息附加到 URL,以将信息从浏览器传递到服务器,如下所示 -

https://www.qikepu.com/cgi-bin/search.cgi?searchTerm=HTML

在这里,searchTerm=HTML 被传递到服务器search.cgi该脚本用于解析此传递的信息并采取进一步的操作。

绝对 URL 和相对 URL

您可以通过以下两种方式之一对 URL 进行寻址:

  • 绝对 URL - 绝对 URL 是资源的完整地址。例如 http://www.qikepu.com/html/html_text_links.htm
  • 相对 URL - 相对 URL 指示资源相对于当前页面的位置。给定的 URL 与 <base> 元素一起添加,以形成一个完整的 URL。例如 /html/html_text_links.html

保留字符和不安全字符

保留字符是指在 URL 中具有特定含义的字符。例如,斜杠字符分隔 URL 中路径名的元素。如果需要在 URL 中包含不用作元素分隔符的斜杠,则需要将其编码为 %2F:

不安全字符是指在 URL 中没有特殊含义但在写入 URL 的上下文中可能具有特殊含义的字符。例如,双引号 (“”) 分隔标记中的 URL 属性值。如果您需要直接在 URL 中包含双引号,您可能会使浏览器感到困惑。相反,您应该对双引号进行编码以避免任何可能的冲突。

您可以查看 HTML URL 编码教程来了解此编码、保留和不安全字符。