14 KiB
十三、浏览器中的 JavaScript
The browser is a really hostile programming environment.
Douglas Crockford, The JavaScript Programming Language (video lecture)
本书接下来的内容将会介绍有关Web浏览器的内容。可以说,没有浏览器,就没有JavaScript。就算有,估计也不会有多少人去关心这门编程语言。
Web技术自出现伊始,其演变方式和技术上就是以分散的方式发展的。许多浏览器厂商专门为其开发新的功能,有时这些新功能被大众采纳,有时这些功能被其他功能所代替,最终形成了一套标准。
这种发展模式是把双刃剑。一方面,不会有一个集中式的组织来管理技术的演进,取而代之的是一个包含多方利益集团的松散协作架构(偶尔会出现对立)。另一方面,互联网这种无计划的发展方式所开发出来的系统,其内部很难实现一致性。事实上,有些技术看起来会十分混乱而且互相矛盾。
12.1 网络和Internet
计算机网络出现在20世纪50年代。如果在两台或多台计算机之间铺设电缆,那么你可以通过这些电缆互相收发数据,并实现一些神奇的功能。
如果通过连接同一个建筑中的两台机器就可以实现一些神奇的功能,那么如果可以连接全世界的机器,就可以完成更伟大的工作了。20世纪80年代,人们开发了相关技术来实现这个愿景,我们将其产生的网络称为Internet。而Internet的表现名副其实。
计算机可以使用这种网络向其他计算机发送位数据。为了在传输位数据的基础上,实现计算机之间的有效通信,网络两端的机器必须知道这些位所表达的实际含义。对于给定的位序列,其含义完全取决于位序列描述的信息类型与使用的编码机制。
网络协议描述了一种网络通信方式。网络协议非常多,其中包括邮件发送、邮件收取和邮件共享,甚至连病毒软件感染控制计算机都有相应的协议。
比如说,一个简单的聊天协议可能由两台机器组成,一台机器发送表示文本“CHAT”的位数据,另一台机器回复“OK”以确认其已经理解了该协议。接着他们可以继续向对方发送文本字符串,或通过网络读取对方发送过来的文本,并将发送与读取到的信息显示在各自屏幕上。
大多数协议都是根据其他协议开发出来的。在我们这个聊天协议的例子中,我们将网络当作可以写入位数据的流设备,而这些数据会以正确的顺序到达正确的目的地。要完成这些功能需要非常复杂的技术才能解决。
传输控制协议(Transmission Control Protocol,TCP)就可以帮助我们解决该问题。所有连接到互联网的设备都会使用到这种协议,而多数互联网通信都构建在这种协议之上。
TCP连接的工作方式是一台电脑必须等待或者监听,而另一台电脑则开始与之通信。一台机器为了同时监听不同类型的通信信息,会为每个监听器分配一个与之关联的数字(我们称之为端口)。大多数协议都指定了默认使用的端口。例如,当我们向使用SMTP协议发送一封邮件时,我们需要通过一台机器来发送邮件,而发送邮件的机器需要监听端口25。
随后另一台机器连接到使用了正确端口号的目标机器上。如果可以连接到目标机器,而且目标机器在监听对应端口,则说明连接创建成功。负责监听的计算机名为服务器,而连接服务器的计算机名为客户端。
我们可以将该连接看成双向管道,位可以在其中流动,也就是说两端的机器都可以向连接中写入数据。当成功传输完这些位数据后,双方都可以读取另一端传来的数据。TCP是一个非常便利的模型。我们可以说TCP就是一种网络的抽象。
12.2 Web
万维网(World Wide Web,不要将其与Internet混淆)是包含一系列协议和格式的集合,允许我们通过浏览器访问网页。词组中的Web指的是这些页面可以轻松地链接其他网页,因此最后可以连接成一张巨大的网,用户可以在网络中浏览。
你只需将一台计算机连接到Internet并监听80端口,然后利用超文本传输协议(Hyper Text Transfer Protocol,HTTP)就可以在Web上创建新的内容。其他计算机可以通过网络,并使用HTTP协议获取其他计算机上的文件。
网络中的每个文件都能通过唯一资源定位符(Universal Resource Locator,URL)访问,如下所示:
http://eloquentjavascript.net/12_browser.html
| | | |
protocol server path
该地址的第一部分告诉我们URL使用的是HTTP协议(加密的HTTP连接则使用https://来表示)。第二部分指的是获取文件的服务器地址。第三部分是我们想要获取的具体文件(或资源)的路径。
每台连接到互联网的计算机都可以得到唯一的IP地址,IP的形式是37.187.37.82。你可以直接使用IP作为URL中的服务器名。但想记住并输入这一串或多或少随机的数字是很困难的,因此你可以注册一个域名来指向特定机器或一组机器。我注册了eloquentjavascript.net,并将其指向我的机器的IP地址,因此读者可以使用该域名访问Web页面。
如果你在浏览器地址栏中输入上面提到的URL,浏览器会尝试获取并显示该URL对应的文档。首先,你的浏览器需要找出域名eloquentjavascript.net指向的地址。然后使用HTTP协议,连接到该地址处的服务器,并请求/12_browser.html这个资源。
我们将会在第17章中详细介绍HTTP协议。
12.3 HTML
HTML,即超文本标记语言(Hypertext Markup Language),是在网页中得到广泛使用的文档格式。HTML文档不仅包含文本,还包含了标签,用于说明文本结构,描述了诸如链接、段落、标题之类的元素。
一个简单的HTML文档如下所示:
<!doctype html>
<html>
<head>
<title>My home page</title>
</head>
<body>
<h1>My home page</h1>
<p>Hello, I am Marijn and this is my home page.</p>
<p>I also wrote a book! Read it
<a href="http://eloquentjavascript.net">here</a>.</p>
</body>
</html>
标签包裹在尖括号之间(<和>),提供关于文档结构的信息。其他文本则是纯文本。
文档以<!doctype html>开头,告诉浏览器将其作为现代HTML解释,以别于过去使用的各种方言。
HTML文档有头部(head)和文档体(body)。头部包含了文档信息,而文档体则包含文档自身。在本例中,我们首先将文档标题声明为“My home page”,并给予文档一个标题(
,表示一级标题(Heading 1),
到
可以产生不同等级的子标题)和两个段落(
)。
标签有几种形式。一个元素,比如文档体、段落或链接以一个起始标签(比如
)开始,并以一个闭合标签(比如
)结束。一些起始标签,比如一个链接(),会包含一些额外信息,其形式是name="value"这种键值对,我们称之为属性。在本例中,使用属性href="http://eloquent javascript.net"指定链接的目标,其中href表示“超文本链接(Hypertext Reference)”。某些类型的标签不会包含任何元素,这种标签不需要闭合。比如,该标签显示指定源URL处的图像。
尽管HTML中尖括号有特殊含义,但为了在文档的文本中包含这些符号,可以引入另外一种形式的特殊标记方法。普通文本中的起始尖括号写成<;(less than),而闭合尖括号写成>;(greater than)。在HTML中,我们将一个&字符后跟着一个单词和分号(;)这种写法称为一个实体,浏览器会使用实体编码对应的字符替换它们。
与之类似的是JavaScript字符串中反斜杠的使用。由于HTML中的实体机制赋予了&特殊含义,因此我们需要使用&;来表示一个&字符。在属性(双引号包围起来)中使用";可以插入实际的引号字符。
HTML的解析过程容错性非常强。当应有的标签丢失时,浏览器会重新构建这些标签。标签的重新构建已经标准化,你可以认为所有现代浏览器的行为都是一致的。
下面的文件与之前版本显示效果相同:
<!doctype html>
<title>My home page</title>
<h1>My home page</h1>
<p>Hello, I am Marijn and this is my home page.
<p>I also wrote a book! Read it
<a href=http://eloquentjavascript.net>here</a>.
<html>、<head>和标签可以完全丢弃。浏览器知道