admin 管理员组

文章数量: 887021

第一章 计算机网络和因特网


1.1 什么是因特网
我们可以从两个角度来回答这个问题:一种是描述组成它的软硬组件;另一种是根据为分布式应用提供联网服务的基础设施来描述。其实,第一种角度,是从它的组成来描述,第二种角度是从它的功能来描述1.1.1 具体构成描述
因特网是一个世界范围的计算机网络,它互联了数以亿计的计算设备(包括PC、服务器、电视机、汽车等)。这些连入因特网的设备被称为主机或者端系统。
以下是重点的一些概念:
端系统通过通信链路和分组交换机连接到一起。
不同类型通信链路有不同的物理媒介(同轴电缆、铜线等)组成,以不同的速率传输数据,单位为比特/秒(bit/s,bps)。
 端系统之间收发数据时,发送端系统将数据分段,每段加上首部字节形成新的数据包,这些数据包称为分组。分组==用户数据+首部字节;链路系统传输分组;分组到达接收端系统后,接收端系统将根据首部字节抽取用户数据来装配成初始数据;
分组交换机从它的一条入通信链路接收分组,并且选择一条出通信链路将分组转发出去;分组交换机也有很多种类,最为有名的是路由器和链路层交换机;两者的的不同之处在于,链路层交换机主要用在接入网中,路由器主要用在网络核心。从发送端到接收端经历的通信链路和分组交换机称为路径。
端系统通过因特网服务提供商(Internet Service Provider,简称ISP)接入因特网,包括如本地电缆、住宅区ISP、公司ISP等不同的ISP提供不同类型的网络接入,它们都是多个交换机、通信链路组成的网络。
上面介绍的端系统、交换机等因特网部件都遵循了一系列协议:TCP(Transport Control Protocol,传输控制协议)和IP(Internet Protocol,网际协议:定义了路由器和端系统之间收发数据的分组格式);因为协议控制了信息的传递,所以对协议达成一致就很重要,所以需要一个标准来规范协议,以便创造可以协同工作的系统和产品
 1.1.2 服务描述
还可以从为应用程序提供服务的基础设施的角度来描述互联网。电子邮件、web、游戏等分布式应用程序涉及多台相互交换数据的端系统。端系统提供应用程序编程接口(API),它规定了一个应用程序请求因特网基础设施向另一端某程序交付数据的方式(就像寄信必须要填地址贴邮票一样)。此时因特网提供了相应请求的服务。1.1.3 协议
协议是如何使用首部字节理解用户数据的方法规则;分组接收者接收到分组并按照协议获得了用户数据后,还应该对此消息做出反应,而如何做出反应也是协议规范的一部分(不反应也是一种反应哦)
协议:定义了两个或多个通信实体(不一定是端系统,还有可能是分组交换机等)之间交换信息的格式和次序以及对该信息所采取的动作。
通信实体的所有活动都要受到协议的约束。比如,硬件实现的控制协议控制了两块网卡之间的比特流;在端系统中,拥塞控制协议控制了发送方和接收方之间传输数据的速率等1.2 网络边缘
端系统:与因特网相连的计算设备,往往处于网络的边缘
端系统分类:客户和服务器1.2.1 接入网
接入网:是指将端系统连入到边缘路由器的物理链路 边缘路由器:是指端系统到任何其他远程端系统路径上的第一台路由器
 
DSL(Digital Subscribe Line)数字用户线
这是一种宽带住宅接入的方法,它的ISP是本地电话公司。其使用的通信链路的物理材质为电话线,是一种双绞线。
用户使用DSL调制解调器通过电话线与ISP中的数字用户线接入复用器(DSLAM)来交换数据;家庭DSL调制解调器将数字数据转换为高频音后通过电话线传输到ISP中心,并且通过DSL解调器将DSLAM发送过来的模拟信号转为数字信号;
CIC(Cable Internet Access)电缆因特网接入
这是另一种宽带住宅接入方法,它的ISP是有线电视公司。其使用的通信链路的物理材质有光纤和同轴电缆,也被称为混合光纤同轴(Hybrid Fiber Coax HFC);
用户使用电缆调制解调器通过同轴电缆与光纤结点相连,光纤结点通过光缆与电缆头端相连,而电缆头端接入了因特网。在电缆头端,电缆调制解调器端接系统(Cable Modem Termination System)起到DSLAM的作用,即实现模拟信号和数字信号的转换;
FTTH(Fiber TO The Home)光纤到户
这里主要是指使用光纤作为通信链路的材质,有两种竞争性的光纤分布方案,一种是主动光纤网络(Active Optical Network),另一种是被动光纤网络(Passive Optical Network).其主要区别在于,是否在传输数据时共享光纤。
以太网和WIFI
以太网接入是一种在公司、大学、家庭里很流行的接入方式;用户使用双绞线与以太网交换机相连,从而接入因特网;接入以太网交换机的速度可达100Mbps;
在无线局域网中,无线用户从一个接入点发送和接收数据,而该接入点与企业网相连,企业网最终接入因特网;在无线LAN中,用户需要在一个接入点的几十米范围之内;
广域无线接入
在移动设备中,通过蜂窝网提供商运营的基站来发送和接收分组,与WIFI不同的是,用户仅需要位于基站的数万米范围之内即可;1.2.2 物理媒体
传输媒体是构成通信链路的主要部分,物理媒体通常可以分为导引性媒体和非导引性媒体;其中导引性媒体,信号沿着固体前行;而非导引性媒体中,信号沿着固体媒体前行
值得注意的是,架设传输媒体的人历成本要远远高于物理材料的成本
双绞线
最便宜的引导性传输媒体,由两条相互螺旋缠绕的铜线组成。目前局域网中的双绞线数据传输速率在10Mbps到10Gbps之间,所能达到的数据传输速率取决于线的粗细以及传输距离;双绞线实际上已经成为高速局域网联网的主要方式;因为现代的双绞线技术速率和传输距离都是很不错的;
同轴电缆
也由两个铜导体构成,但是它们是同心的,而非并行的;借助特殊的结构和绝缘层,同轴电缆可得到较高的数据传输速率;在电视系统中应用广泛;同轴电缆可被用作引导性的共享媒体;
光纤
一种可以引导光脉冲的媒体
陆地无线电信道
无线电信道承载电磁频谱中的信号,不需要物理线路,提供与移动用户的连接以及长距离承载信号的方式;是一种有吸引力的媒体;
卫星无线电信道
通过卫星连接两个或多个在地球上的微波发射方(也被称为地面站),该卫星在一个频段上接收信号,在另一个频段上发送信号;种类有同步卫星和近地轨道卫星;1.3 网络核心
网络核心即为由互联因特网端系统的分组交换机和链路构成的网状网络
通过网络链路和交换机移动数据有两种基本方法:电路交换和分组交换1.3.1 分组交换
报文执行控制功能或包含数据。端系统将报文划分小块数据,即分组。
分组通过通信链路和分组交换机传送。
分组在通信链路上以等于该链路的最大传输速率传输通过通信链路。因此如果某条链路的最大传输速率为Rbps,分组为L比特,则该链路传输该分组的时间为L/R秒;这个时间也被称为传输时延。
分组交换的常见方式是存储转发机制。
存储转发
大多数分组交换机采用存储转发机制来转发分组;
存储转发是指交换机将收到的部分分组缓存起来直到收到一个完整的分组,才会向出链路传输分组。
因为缓存等待一个分组的全部数据而导致的时间开销被称为存储转发时延。
忽略传播时延后的时延:d=(N+P)L/R  (N条链路,P个分组)
排队时延与分组丢失
每个分组交换器都有一个输出缓存,存储路由器准备发往那条链路的分组。如果该链路被占用就会发生缓存等待,等待的时间称为排队时延。时延取决于拥塞程度。


转发表与路由选择协议
        分组交换机之所以能够知道分组往哪去是因为其内部有一个转发表,这个表维护了IP地址和链路的对应关系,所以处理流程为:
通过分组的首部字节,获得目的端系统的IP地址;通过IP地址索引转发表,从而确定输出链路。1.3.2 电路交换
在电路交换网络中,端系统通信会话期间,交换机会预留端系统间通信路径上的相关资源(缓存,链路传输速率),即先建立连接,然后通信。传统的电话网络就是电路交换网络的例子。
电路交换网络中的复用
时分复用(Time-Division Multiplexing TDM):是指将时间划分为固定区间的帧,每个帧则又被划分为固定数量的时间空隙;当网络需要建立一条连接时,网络将在每个帧中为该连接指定一个时隙;在该时隙内,链路用来传输该链接的数据;
频分复用(Frequency-Division Multiplexing):将频率域划分为频段,然后将频段分配给连接;此频段被用来专门传输链接的数据。该频段的宽度称为带宽。
TDM传输速率=帧速率(每秒传多少帧)×每个帧中的比特数量  或总比特速率/时隙数1.3.3 分组交换和电路交换的对比
分组交换的优点:

    它提供了比电路交换更好的带宽共享;
    它比电路交换更简单、更有效、实现成本更低;
分组交换的缺点:
    分组交换不适合实时服务,因为端到端的时延是可变、不可预测的,这和整个网络的情况相关;
电路交换的优点:
    提供了端对端传输数据的速率保证;
电路交换的缺点:

    电路交换存在静默期,这是指专用电路空闲时,其占用的资源并没有得到充分的利用;
    建立连接的过程比较复杂;

总体上来说,分组交换的性能要好于电路交换的性能,但是不同类型的分组交换方式有不同的应用场景;比如一些对最低速率有着严格要求的应用,比如实时服务等,为了获得速率保证,牺牲网络的效率也是可以接受的。趋势向着分组交换发展
网络的网络1.3.4 网络的网络
不得不说,因特网是一个庞大而复杂的系统,但是我们仍然有办法描述它(我们不是已经这么做过了吗?),但是我们需要一个模型来刻画因特网的结构;该用什么样的结构来刻画因特网呢?我想,最普遍的说法就是:因特网是网络的网络。但是这一说法足够精炼的同时也不够明确。更重要的是,我们可以选择更明确的方法来刻画因特网;书中通过5个模型不断过渡到最终模型,其实过渡的过程就结构不断合理、连接方式不断明确的过程。
我们在什么是因特网 一节中介绍ISP,端系统是通过ISP接入因特网的,为了实现端系统的互联,ISP也必须互联,其实网络模型就是用来表达ISP和端系统以及ISP之间的结构的抽象;
网络结构1:存在唯一的全球承载ISP互联所有的接入ISP,这是指,全球ISP是一个又路由器和通信链路构成的网络,该网络跨越全球,并且其他的接入ISP都至少和一个它的路由器相连;
网络结构2:存在多个全球承载ISP,它们分别于一部分的接入ISP互联;为了实现端系统的互联,这多个全球ISP也必须互联;网络结构是一个两层结构,其中全球承载ISP位于顶层,接入ISP处于底层;
网络结构3:顶层全球承载ISP基本上已经定型,但是接入ISP现在还很混乱,比如,它们直接同顶层ISP相连;而网络结构3中,接入ISP也是分层的:较小区域中的ISP连入较大区域的ISP,而不是直接与顶层ISP相连;为什么会出现这样的结构呢?这是因为,如果都直接同顶层ISP相连,那么两个同一较小区域内,分属不同ISP的端系统之间通信的数据也会到顶层ISP中心去一趟,如果它们不是直接接入顶层ISP,而是接入了一个较大区域的ISP,那么它们之间的通信数据就不用去顶层ISP中心了,因为它们通过较大区域的ISP已经实现了互连,所以通信速度肯定就上去了。
网络结构4:是在网络结构3的基础上,增加了以下特点而形成的结构:存在点(Point of Presence,PoP)、多宿、对等、因特网交换点(Internet exchange point,IXP)。

    PoP存在于等级结构中所有层次,但是底层ISP除外;一个PoP是ISP网络中的一台或者多台路由器群组,其中客户ISP能够通过第三方提供的高速链路直接将它的路由器和供应商的PoP连接,从而实现与提供商ISP连接。这样接入速度很明显就提高了。
    多宿(multi-home)是指,任何ISP(除第一层ISP)都可以与两个或者多个提供商ISP连接,这被称为多宿;这样网络的可靠性就提高了
    对等(peer) 是指,位于相同等级结构层次的一对邻近ISP能够直接将它们的网络连接到一起,使它们之间流量经直接连接而不是经过上游的中间ISP传输,这样既不用付费,速度也可能会快一些;
    因特网交换点是为了实现多个ISP可以对等而创建的。
网络结构5:网络结构5是在网络结构4的基础上增加了内容提供商网络而构成。内容提供商构建自己的网络,并且通过与较低层ISP对等而“绕过”较高层因特网ISP,而且内容提供商对端用户也有了更多的控制。
总体来说,今天的因特网是一个“网络的网络”,其结构复杂,由十多个顶层ISP和数十万个较低层ISP构成。近年来,主要的内容提供商创建自己的网络,直接在可能的地方与较低层ISP互联1.4 分组交换中的时延、丢包、吞吐量
因特网能够看成是一种给运行在端系统上的分布式应用提供服务的基础设施
计算机网络必定要要限制在端系统之间的吞吐量,故在端系统之间存在时延、丢包;1.4.1 分组交换网中的时延概述
一个分组在沿途每个节点承受不同类型的时延,这些时延中最为重要的是:结点处理时延、排队时延、传输时延和传播时延.这些时延总体累加起来是结点总时延
时延的类型
处理时延
处理时延是因为检查首部字节并决定其出链路(索引转发表等操作)而产生,通常在微秒或者更低数量级;
排队时延
排队时延是因为分组所对应的出链路前面有其他分组正在传输,所以分组需要该链路的缓冲队列里等待其他分组传输完毕而产生的;一般来说,排队时延是到达该队列的流量强度和性质的函数,通常可以达到毫秒级到微秒级;
传输时延
传输时延是将缓存中分组的所有比特传输向链路所需要的时间,实际的传输时延通常在毫秒到微秒数量级。用L表示分组的长度,用Rbps表示从路由器A到B的链路传输速率。传输时延是L/R。
传播时延
传播时延是指一个比特进入链路后到达下一个路由器所用的时间;一旦分组中的最后一个比特到达路由器就意味着该分组的所有比特都已到达路由器;广域网中,传播时延一般是毫秒级的。传播时延是d/s。d是路由器A到B的距离。s是链路的传播速率。
传输时延和传播时延的对比
如果打个比方的话,传输时延就是一堆车(一个分组一堆比特)经过收费站的时间而传播时间就是车在高速公路上行驶的时间。传输时延是分组长度和链路传输速率的函数。传播时延是两台路由器间距离的函数。传播时延小于传输,第一个比特到达下一个路由器,分组的其他比特还在往链路上传输。1.4.2 排队时延和丢包
丢包:由于空间有限无法缓存整个分组时,路由器将丢弃该分组
排队时延和丢包与网络的状况和结点的缓冲空间大小、处理速度相关;如果分组到达的速度高于结点的处理速度,那么分组就会在缓冲队列里排队等待。当缓冲空间用完后,如果还有到的分组,那么该分组将被迫丢弃
为了描述网络状体,我们引入了流量强度这一概念:流量强度=分组到达的速度/结点的处理速度;流量工程里一个金科玉律就是:设计系统时流量强度不能大于1;
当流量强度持续大于1时,就将出现丢包现象1.4.3 端到端时延

路由器接受到指定分组、目的端系统接收到所有分组都会向源返回一个报文,包括路由器地址名字、往返时延。1.4.4 计算机网络的吞吐量
计算机网络的吞吐量实际上是一个速度指标,它描述了比特经过某个节点的速度。对于某条路径上的结点来说,和该结点有关的速度有两个:接收数据的速度和发送数据的速度,而该结点的吞吐量是这两个速度中较小的一个;对于某条路径来说,该路径的吞吐量则是所有节点的吞吐量的最小值;网络的吞吐量可以衡量网络的性能.
任何时间的瞬时吞吐量是主机B接受到该文件的速率
如果该文件由F比特组成,主机B接受到所有比特用去Ts,则文件的平均吞吐量为F/Tbps
吞吐量可以近似为源和目的地之间路径的最小传输速率。最小传输速率的链路为瓶颈链路。
在今天,因特网对吞吐率的限制因素通常是接入网。1.5 协议层次及其服务模型
因特网是一个极为复杂的系统,该系统里存在着大量的应用程序和协议、各种类型的端系统、分组交换机和各种类型的链路级媒体。面对这种复杂性,接下来将组织网络体系结构。1.5.1 分层体系结构
计算机网络采用分层的体系结构,分层的体系结构因为提供模块化而具有很高的价值,同时也易于服务实现的多样性:某一层对其上一层提供服务,同时它可以利用下一层提供的服务。只要对上提供的服务和对下利用的服务没有变化,其层内部的实现并不会对系统结构产生影响(按时间等级按vip等级并不影响起飞);对于大而复杂且需要不断更新的系统来说,改变服务的实现而不影响系统其他组件是分层模式的另一个重要优点(类似系统解耦)
为了给网络协议的设计提供一个结构,网络设计者以分层的方式组织协议以及实现这些协议的软硬件
一个协议层可以使用软硬件实现,同时某个协议层的不同部分常常位于网络组件的各部分。协议分层具有概念化和结构化的优点。模块化使得更新系统组件更为容易。但是分层也有其缺点,就是功能上的冗余,比如许多协议栈针对链路和端到端两种情况都提供了差错恢复功能。第二种潜在的缺点就是某层的功能可能需要仅在其它层才出现的信息
总体来说,将各层的所有协议组合起来,称为协议栈。因特网的协议栈有5个层次组成:物理层、链路层、网络成、传输层、应用层

    应用层:应用层协议分布在多个端系统,端系统中的应用程序使用该协议与另一个端系统中的应用程序通信。处于应用层的分组称为报文;
    传输层:传输层在应用程序端点之间传输应用层报文,因特网中有两个传输层协议:TCP和UDP。处于传输层的分组称为报文段。TCP提供应用层报文向目的地的确保传递、流量控制、拥塞控制机制。UDP提供无连接服务,即不提供不必要服务的服务。没有可靠性、没有流量和拥塞控制。向网络层提供报文段和目的地址。
    网络层:网络层将称为数据报的网络层分组从一台主机移动到另一台主机。网络层协议包含IP协议(定义数据报中各字段以及端系统、路由器如何利用这些字段)以及其他一些路由选择协议(使数据报根据该路由从源传输到目的地)。
    链路层:链路层将称为帧的链路层分组从一个结点(主机、路由器)移动到路径上的另一个端点。一个帧可能被沿途不同链路上的不同链路层协议处理。链路层将数据报传输给网络层。
    物理层:物理层的任务是将帧中的比特从一个结点移动到下一个节点,它提供了传输信息的实际物理通道,以太网有许多物理协议关于双绞线、光纤等;
OSI模型
在因特网协议栈出现以前,OSI模型是ISO组织研发的计算机网络结构模型。OSI的模型一共有7层,从下到上依次为:物理层,链路层,网络层,传输层,会话层,表示层,应用层。相比因特网体系结构,OSI多了两层。
因特网将两层的功能留给了开发者自行实现。表示层使通信的应用程序能够解释交换数据的含义,
会话层提供数据交换定界和同步功能。1.5.2 封装
一个分组,在不同的层次有不同的称谓,是因为它们经过每一层的时候就被该层封装上了属于该层的相关信息,也就是前面提到的的必要信息;于是,每一分层的分组有两种类型的字段:首部字段和有效载荷字段;其中有效载荷字段即为来自上一层的分组数据,而首部字段就是该层加上的必要信息;分组不断被封装(报文分多报文段进而多数据包,最后重构报文)以实现各层协议规定的相关功能第二章、应用层2.1 应用层协议原理
研发网络应用的核心是写出能够运行在不同端系统和通过网络彼此通信的程序;值得注意的是,我们不需要写在网络核心设备如路由器或者链路层交换机上运行的软件,这种设计方式即将应用程序限制在端系统的方法,促进了大量网络应用程序的迅速研发和部署2.1.1 网络应用程序体系结构
应用程序的体系结构不同于网络的体系结构。从应用程序研发者的角度来看,网络体系结构是固定的,并为应用程序提供特定的服务集合;应用程序体系结构由应用程序研发者设计,它规定了在端系统上如何组织应用程序。两种常见的现代网络应用程序所采用的体系结构为:客户-服务器体系结构和对等体系结构
客户-服务器体系结构
在该体系结构中,有一个总是打开的主机,即服务器,它接收和响应来自被称为客户的主机的请求;客户之间是不直接通信的,因为服务器具有固定的、周知的地址,客户通过IP地址向服务器发送分组进行联系
客户-服务器体系结构的著名应用有:Web、FTP、Telnet和电子邮件。
通常,如果仅有一台服务器处理所有的请求,那么服务器系统将很快变得不堪重负,为此,配备大量主机的数据中心常被用于创建强大的虚拟的服务器,一个数据中心可以有数十万台服务器,它们需要供电和维护,同时服务提供商还需要支付不断出现的互联和带宽费用,以及发送和接收到达/来自数据中心的数据;
P2P体系结构
应用程序对位于数据中心的服务器有着最小依赖,在间断连接的主机(对等方)对之间使用直接通信。对等方并不为服务提供商所拥有,因为这种对等方通信不需要通过专门的服务器,所以该体系结构也被称为对等方到对等方结构
目前,流量密集型应用都是P2P体系结构的。这些应用包括文件共享(例如BitTorrent)、协助下载(例如迅雷)、因特网电话(例如Skype)和IPTV(例如迅雷看看)。
值得注意的是,某些应用具有混合的体系结构,它们结合了客户-服务器和P2P这两种体系结果,比如许多的即时通讯工具,服务器用来跟踪用户IP地址,但是用户之间的通信则使用直接发送
P2P体系结构的特性之一就是它们的自扩展性。比如在文件共享应用中,对等方可能通过向文件的原始拥有者发出请求而产生工作量,但是对等方也有可能通过为其他对等方传送文件而为原始拥有者分担压力;p2P体系结构也是成本有效的,通常不需要庞大的服务器基础设施和服务带宽。
但是P2P也面临着以下三个问题:
    ISP友好。住宅ISP已经受制于非对称带宽应用,但P2P改变了从服务器到住宅ISP的上载流量;
    安全性。其高度的分布和开放式,P2P应用也存在安全问题;
    激励。让用户向应用提供带宽、存储和计算资源2.1.2 进程通信
在操作系统中,进行通信的是进程。进程间通信机制由端系统上的操作系统确定。
当进程运行在不同的端系统上时,它们通过交换报文相互通信;发送进程产生报文并且向网络中发送,接收进程接收报文并对此作出响应。
客户进程和服务器进程
发起通信的进程被标记为客户进程,在会话开始时等待联系的进程被称为服务器进程。
进程与计算机网络之间的接口
进程通过称为套接字的软件接口向网络发送、接收报文。套接字是同一台主机内应用层和运输层之间的接口。由于该套接字是建立网络应用程序的可编程接口,因此套接字也被称为应用程序和网络之间的应用编程接口(Application Programming Interface).
应用程序开发者可以控制套接字在应用层端的一切内容,但是对于运输层仅限于:选择传输层协议和设定几个传输层参数,比如最大缓存和最长传输层报文长度。

进程寻址
发送分组需要一个地址标志某台主机上运行的进程(准确来说是进程的套接字)。标记由两部分组成:接收进程所在的主机地址和接收进程的标记符;即IP地址和端口号。2.1.3 可供应用程序使用的运输服务
传输层协议的特点大致可以从以下这四个方面考量:可靠数据传输、吞吐量、定时和安全性
可靠数据传输
路由器溢出、比特损坏后被抛弃会造成数据丢失。协议可以确保数据交付,即提供了可靠数据传输。
像一些音频、视频是容忍丢失的应用。
吞吐量
可用吞吐量就是指能够向接收进程交付比特的速率。
因为会有其他会话共享该网络的路径的带宽,并且因为这些会话的到来和离开,可用吞吐量将发生变化;这就导致另一种自然的服务,即运输层协议能够提供确切的可用吞吐量。使用这种服务时,应用程序就能以明确的速度接收数据,并且运输层应当保证可用吞吐量必须总是至少为该速度;
对吞吐量有明确要求的应用程序被称为带宽敏感的应用(多媒体应用)。弹性应用则对吞吐量没有严格的要求,如电子邮件、文件传输以及web传送等。
定时
Z游戏、视频等是需要运输层协议提供定时保证,即发送方注入套接字的每个比特到达接收方的套接字不迟于1××ms
安全性:机密性,数据完整性,断点检测
机密性:运输协议加密发送进程传输的数据,并解密给接收进程
2.1.4 因特网提供的传输层服务

因特网(更一般的是TCP/IP网络)为应用程序提供两个运输层协议,即UDP和TCP。每个协议对应用程序提供了不同服务的集合。以下为常见的因特网应用的特点:

TCP服务
TCP服务模型包括了面向连接的服务和可靠数据传输服务。

    面向连接的服务:在应用层数据报文开始流动之前,TCP会在客户端和服务器端相互交换传输层控制信息。即第一次握手将建立一条全双工的TCP连接,提示客户端和服务器端为即将到来的大量分组做好准备;双方使用该条链接可以同时进行报文的收发,连接将在通讯结束后拆除。
    可靠的数据传输:通信进程使用TCP协议可实现无差错、按适当顺序交付所有发送的数据,没有字节的丢失和冗余;
TCP服务还提供了拥塞控制机制。当发送方和接收方之间的网络出现拥塞时,会抑制发送进程。也会试图限制TCP连接。
SSL处于应用层,为TCP提供加密、数据完整性和端点鉴别服务。

UDP服务
UDP服务是仅提供最小服务的轻量级运输协议。是无连接的也就是说通信之前没有握手,不提供数据的可靠传输;UDP也没有拥塞控制机制,发送端可以选择任意速率向网络层注入数据。有些应用场景下,UDP协议将带来更多的便利和效率,比如DNS和一些因特网电话服务(为了避免拥塞控制协议的控制而使用UDP)
传输层无法提供的服务
从可靠数据传输、吞吐量、定时、安全性等四个角度来看运输层提供的服务,我们发现,运输层无法对吞吐量和定时做出保证。但是,今天的因特网能够为时间敏感的应用提供满意的服务,尽管它并不提供任何定时或者带宽保证;
http和https和ssl和tcp/ip之间的关系和区别2.1.5 应用层协议
应用层协议定义了程序进程如何相互传递报文,它定义了:交换的报文类型(请求或者响应)、各种报文的语法、报文中字段的语义、一个进程何时以及如何发送报文 对报文进行响应的规则。
应用层协议是网络应用的一部分,如web应用包括浏览器、服务器、文档格式的标准(HTML)、一个应用层协议(如HTTP)2.1.6 本书涉及的应用层应用
即将介绍的应用包括:Web、文件传输、电子邮件、目录服务和P2P。
Web部分将介绍HTTP协议;FTP则和HTTP形成了对照;电子邮件是比Web更为复杂的应用,因为它使用了多个应用层协议;为因特网提供目录服务的DNS,它很好地说明了一种核心的网络功能(名字到地址转换)是如何在应用层实现的。P2P应用:文件共享应用、分布式查找服务。在第七章涉及多媒体应用:流式视频、IP电话。2.2 WEB和HTTP2.2.1 HTTP概述
HTTP(HyperText Transfer Protocol)是WEB的应用层协议;客户端程序和服务器程序实现了HTTP;HTTP定义了报文的结构 以及客户和服务器进行报文交换的方法;
Web页面是由一个HTML基本文件和几个引用对象组成。(Web服务器中)基本文件通过对象的URL地址引用其它对象。URL地址包括主机名和对象的路径名ww.sss.com(主机名)/docu/aa.gif(路径名)。
客户和服务器交互的核心思想是客户通过HTTP请求对服务器发出对Web页面的请求报文,服务器收到该报文后将返回包含该对象的HTTP响应报文。
HTTP使用TCP作为它的支持运输协议,HTTP客户首先发起一个与服务器的TCP连接,连接建立后进程就可以通过套接字接口访问TCP,从而保证了可靠数据传输。也利用了分层的设计优点 HTTP不用关心数据丢失、乱序恢复这些较底层协议的工作。
需要注意的是,服务器不存储任何关于该客户的状态信息,所以被称为无状态协议。2.2.2 持续连接和非持续连接
每个请求/响应是经一个单独的TCP,该应用程序使用持续连接;如果是同一个TCP,则称为非持续连接。
采用非持续连接的HTTP
建立连接过程:
HTTP客户进程通过端口发起到服务器www.dsd.com的TCP连接,客户和服务器上分别有一个套接字与该连接相关联;
HTTP客户经套接字向服务器发送HTTP请求报文,保温包括asd/asas/sad.index路径名;
HTTP服务器经套接字接收报文,检索出对象www....index,在响应报文中封装该文件对象通过套接字发送;
HTTP服务器通知TCP确认客户接收报文后断开连接;
HTTP客户接收响应报文并从中提取HTML文件,得到其中的URL引用;
这时客户可以采取串行或者并行方式获取引用对象。
使用非持续连接时,每个TCP连接只传送一个请求报文和响应报文,在服务器发送一个对象后就会关闭;
RTT(Round-Trip Time):一个短分组从客户端到服务器,然后再返回客户端所用的时间,包括分组的传播时延、排队时延、处理时延(因为是短分组,所以其传输时延可不计);
响应时间是两个RTT加上服务器传输HTML的时间,包含了“三次握手过程”:服务器对接收到的小TCP报文段做出确认和响应,客户端发送请求,服务端发送响应。
缺点:对每个连接,客户和服务器都要分配TCP缓冲区和保持TCP变量,给服务器带来了严重负担;每一个对象都要经受两倍的RTT的交付延迟。
采用持续连接的HTTP
持续连接:服务器在发送响应报文后将保持该TCP打开,后续客户端可以使用该连接来向服务器发出请求
一条连接在一定时间间隔后没被使用,就会被关闭。HTTP默认使用带流水线的持续连接。2.2.3 HTTP报文格式:请求报文和响应报文
请求报文

请求报文的第一行称为请求行,其后继的各行被称为首部行。
请求行包含三个内容:方法字段、URL字段、HTTP版本;其中方法字段可为:GET、POST、PUT、DELETE、HEAD等。URL字段里带有请求对象的标志;
首部行:Host指明了对象所在主机,是Web高速缓存所需要的;Connection:浏览器通知服务器在发送完响应报文后是否关闭TCP连接;浏览器类型(让服务器为不同的浏览器发送相同对象的不同版本);浏览器想得到的语言版本;
空行(Accpet行结束后亮哥回车换行符cr、lf);
“实体体”:当用户使用搜索引擎等需要向服务器提交表单时会用到post方法,提交的内容就是实体体;如果使用get,输入的数据扩展在URL中  www....edu/animalserach? monkeys&bananas
Head会用一个http报文进行响应,但是不返回请求对象,常用作调试跟踪。put方法允许用户上传对象到Web服务器上指定的路径。Delete方法允许用户或应用程序删除Web服务器上的对象。
HTTP响应报文格式

响应报文总体上也分三个部分,第一部分是状态行,包含HTTP版本字段、状态码以及相应状态信息;
第二部分是首部行:Connection:服务器通知浏览器关闭连接;Date:从文件系统中检索到该对象,插入到响应报文,并发送该响应报文的时间;Server:指示该报文是由什么服务器产生的、相应服务器;Last-Modified:与对象缓存有关; Connect-Length:被发送对象的字节数;Connect-Type:实体体中对象的类型;
空行
第三部分是实体体:请求对象。
常见状态码
200 OK:请求成功 处理方式:获得响应的内容,进行处理
301 Moved Permanetly:请求的对象转移到了新的URL,URL在首部段的Location  处理方式:重定向到分配的URL
400 Bad Request:非法请求 处理方式:丢弃
404 Not Found:文件不在服务器 处理方式:丢弃
505:服务器不支持请求报文使用的http版本2.2.4 用户与服务器的交互:Cookie

Cookie可以在无状态的HTTP上建立一个用户会话层,浏览器向服务器发送Cookie信息,服务器在用户和应用程序会话过程中标志该用户,关联用户相关的信息。P73!!!
Cookie技术包含4个组件
    HTTP响应报文里增加一个关于Cookie的首部行;
    HTTP请求报文里增加一个关于Cookie的首部行;
    用户端系统保留一个Cookie文件,由浏览器管理;
    位于Web站点的一个后端数据库;
2.2.5 Web缓存
Web缓存器又称为代理服务器。它有自己的存储空间,并在存储空间里保持有最近请求过的对象的副本;可以通过配置浏览器,使指向指向初始服务器的请求先指向代理服务器。
当代理服务器收到一个HTTP请求后,检查本地是否缓存过该对象,如果缓存过该对象则检查是否过期,如果没有过期则直接将该对象返回给浏览器;如果本地不存在或者存在已过期,则代理服务器将根据请求报文里的Host首部行以及请求行里的URL字段向初始服务器发出请求,然后将响应对象返回给浏览器并缓存在本地。
优点:减少了请求的响应时间;减少了接入因特网的通信量从而改善了服务器端应用的性能。P75有关缓存器解决方案、响应时间??
通过使用内容分发网络(Content Distribution Network),使大量的流量实现了本地化,有点像主存。
Web缓存即是客户又是服务器2.2.6 条件GET方法
缓存器中文件副本可能是过期的,HTTP提供了一种机制——条件GRT,允许缓存器证实其使用的对象是最新的。
通过缓存器向浏览器响应时,缓存器不仅缓存了对象,还存储了它的最后修改时间。当再次请求时,缓存器向服务器发送一个条件GET执行最新检查。
增加一个If-Modified-Since首部行,时间是上一次缓存所保存的Last-Modified。服务器响应报文 304且不带有实体体,即没有修改,缓存器就可以将缓存响应给浏览器。2.3 文件传输协议FTP
用户首先提供远程主机的主机名,使FTP客户进程建立到远程主机FTP服务器进程的TCP连接,之后用户提供用户标识和密码,它们作为FTP命令的一部分在该TCP连接上传输;服务器向用户授权,用户便可以和服务器进行文件传输。
HTTP和FTP都是应用层(文件传输)协议,都运行在TCP协议上。区别:FTP使用俩个并行的TCP连接来传输数据,一个TCP被称为控制连接,用来传输控制信息如用户标识密码、存取指令等;一个TCP连接被称为数据连接,用于传输文件数据;
FTP协议其控制信息是通过一个独立的TCP连接传输,所以我们称FTP的控制信息是带外传送的;HTTP的控制信息和数据信息通过同一个TCP传输,称为

本文标签: 计算机网络 笔记 方法