Appearance
本章主要对TCP/IP协议族进行概述并为后续章节提供对应的背景知识
分层
网络协议通常分不同层次进行开发,每一层分别负责不同的通信功能,一个协议族,比如TCP/IP,是一组不同层次上的多个协议的组合,TCP/IP通常被认为是一个四层协议系统

每一层负责不同的功能
- 1.链路层,有时候也称为数据链路层或者网络接口层,通常包括操作系统中的设备驱动程序和计算机中对应的网络接口卡,它们一起处理传输媒介的物理接口细节
- 2.网络层,有时候也称为互联网层,处理分组在网络中的活动,例如分组的选路,在TCP/IP协议族中,网络层协议包括IP协议(网络协议),ICMP协议(Internet互联网控制报文协议)以及IGMP协议(Internet组管理协议)
- 3.运输层主要为两台主机上的应用程序提供端到端的通信,在TCP/IP协议族中,有两个互不相同的传输协议(TCP与UDP)
- TCP为两台主机提供可靠性的数据通信,它所做的工作包括把应用程序交给它的数据分成合适的小块交给下面的网络层,确认接收到的分组,设置发送最后确认分组的超时时钟等,由于运输层提供了高可靠的端到端通信,因此应用层可以忽略这些细节
- 另一方面,UDP为应用层提供一种非常简单的服务,它只是把称为数据报的分组 从一台主机发送到另一台主机,并不保证该数据报能达到另一端,其可靠性必须由应用层来提供
- 4.应用层负责处理特定的应用程序细节,几乎各种不同的TCP/IP实现都会提供下面通用的应用程序
- Telnet远程登录
- FTP文件传输协议
- SMTP简单邮件传输协议
- SNMP简单网络管理协议
假设在一个局域网(LAN)如以太网中有两台主机,二者都运行FTP协议,则该过程涉及到的协议如下图

大多数的网络应用程序都被设计成客户-服务器模式,服务器为客户端提供某种服务,上述图片就是描述了一个FTP客户程序和一个FTP服务器程序之间的交互情况,访问服务器所在主机上的文件
- 同一层上,双方都有对应的一个或多个协议进行通信,比如某个协议允许TCP层进行通信,另一个协议则允许两个IP层进行通信
- 在图的右侧,我们可以注意到应用程序通常是一个用户进程,而下三层一般在操作系统内核中执行,但要注意的是并不是必须这样处理,而是我们通常都是这样处理,比如UNIX操作系统
- 顶层和下三层还有个比较关键的不同之处,应用层关心的是应用程序的细节,而不是数据在网络中的传输活动,下三层要处理所有的通信细节但是对应用程序一无所知
网络接口层和应用层的目的是很明显的,前者处理通信媒介细节(以太网、令牌环网),后者处理某个特定的用户应用程序(FTP),但是从表面上看网络层和运输层之间的区别好像没有那么明显,为什么要区分为两个不同的层次?
- 要解答这个问题,我们需要把视野从单个网络扩展到一组网络,在80年代,网络不断增长的原因之一是大家都意识到只有一台孤立的计算机构成的“孤岛”没有太大意义,于是就把这些孤立的系统组在一起形成网络。随着这样的发展,到了90年代,我们又逐渐认识到这种由单个网络构成的新的更大的“岛屿”同样没有太大的意义。于是,人们又把多个网络连在一起形成一个网络的网络,或称作互连网(internet)。一个互连网就是一组通过相同协议族互连在一起的网络
- 构造互连网最简单的方法是把两个或多个网络通过路由器进行连接。它是一种特殊的用于网络互连的硬件盒。路由器的好处是为不同类型的物理网络提供连接:以太网、令牌环网、点对点的链接和FDDI(光纤分布式数据接口)等等
- 这些盒子也称作IP路由器(IP Router),但我们这里使用路由器(Router)这个术语。从历史上说,这些盒子称作网关(gateway),在很多TCP/IP文献中都使用这个术语。现在网关这个术语只用来表示应用层网关:一个连接两种不同协议族的进程(例如,TCP/IP和IBM的SNA),它为某个特定的应用程序服务(常常是电子邮件或文件传输)
从网络组的视野来看,我们可以重新构造一下刚才的协议图

一个包含两个网络的互连网,一个以太网一个令牌环网,通过路由器互相连接,以太网中的任何主机都可以与令牌环网中的任何主机进行通信,以上图为例子,我们可以划分为端系统(End System,两边的两台主机)和中间系统(Intermediate System,中间的路由器),应用层和运输层使用端到端协议,在图中,只有端系统需要这两层协议,网络层提供逐跳协议(Hop-by-hop),两个端系统和中间系统都要使用它
在TCP/IP协议族中,网络层IP提供的是一种不可靠的服务,也就是说,它只是尽可能快地把分组从源结点送到目的结点,但是并不提供任何可靠性保证,而另一方面,TCP在不可靠的IP层上提供了一个可靠的运输层。为了提供这种可靠的服务,TCP采用了超时重传、发送和接收端到端的确认分组等机制。由此可见,运输层和网络层分别负责不同的功能。
什么是逐跳?

数据经过网络1到达路由器,经过网络2到达路由器,经过网络3到达计算机B。这种传输方式称为逐跳(hop-by-hop),抽象地来看,数据在网络中的传输是从一个IP地址跳到另一个IP地址。
计算机、路由器都拥有一个路由表,路由表存储着指向特定网络地址的路径。

假设上图是计算机A的路由表,数据要到达目的地址IP1,下一跳的IP地址是IP4;数据要到达目的地址IP2,下一跳的IP地址是IP5
在TCP/IP协议族中有很多种协议,下图中的协议后续都会具体展开讨论

互联网的地址
互联网上的每个接口必须有一个唯一的internet地址,又称为IP地址,IP地址长32bit,五类不同的互联网地址格式如下图所示

这些32位通常写作4个十进制的数,其中每个整数对应一个字节(点分十进制表示法),比如140.251.13.32
区分各类地址的最简单方法就是看它的第一个十进制整数,各类地址的第一个十进制整数都有一个自己的范围

由于互联网上的每个接口必须有一个唯一的IP地址,因此必须要有一个管理机构为接入互联网的网络分配IP地址,这个管理机构就是互联网网络信息中心(InterNIC),InterNIC只分配网络号,主机号的分配由系统管理员负责
Internet注册服务(IP地址和DNS域名)过去由NIC来负责,其网络地址是nic.ddn.mil。1993年4月1日,InterNIC成立。现在,NIC只负责处理国防数据网的注册请求,所有其他的Internet用户注册请求均由InterNIC负责处理,其网址是:rs.internic.net,事实上InterNIC由三部分组成:注册服务(rs.internic.net),目录和数据库服务(ds.internic.net),以及信息服务(is.internic.net)
域名系统
我们通过IP地址可以识别主机上的网络接口从而访问主机,但是我们一般更经常使用主机名,DNS是个分布的数据库,由它来提供IP地址与主机名之间的映射信息
任何应用程序都可以调用一个标准的库函数来查看给定名字的主机的IP地址。类似地,系统还提供一个逆函数—给定主机的IP地址,查看它所对应的主机名
封装
当应用程序使用TCP传送数据时,数据被送入协议栈,然后逐个通过每一层直到被当作一串比特流送入网络,其中每一层对收到的数据都要加一些首部信息或尾部信息,TCP传给IP的数据单元称为TCP报文段或者简称为TCP段(TCP segment),IP传给网络接口层的数据单元称为IP数据报,通过以太网传输的比特流称为帧,大学的计算机网络中其实已经学了很多了,后续会继续讨论
分用
当目的主机收到一个以太网数据帧的时候,数据就开始从协议栈中由底向上升,同时去掉各层协议加上的报文首部,每层协议都要检查报文首部中的协议标识,以确定接受数据的上层协议,这个过程称为复用