linux下socket通信之通信模型

  导读:
  1.Socket简介
  Socket是TCP/IP网络的API,可以用它来开发网络应用程序,Socket数据传输是一种特殊的I/O,Socket也是一种文件描述符
  2.Socket的建立
  int socket(int domain, int type, int protocol)
  函数返回:一个整型的Socket描述符,可以在后面调用它。
  参数说明:
  int domain:指明所使用的协议族, 通常是PF_INET, 表示网络(TCP/IP)协议族说明我们网络程序所在的主机采用的通讯协族(AF_UNIX和AF_INET等).
  AF_UNIX:只能够用于单一的Unix系统进程间通信,
  AF_INET:是针对Internet的,因而可以允许在远程主机之间通信(当我们man socket时发现domain可选项是 PF_*而不是AF_*,因为glibc是posix的实现所以用PF代替了AF,不过我们都可以使用的)
  int type:指定socket的类型, 通常是 SOCK_STREAM 流式Socket这样会提供按顺序的,可靠,双向,面向连接的比特流和SOCK_DGRAM数据报式Socket这样只会提供定长的,不可靠,无连接的通信
  int prottocol:通常为0 由于我们指定了type,所以这个地方我们一般只要用0来代替就可以了
  应用示例:int sockfd = socket(PF_INET, SOCK_STREAM, 0);
  
  3.Socket配置
  Socket描述符是一个指向内部数据结构的指针,它指向描述符表入口。调用Socket函数时,socket执行体将建立一个Socket,实际上"建立一个Socket"意味着为一个Socket数据结构分配存储空间。Socket执行体为你管理描述符表。
  两个网络程序之间的一个网络连接包括五种信息:通信协议、本地协议地址、本地主机端口、远端主机地址和远端协议端口。Socket数据结构中包含这五种信息。
  通过socket调用返回一个socket描述符后,在使用socket进行网络传输以前,必须配置该socket:
  1) 面向连接的socket客户端通过调用Connect函数在socket数据结构中保存本地和远端信息。
  2) 无连接socket的客户端和服务端以及面向连接socket的服务端通过调用bind函数来配置本地信息。
  
  4.Bind()
  Bind函数将socket与本机上的一个端口相关联,随后你就可以在该端口监听服务请求。
  函数原型:int bind(int sockfd, struct sockaddr *my_addr, int addrlen);
  函数返回:成功被调用时返回0;出现错误时返回"-1"并将errno置为相应的错误号。
  参数说明:
  Sockfd:是调用socket函数返回的socket描述符,
  my_addr:是一个指向包含有本机IP地址及端口号等信息的sockaddr类型的指针;
  addrlen:常被设置为sizeof(struct sockaddr)。
  1> struct sockaddr结构类型是用来保存socket信息的:
  struct sockaddr
  {
  unsigned short sa_family; /* 地址族, AF_xxx */
  char sa_data[14]; /* 14 字节的协议地址 */
  };
  sa_family:一般为AF_INET,代表Internet(TCP/IP)地址族;
  sa_data:则包含该socket的IP地址和端口号。
  2>sockaddr_in结构类型:
  struct sockaddr_in
  {
  short int sin_family; /* 地址族 */
  unsigned short int sin_port; /* 端口号 */
  struct in_addr sin_addr; /* IP地址 */
  unsigned char sin_zero[8]; /* 填充0 以保持与struct sockaddr同样大小sin_zero用来将sockaddr_in结构填充到与struct sockaddr同样的长度,可以用bzero()或memset()函数将其置为零。 */
  };
  这个结构更方便使用。
  指向sockaddr_in 的指针和指向sockaddr的指针可以相互转换,这意味着如果一个函数所需参数类型是sockaddr时,你可以在函数调用的时候将一个指向ockaddr_in的指针转换为指向sockaddr的指针;或者相反。使用bind函数时,可以自动获得本机IP地址和随机获取一个没有被占用的端口号:系统随机选择一个未被使用的端口号,通过将my_addr.sin_port置为0,函数会自动为你选择一个未占用的端口来使用。填入本机IP地址:通过将my_addr.sin_addr.s_addr置为INADDR_ANY,系统会自动填入本机IP地址。
  注意在使用bind函数是需要将sin_port和sin_addr转换成为网络字节优先顺序;而sin_addr则不需要转换。计算机数据存储有两种字节优先顺序:高位字节优先和低位字节优先: Internet上数据以高位字节优先顺序在网络上传输,所以对于在内部是以低位字节优先方式存储数据的机器,在Internet上传输数据时就需要进行转换,否则就会出现数据不一致。
  下面是几个字节顺序转换函数: (h: host n: network l: long s: short)
  htonl():把32位值从主机字节序转换成网络字节序, 转为高位字节优先
  htons():把16位值从主机字节序转换成网络字节序, 转为高位字节优先
  ntohl():把32位值从网络字节序转换成主机字节序, 从高位字节优先转换
  ntohs():把16位值从网络字节序转换成主机字节序, 从高位字节优先转换
  需要注意的是,在调用bind函数时一般不要将端口号置为小于1024的值,因为1到1024是保留端口号,你可以选择大于1024中的任何一个没有被占用的端口号。
  应用示例:
  A)服务端
  1)建立结构变量
  struct sockaddr_in my_addr;
  int SERVPORT;
  
  2)配置协议族、端口、地址、sin_zero填充位
  my_addr.sin_family = AF_INET;
  my_addr.sin_port = htons(SERVPORT);
  my_addr.sin_addr.s_addr = INADDR_ANY;
  bzero(&(my_addr.sin_zero), 8);
  
  3)把sockfd的本地端口、IP地址、连接协议进行绑定
  if( bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr))== -1)
  {
  perror("bind");
  return 1;
  }
  
  
  B)客户端
  1)建立结构体变量和端口号
  struct sockaddr_in serv_addr;
  struct hostent *host;
  int SERVPORT;
  
  
  //struct hostent *host; 把服务器端IP通过gethostbyname赋给host结构体,如果传入的是域名则转为IP地址再赋值
  if((host = gethostbyname(“www.800hr.com”)) == NULL)
  //或 if((host = gethostbyname(“192.168.0.1”)) == NULL)
  {
  herror("gethostbyname error");
  return 1;
  }
  else
  {//输出IP地址: xxx.xxx.xxx.xxx
  printf("host: %s\n", inet_ntoa(*((struct in_addr*)host->h_addr)));
  }
  
  
  2)建立Socket
  if((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1)
  {
  perror("create sock");
  return 1;
  }
  
  3)给服务端结构变量赋值
  serv_addr.sin_family = AF_INET;
  serv_addr.sin_port = htons(SERVPORT);
  serv_addr.sin_addr = *((struct in_addr *)host->h_addr);
  bzero(&(serv_addr.sin_zero), 8);
  
  4)连接服务端
  //int connect(int socfd, struct sockaddr *serv_addr, int addrlen)
  进行客户端程序设计无须调用bind(),因为这种情况下只需知道目的机器的IP地址,而客户通过哪个端口与服务器建立连接并不需要关心,socket执行体为你的程序自动选择一个未被占用的端口,并通知你的程序数据什么时候到达端口
  
  Connect函数启动和远端主机的直接连接。只有面向连接的客户程序使用socket时才需要将此socket与远端主机相连。
  面向连接的服务器从不启动一个连接,它只是被动的在协议端口监听客户的请求。
  无连接协议从不建立直接连接。
  
  if(connect(sockfd, (struct sockaddr *)&serv_addr, sizeof(struct sockaddr)) == -1)
  {
  perror("create sock");
  return 1;
  }
  
  5.Listen()
  Listen函数使socket处于被动的监听模式,为该socket建立一个输入数据队列,将到达的服务请求保存在此队列中,直到程序处理它们。
  函数原型:int listen(int socfd, int backlog)
  参数说明:
  sockfd 是socket()函数返回的socket描述符
  backlog 指定在请求队列中允许的最大请求数, 进入的连接请求将在队列中等待accept它们
  如果一个服务请求到来时,输入队列己满, 此socket将拒绝连接请求,客户收到一个出错信息。
  应用实例:
  int BACKLOG = 20;
  if(listen(sockfd, BACKLOG) == -1)
  {
  perror("listen");
  return 1;
  }
  
  6.accept()
  在建立好输入队列后,服务器就调用accept函数,然后睡眠并等待客户的连接请求。
  函数原型:int accept(int sockfd, void *addr, int *addrlen);
  参数说明:
  sockfd 被监听的socket描述符
  addr sockaddr_in变量的指针,该变量用来存放请求服务的客户机的信息
  addrlen 通常是sizeof(struct sockaddr_in)
  返回值:-1出错,client_fd 成功
  [注]:当accept函数监视的socket收到连接请求时,socket执行体将建立一个新的socket,执行体将这个新socket和请求连接进程的地址联系起来,收到服务请求的初始socket仍可以继续在以前的 socket上监听,同时可以在新的socket描述符上进行数据传输操作。
  应用实例:
  int client_fd;
  sin_size = sizeof(struct sockaddr_in);
  if((client_fd = accept(sockfd, (struct sockaddr *)&remote_addr.sin_addr, &sin_size)) == -1)
  {
  perror("accept");
  continue;
  }
  
  7.send()
  函数原型:int send(int sockfd, const void *msg, int len, int flags);
  参数列表:
  Sockfd:接收数据的socket方的id
  msg: 要发送数据的指针
  len: 以字节为单位的数据的长度
  flags: 一般为0
  返回值:失败 -1,成功 发送成功的字节数
  应用实例:
  char *msg = "Hello!";
  int len, bytes_sent;
  。。。
  len = strlen(msg);
  bytes_sent = send(client_fd, msg,len,0);
  。。。
  
  8.recv()
  函数原型:int recv(int sockfd, void *buf, int len, unsigned int flags);
  参数列表:
  Sockfd:接收数据的socket的fd
  Buf: 存放数据的数据缓冲区
  Len: len是缓冲的长度
  flags: 通常为0
  返回值:成功 实际接收的字节数,错误 -1。
  应用实例:
  while(1)
  {
  recvbytes = recv(sockfd, buf, MAXDATASIZE, 0);
  if(recvbytes <= 0)
  break;
  fwrite(buf,1,recvbytes, fp);
  };
  
  recv和send
  recv和send函数提供了和read和write差不多的功能.不过它们提供 了第四个参数来控制读写操作.
  int recv(int sockfd,void *buf,int len,int flags)
  int send(int sockfd,void *buf,int len,int flags)
  前面的三个参数和read,write一样,第四个参数可以是0或者是以下的组合
  MSG_DONTROUTE:不查找路由表
  MSG_OOB:接受或者发送带外数据
  MSG_PEEK:查看数据,并不从系统缓冲区移走数据
  MSG_WAITALL:等待所有数据
  MSG_DONTROUTE:是send函数使用的标志.这个标志告诉IP协议.目的主机在本地网络上面,没有必要查找路由表.这个标志一般用网络诊断和路由程序里面。
  MSG_OOB:表示可以接收和发送带外的数据.关于带外数据我们以后会解释的。
  MSG_PEEK:是recv函数的使用标志,表示只是从系统缓冲区中读取内容,而不清楚系统缓冲区的内容.这样下次读的时候,仍然是一样的内容.一般在有多个进程读写数据时可以使用这个标志。
  MSG_WAITALL:是recv函数的使用标志,表示等到所有的信息到达时才返回.使用这个标志的时候recv回一直阻塞,直到指定的条件满足,或者是发生了错误。
  1)当读到了指定的字节时,函数正常返回。返回值等于len
  2)当读到了文件的结尾时,函数正常返回.返回值小于len
  3) 当操作发生错误时,返回-1,且设置错误为相应的错误号(errno)。
  如果flags为0,则和read,write一样的操作.还有其它的几个选项,不过我们实际上用的很少,可以查看 Linux Programmer’s Manual得到详细解释。
  
  recvfrom和sendto
  这两个函数一般用在非套接字的网络程序当中(UDP),我们已经在前面学会了。
  recvmsg和sendmsg
  recvmsg和sendmsg可以实现前面所有的读写函数的功能.
  int recvmsg(int sockfd,struct msghdr *msg,int flags)
  int sendmsg(int sockfd,struct msghdr *msg,int flags)
  struct msghdr
  {
  void *msg_name;
  int msg_namelen;
  struct iovec *msg_iov;
  int msg_iovlen;
  void *msg_control;
  int msg_controllen;
  int msg_flags;
  }
  
  struct iovec
  {
  void *iov_base; /* 缓冲区开始的地址 */
  size_t iov_len; /* 缓冲区的长度 */
  }
  msg_name和 msg_namelen当套接字是非面向连接时(UDP),它们存储接收和发送方的地址信息.msg_name实际上是一个指向struct sockaddr的指针,msg_name是结构的长度.当套接字是面向连接时,这两个值应设为NULL. msg_iov和 msg_iovlen指出接受和发送的缓冲区内容.msg_iov是一个结构指针,msg_iovlen指出这个结构数组的大小. msg_control和msg_controllen这两个变量是用来接收和发送控制数据时的 msg_flags指定接受和发送的操作选项.和 recv,send的选项一样
  
  9.套接字的关闭
  关闭套接字有两个函数close和shutdown.用close时和我们关闭文件一样.
  shutdown
  int shutdown(int sockfd,int howto)
  TCP连接是双向的(是可读写的),当我们使用close时,会把读写通道都关闭,有时侯我们希望只关闭一个方向,这个时候我们可以使用shutdown.针对不同的howto,系统回采取不同的关闭方式。Howto = 0这个时候系统会关闭读通道.但是可以继续往接字描述符写.,howto=1关闭写通道,和上面相反,着时候就只可以读了。howto=2关闭读写通道,和close一样 在多进程程序里面,如果有几个子进程共享一个套接字时,如果我们使用shutdown, 那么所有的子进程都不能够操作了,这个时候我们只能够使用close来关闭子进程的套接字描述符.
  [附]
  Sendto()和recvfrom()用于在无连接的数据报socket方式下进行数据传输。由于本地socket并没有与远端机器建立连接,所以在发送数据时应指明目的地址。
  sendto()函数原型为:int sendto(int sockfd, const void *msg,int len,unsigned int flags,const struct sockaddr *to, int tolen);
  该函数比send()函数多了两个参数,to表示目地机的IP地址和端口号信息,而tolen常常被赋值为sizeof (struct sockaddr)。Sendto 函数也返回实际发送的数据字节长度或在出现发送错误时返回-1。
  Recvfrom()函数原型为:int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct sockaddr *from,int *fromlen);
  from是一个struct sockaddr类型的变量,该变量保存源机的IP地址及端口号。fromlen常置为sizeof (struct sockaddr)。当recvfrom()返回时,fromlen包含实际存入from中的数据字节数。
  Recvfrom()函数返回接收到的字节数或当出现错误时返回-1,并置相应的errno。
  如果你对数据报socket调用了connect()函数时,你也可以利用send()和recv()进行数据传输,但该socket仍然是数据报socket,并且利用传输层的UDP服务。但在发送或接收数据报时,内核会自动为之加上目地和源地址信息。
  
  10.结束传输
  当所有的数据操作结束以后,你可以调用close()函数来释放该socket,从而停止在该socket上的任何数据操作:close(sockfd)。
  你也可以调用shutdown()函数来关闭该socket。该函数允许你只停止在某个方向上的数据传输,而一个方向上的数据传输继续进行。如你可以关闭某socket的写操作而允许继续在该socket上接受数据,直至读入所有数据。
  int shutdown(int sockfd,int how);
  Sockfd是需要关闭的socket的描述符。参数 how允许为shutdown操作选择以下几种方式: 0 不允许继续接收数据,1 不允许继续发送数据,2 不允许继续发送和接收数据,均为允许则调用close ()
  shutdown在操作成功时返回0,在出现错误时返回-1并置相应errno。
  
  11.IP和域名的转换
  在网络上标志一台机器可以用IP或者是用域名.那么我们怎么去进行转换呢?
  struct hostent *gethostbyname(const char *hostname)
  struct hostent *gethostbyaddr(const char *addr,int len,int type)
  在中有struct hostent的定义
  struct hostent
  {
  char *h_name; /* 主机的正式名称 */
  char *h_aliases; /* 主机的别名 */
  int h_addrtype; /* 主机的地址类型 AF_INET*/
  int h_length; /* 主机的地址长度 对于IP4 是4字节32位*/
  char **h_addr_list; /* 主机的IP地址列表 */
  #define h_addr h_addr_list[0] /* 主机的第一个IP地址*/
  }
  gethostbyname:可以将机器名(如 linux.yessun.com)转换为一个结构指针,在这个结构里面储存了域名的信息。
  gethostbyaddr:可以将一个32位的IP地址(C0A80001)转换为结构指针。
  这两个函数失败时返回NULL 且设置h_errno错误变量,调用h_strerror()可以得到详细的出错信息。

留下评论

邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据