关于PHP中http请求的一个细节

缘起:

使用php的file_get_contents(…) 函数从广州发送一个http请求到北京,该请求的请求头和响应头如下:

现在,从广州到北京的一次数据的往返时间(就是ping的时间)为34ms,请求的执行时间为6ms; 因为请求头和相应头都非常小,分别一次tcp数据包就够,这样的话,一次http请求时间为: 34 + 34 + 6 = 74ms , 而实际却稳定在108ms左右,还有大约34ms不知去向

分析

根据这个丢失的时间长度来看,大概是多了一次数据的发送和接收; 通过tcpdump抓包发现如下现象:

file_get_contents(…)中实现的http请求,首先把请求行发送出去,收到请求行数据包的ack包后继续发送后续的请求头; 这样的话就凭空多出一次网络时间,其各种原因,有时间再看看PHP源码中为何如此实现吧。

测试了一下curl,没有这个问题。

IPv6的检测

看了一下如下脚本:

一次IPv6支持的检测需要5ms+的时间,成本是比较大的,但是,同一个进程中只检测一次,所以对于httpd进程来讲,这个是没有问题的

 

网络学习

实验目的:

1. 通过对链路层的抓包,了解网络结构及网关、路由的概念

实验场景:

10.49.4.65 和 10.49.4.64为同一个网段

实验步骤:

1. 在10.49.4.65上抓包

2. 从10.49.4.65上ping 10.4.4.64

 

抓包结果:

 

分析:

1.  第一个数据包,数据首先从10.49.4.65发送给网关; 因为路由表中有如下设置(大写G标志为经过网关):

(没有更精确匹配 10.49.4.64的路由了)

2. 10.49.4.64 上有如下路由配置(没有大写G,说明不需要经过网关):

(没有更精确匹配 10.49.4.65的路由了)

所以10.49.4.64可以直接回包给10.49.4.65; 但是10.49.4.64不知道10.49.4.65的mac地址是多少,于是先发了一个广播(第二个数据包,arp类型的),询问了一下; 10.49.4.65 回复了10.49.4.64的询问(第三个数据包,arp类型的),然后10.49.4.64就给出了icmp的响应包(第四个数据包)

总结

1. 添加一条路由,网关和接口至少指定一个

2. 只有同一个局域网下,才可以不经过网关(网关基本是有至少两块网卡的,用来连接不同的网络)

3. 指定网关的时候一般不需要同时指定接口

 

添加路由示例

1. 经过网关

2. 不经过网关

 

 

 

 

关于SO_DONTROUTE套接口选项的说明

转自:http://blog.csdn.net/sherlockhua/article/details/5365873

1 引子

在上一篇关于如何将套接口绑定到网络接口上的文章中,我曾经以为采用 SO_DONTROUTE 套接口选项能够实现和SO_BINDTODEVICE 选项同样的功能。但是实践证明不是这样。那么,其原因到底是为什么呢? SO_DONTROUTE 套接口选项真正的作用是什么呢?本文将对此予以解答。

2 问题求解

在 socket(7) 中对 SO_DONTROUTE 选项的说明如下:

SO_DONTROUTE

Don’t send via a gateway, only send to directly connected hosts.

The same effect can be achieved  by  setting  the  MSG_DONTROUTE

flag  on  a socket send(2) operation. Expects an integer boolean

flag.

这段话的核心意思是 SO_DONTROUTE 选项将导致数据包不经由网关发送,而是发往直接相连的主机。该套接口选项合法的值是整数形式的布尔标志值。

上述说明看起来似乎很明了,但是我 google 到的一些资料又说这个套接口选项将会绕过( bypass )路由表发送数据包,而且连 W. Richard Stevens 也是这样说的:“此选项规定发出的分组将旁路底层协议的正常路由机制。例如,对于 IPv4,分组被指向适当的本地接口,也就是目的地址的网络和子网部分所确定的本地接口。如果本地接口不能由目的地址确定(例如,目的主机不再一个点对点链路的另一端上,也不在一个共享网络上),则返回 ENETUNREACH 错误。……此选项经常由路由守护进程( routed 和 gated )用来旁路路由表(路由表不正确的情况下),强制一个分组从某个特定接口发出。” [UNIX 网络编程(第 1 卷),清华大学出版社,第 157 页 ] 。我不得不承认,正是这里的最后一句话,直接导致我认为可以通过 SO_DONTROUTE 套接口选项完成和 SO_BINDTODEVICE 同样的功能。但是实际上却并不是这样的。

为了解决这个问题,我编写了一个测试程序 udpsend2.c 。该程序要求要有三个参数,其中,第二个参数是数据包目的地的 IP 地址,第三个参数是一个开关,当为 on 时开启 SO_DONTROUTE 选项,当为 off 时关闭 SO_DONTROUTE 选项,默认情况下该选项是打开的。如果您理解该程序有困难,请先阅读《 UNIX 网络编程(第 1 卷)》。

 

如下编译程序:

[root@cyc src]# gcc -g -o udpsend2 udpsend2.c

3 对比测试

首先介绍一下初始时刻测试环境的设置情况,如下所示:

[root@cyc src]# uname -a

Linux cyc 2.4.20-8 #4 Sat Jan 20 19:42:09 CST 2007 i686 i686 i386 GNU/Linux

[root@cyc src]# ifconfig

eth0      Link encap:Ethernet  HWaddr 00:0D:87:EA:E3:AF

inet addr:202.115.26.224  Bcast:202.115.26.255  Mask:255.255.255.0

UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1

RX packets:40016 errors:0 dropped:0 overruns:0 frame:0

TX packets:85327 errors:0 dropped:0 overruns:0 carrier:0

collisions:0 txqueuelen:100

RX bytes:3063524 (2.9 Mb)  TX bytes:36469606 (34.7 Mb)

Interrupt:11 Base address:0xc000

[root@cyc src]# route

Kernel IP routing table

Destination     Gateway         Genmask         Flags Metric Ref    Use Iface

202.115.26.0    *               255.255.255.0   U     0      0        0 eth0

default         202.115.26.1    0.0.0.0         UG    0      0        0 eth0

这里,作者所在的子网为 202.115.26.0/24 ,默认网关为 202.115.26.1 ,用于发送数据包的主机为 202.115.26.224 。用于接收数据的两台远端主机的 IP 地址分别为 202.115.26.193 和 202.112.14.184 。 202.115.26.193 与发送主机 202.115.26.224 位于同一网段内,通过交换机相连;而 202.112.14.184 则与发送主机 202.115.26.224 之间没有直接相连,中间通过多个路由器连接。连接示意图如下所示:

 

3.1 同网段的测试

首先测试的是 202.115.26.193 。路由表设置如下所示:

[root@cyc src]# route

Kernel IP routing table

Destination     Gateway         Genmask         Flags Metric Ref    Use Iface

202.115.26.0    *               255.255.255.0   U     0      0        0 eth0

default         202.115.26.1    0.0.0.0          UG    0      0        0 eth0

如下启动程序:

[root@cyc src]# ./udpsend2 202.115.26.193 on

send 512 to remote end…

程序报告发送了 512 字节的数据给 202.115.26.193 ,尽管对方并没有真正接收数据包。如我们所知, UDP 是无连接的,它只负责将数据包发出去,至于对方有没有接收到, UDP 是不管的。

接下来,去掉路由表中的默认路由:

[root@cyc src]# route del default

[root@cyc src]# route

Kernel IP routing table

Destination     Gateway         Genmask         Flags Metric Ref    Use Iface

202.115.26.0    *               255.255.255.0   U     0      0        0 eth0

再次运行 udpsend2 ,结果如下:

[root@cyc src]# ./udpsend2 202.115.26.193 on

send 512 to remote end…

结论:当目的主机与发送主机处于同一个网段内时,无论内核是否设置了默认路由,数据包总能发送给目的主机(尽管目的主机可能并没有在等待接收数据包)。但是,子网必须要在路由表中。比如,如果上面将子网 202.115.26.0 所在的路由表项也删除的话,就会得到网络不可达的结果,这一点是很容易理解的。

3.2 不同网段测试

其次来测试当发送主机与目的主机位于不同网段时的情况,此时的目的主机为 202.112.14.184 。发送主机上的路由表设置如下,并且发送主机能够 ping 通目的主机。这表明虽然 202.112.14.184 与 202.115.26.224 之间虽然并没有直接相连,但是能够通过路由器转发数据包来完成通信:

[root@cyc src]# route

Kernel IP routing table

Destination     Gateway         Genmask         Flags Metric Ref    Use Iface

202.115.26.0    *               255.255.255.0   U     0      0        0 eth0

default         202.115.26.1    0.0.0.0         UG    0      0        0 eth0

[root@cyc src]# ping 202.112.14.181

PING 202.112.14.181 (202.112.14.181) 56(84) bytes of data.

64 bytes from 202.112.14.181: icmp_seq=1 ttl=125 time=0.364 ms

运行程序 udpsend2 ,结果显示如下:

[root@cyc src]# ./udpsend2 202.112.14.181 on

sendto(): Network is unreachable

将默认路由(也即网关地址)从路由表中删除,再次运行程序:

[root@cyc src]# ./udpsend2 202.112.14.181 on

sendto(): Network is unreachable

结论:无论路由表中是否包含了默认路由(也即网关地址),当两主机之间没有直接相连时(即使能够通过中间路由器通信),设置了 SO_DONTROUTE 也将导致网络不可达错误。而网络不可达错误通常程序中有函数返回 ENETUNREACH 的结果。在本例中, ENETUNREACH 错误是由 sendto() 函数引发的。

4 总的结论

根据上面的测试结果,我认为: SO_DONTROUTE 套接口选项并没有完全绕过路由表,而只是绕过了路由表中网关(或者说默认路由)所在的表项。因此, Linux 的 socket(7) 中的说明是正确并且无歧义的,而《 UNIX 网络编程(第 1卷)》中的说法则带有一定的歧义性,容易给人造成误解。当然,这也可能是译者翻译不准确的缘故。总的来讲,当目的主机与发送方直接相连时,可以通过 SO_DONTROUTE 来实现从指定的网络接口发出数据包。但是,当接受者与发送方并没有直接相连时,就不能这样做了。而需要考虑通过 SO_BINDTODEVICE 选项或者 RAW 套接口或者 PACKET 套接口来实现。(注: RAW 套接口能实现网络层的直接数据访问,而 PACKET 套接口则能实现链路层的直接数据访问)。

 

相关参考: http://blog.csdn.net/namelcx/article/details/8063543

apt-get软件包管理

转自: http://blog.csdn.net/chenji001/article/details/5815580

软件包安装

  • apt-get install 软件包名称 – 安装一个新软件包 (参见下面的 Aptitude)。
  • aptitude – Ncurses (译注:一种 API,在命令行模式下做出类似GUI的界面)制作的已安装和可安装的软件包查看器。 Aptitude 也可以像 apt-get 一样在命令行下使用,不过它只包含 apt-get 一部分的指令,例如常用的 install 和 remove 之类。不过因为 Aptitude 能比 apt-get 显示更多信息,因此在安装和卸载软件的时候要更好用一些。
auto-apt 命令

auto-apt run 命令 – 这条命令可以自动安装包含缺失文件的软件包。如果这里的“命令”在运行的时候访问了一个系统中没有的文件,那么 auto-apt 会用 apt-get 来安装包含缺失文件的的软件包。这项功能需要有 APT 以及 sudo 来工作。比如说你在编译一个软件,但是弹出一个错误说你缺少某个文件,那么 auto-apt 就会询问你是否要安装包含这个缺少的文件的软件包。同样它也会暂停相应的编译进程,并且在安装完毕之后恢复它。例如可以这样用:

这样如果缺少文件,auto-apt 就会自动使用 apt-get 来安装它。如果 X 服务器正在运行,也会有相应的图形界面。 auto-apt 有一个数据库,需要必要的更新以适应不断的变化。更新的命令为 auto-apt updatedb 以及 auto-apt update-local

 软件包维护

  • apt-get update – 在你更改了/etc/apt/sources.list 或 /etc/apt/preferences 后,需要运行这个命令以令改动生效。同时也要定期运行该命令,以确保你的源列表是最新的。该命令等价于新立得软件包管理器中的“刷新”,或者是 Windows和OS X 下的 Adept 软件包管理器的 “check for updates”。
  • apt-get upgrade – 更新所有已安装的软件包。类似一条命令完成了新立得软件包管理器中的“标记所有软件包以便升级”并且“应用”。
  • apt-get dist-upgrade – 更新整个系统到最新的发行版。等价于在新立得软件包管理器中“标记所有更新”,并在首选项里选择“智能升级” — 这是告诉APT更新到最新包,甚至会删除其他包(注:不建议使用这种方式更新到新的发行版)。
  • apt-get -f install — 等同于新立得软件包管理器中的“编辑->修正(依赖关系)损毁的软件包”再点击“应用。如果提示“unmet dependencies”的时候,可执行这行命令。
  • apt-get autoclean – 如果你的硬盘空间不大的话,可以定期运行这个程序,将已经删除了的软件包的.deb安装文件从硬盘中删除掉。如果你仍然需要硬盘空间的话,可以试试apt-get clean,这会把你已安装的软件包的安装包也删除掉,当然多数情况下这些包没什么用了,因此这是个为硬盘腾地方的好办法。
  • apt-get clean 类似上面的命令,但它删除包缓存中的所有包。这是个很好的做法,因为多数情况下这些包没有用了。但如果你是拨号上网的话,就得重新考虑了。
  • 包缓存的路径为/var/cache/apt/archives,因此,du -sh /var/cache/apt/archives将告诉你包缓存所占用的硬盘空间。
  • dpkg-reconfigure foo – 重新配置“foo”包。这条命令很有用。当一次配置很多包的时候, 要回答很多问题,但有的问题事先并不知道。例如,dpkg-reconfigure fontconfig-config,在Ubuntu系统中显示字体配置向导。每次我安装完一个 Ubuntu 系统,我都会运行这行命令,因为我希望位图字体在我的所有应用程序上都有效。
  • echo “foo hold” | dpkg –set-selections – 设置包“foo”为hold,不更新这个包,保持当前的版本,当前的状态,当前的一切。类似新立得软件包管理器中的“软件包->锁定版本”。
  • 注: apt-get dist-upgrade 会复盖上面的设置,但会事先提示。 另外,你必须使用 sudo。输入命令echo “foo hold” | sudo dpkg –set-selections而不是sudo echo “foo hold” | dpkg –set-selections
  • echo “foo install — 删除“hold”“locked package”状态设置。命令行为echo “foo install” | sudo dpkg –set-selections

软件包删除

  • apt-get remove 软件包名称 – 删除已安装的软件包(保留配置文件)
  • apt-get –purge remove 软件包名称 – 删除已安装包(不保留配置文件)
  • 特别技巧:如果你想在删除‘foo’包同时安装‘bar’: apt-get –purge remove foo bar+
  • apt-get autoremove – 删除为了满足其他软件包的依赖而安装的,但现在不再需要的软件包。

软件包搜索

  • apt-cache search foo – 搜索和”foo”匹配的包。
  • apt-cache show foo – 显示”foo”包的相关信息,例如描述、版本、大小、依赖以及冲突。
  • dpkg –print-avail 软件包名称 – 与上面类似。
  • dpkg -l *foo* – 查找包含有”foo”字样的包。与apt-cache show foo类似,但是还会显示每个包是安装了还是没安装。
  • dpkg -l package-name-pattern – 列出名为package-name-pattern的软件包。除非你知道软件包的正确全称,否则可以使用“*package-name-pattern*”.
  • dpkg -L foo – 显示名为“foo”的包都安装了哪些文件以及它们的路径,很有用的命令。
  • dlocate foo – 在已安装的包中搜索“foo”的文件。对于回答“这个文件来源于哪个包”这个问题,是非常实用的。dlocate是一个软件包,必须安装它才能使用本命令。
  • dpkg -S foo – 和上面的命令一样,但相比更慢一些。他只能在Debian或Ubuntu系统下运行。另外,不需要安装dlocate包。
  • apt-file search foo – 类似dlocate和dpkg -S,但搜索所有有效软件包包,不单单只是你系统上的已安装的软件包。– 它所回答的问题是“哪些软件包提供这些文件”。你必须安装有apt-file软件包,并且确保apt-file数据库是最新的。
  • dpkg -c foo.deb – “foo.deb”包含有哪些文件?注:foo.deb是含路径的文件名。– 这个是针对你自己下载的.deb包。
  • apt-cache dumpavail – 显示所有可用软件包,以及它们各自的详细信息(会产生很多输出)。
  • apt-cache show 软件包名称 – 显示软件包记录,类似dpkg –print-avail 软件包名称
  • apt-cache pkgnames – 快速列出已安装的软件包名称。
  • apt-file search filename – 查找包含特定文件的软件包(不一定是已安装的),这些文件的文件名中含有指定的字符串。apt-file是一个独立的软件包。您必须先使用 apt-get install 来安装它,然后运行 apt-file update。如果 apt-file search filename 输出的内容太多,您可以尝试使用 apt-file search filename | grep -w filename(只 显示指定字符串作为完整的单词出现在其中的那些文件名)或者类似方法,例如:apt-file search filename | grep /bin/(只显示位于诸如/bin或/usr/bin这些文件夹中的文件,如果您要查找的是某个特定的执行文件的话,这样做是有帮助的)。

apt与dpkg

dpkg本身是一个底层的工具。上层的工具,如APT,被用于从远程获取软件包以及处理复杂的软件包关系。 “dpkg”是“Debian Package”的简写。

http://baike.baidu.com/view/1314054.htm

并发socket程序设计

套接字相关函数默认是采用阻塞方式操作, 而大多数情况下, 程序不仅仅只拥有一个套接字。因此当进程以阻塞方式操作其中之一时,必将导致不能使用其它的套接字。如果用户希望这些套接字同时工作,就必须设计并发的套接字程序,即在一个套接字读写的同时保证另一个套接字也能正常地操作。

并发实现的几种方式:

1. 非阻塞方式

2. 信号驱动方式

3. 超时并发模型

另:超时的实现也有多种方式

4. 多路复用

 

参考资料:

《精通UNIX下C语言编程与项目实践》 17章

 

摘要:

1.  可以通过socket选项SO_SNDTIMEO/SO_RCVTIMEO 来设置套接字的读写超时,但是没有可以设置连接超时、accept超时的套接字选项;所以连接超时、accept超时都需要通过其它手段来实现