关于PHP的STDIN/STDOUT/STDERR

缘起

如果实现PHP中标准输入、标准输出、标准错误的重定向?

分析

在C中可以通过dup2来实现,但是PHP无法直接操作文件描述符,只能操作资源,所以这个事情很难做。

下面有个想法(不甚好用),首先,可以通过fclose(STDIN); fclose(STDOUT); fclose(STDERR); 来关闭标准输入、标准输出、标准错误; 然后,通过fopen依次打开标准输入、标准输出、标准错误,这时候,标准输入、标准输出、标准错误已经指向你使用fopen打开的位置了;或者说,无论在任何时候(可能已经打开过很多其他文件了),关闭标准输入之后,立即再打开一个文件,则该文件将成为标准输入(标准输出和标准错误亦可用此法);因为,linux上(windows未测试),只要关闭一个资源,立即再打开的资源都将重用刚才关闭的那个文件描述符,但是:

  1. STDIN/STDOU/STDERR 这些常量一旦被关闭,将不可用,因为是常量,也不可能被重新使用,当然,必要的时候,可以通过php://stdin  php://stdout  php://stderr 来达到相同目的
  2. 虽然可以成功打开一个指向自定义位置的文件描述符2,但是,这个依然是不可用的;因为,一旦关闭的STDERR(不管是否又打开了文件描述符2), 以后的错误将直接丢弃,不写入任何地方,测试脚本:

  3. 其实,设置error_log 就ok了

 

其它发现

我们知道,一个常量不能定义为一个数组,如果这么做了,将得到如下错误:

PHP Warning:  Constants may only evaluate to scalar values in 。。。

但是: STDIN STDOUT  STDERR 也是常量,如果使用 is_scalar(STDIN);来测试的话,发现返回false; 而且不仅这三个常量如此,你也可以自己定义一个资源常量, 如: define(‘MY_FP’, $fp);  当然,如果使用is_scalar($fp); 测试的话,也是返回false的。

关于PHP的Memcache和Memcached模块

缘起

话说PHP操作Memcache有两个常用的模块: Memcache和Memcached;不过,请注意,这两个模块是不能混用的,如:使用Memcache写,使用Memcached读。

原因

话说Memcache协议中有一个叫做flag的东西,可以指定内容是否被压缩等等。Memcache模块和Memcached模块对该flag的定义是不一样的,如下:

Memcache

#define MMC_SERIALIZED 1
#define MMC_COMPRESSED 2

Memcached

#define MEMC_VAL_IS_STRING 0
#define MEMC_VAL_IS_LONG 1
#define MEMC_VAL_IS_DOUBLE 2
#define MEMC_VAL_IS_BOOL 3
#define MEMC_VAL_IS_SERIALIZED 4
#define MEMC_VAL_IS_IGBINARY 5
#define MEMC_VAL_IS_JSON 6
#define MEMC_VAL_IS_MSGPACK 7

#define MEMC_VAL_COMPRESSED (1<<0)
#define MEMC_VAL_COMPRESSION_ZLIB (1<<1)
#define MEMC_VAL_COMPRESSION_FASTLZ (1<<2)

 

 

 

比较

1. Memcache只定义了压缩和序列化

2. Memcached 定义了数据类型、压缩、序列化、压缩方式

base62

参考资料:

http://www.lalit.org/lab/base62-php-convert-number-to-base-62-for-short-urls/

 

数据存储的学问

缘起

硬盘、内存中存储了大量的数据,网络上也在传输这大量的数据;如果仔细分析,很多数据是重复的;如果能对这些数据做精心的设计,会节省很多的硬盘、内存和网络带宽。

举个栗子

我在设计一个用户的回话信息的存储时,发现对会话的创建时间、过期时间这个时间信息pack成4字节的二进制会比10字节的时间戳小不少,我很高兴;但是仔细观察发现,其实里面还是有信息重复的:

1. 每个会话的创建时间不可能早于我的建站时间,比如:2010年10月1号,则这部分信息是重复的; 于是我可以将会话创建时间存储为一个相对于 2010年10月1号的相对时间,这个数字其实小了很多

2. 会话的过期时间总是要大于创建时间的,于是,对于会话的过期时间完全可以存储为相对于创建时间的一个数字

3. 内网IP信息如何处理?如果把内网IP简单当作IP来处理,则IP最短需要4个字节(这里以IPv4为例),如果考虑到是“内网”IP,其实3个字节足矣;如果公司很小,其实只有几个IP,做个对照表的话,1个字节就够了

你不知道的浏览器内置的JS对象

经常看看:

以下示例演示如何使用 Int8Array 对象处理从 XmlHttpRequest 获取的二进制数据:

http://msdn.microsoft.com/zh-cn/library/br212462(v=vs.94).aspx

当然,这些非常用的内置对象多半存在兼容性问题,不过,什么样的东西有什么样的用法。

还有:

Int16Array / Int32Array

Uint8Array / Uint16Array /Uint32Array

HHVM

参考资料

https://github.com/facebook/hhvm

https://github.com/facebook/hhvm/wiki/Building-and-installing-HHVM-on-CentOS-6.3

http://blog.chinaunix.net/uid-28838369-id-3848793.html

http://blog.chinaunix.net/uid-28838369-id-3793006.html

Hhvm安装笔记

http://wuduoyi.com/note/hhvm/   这个写的非常不错

http://www.infoq.com/cn/news/2014/04/facebook-release-hhvm-3.0

再谈代理与隧道

缘起

我的IE上访问 www.google.com.hk 是正常的;但是我的chrome上访问 www.google.com.hk 却报证书错误;

查看证书: 在IE上确实是正确的,在chrome上确实是错误的。

另: 由于www.google.com.hk 被解析到一个内网IP 192.168.xx.xx ;

问题:同是被解析到192.168.xx.xx ,为什么IE可以,而chrome不可以?

分析

抓包看看

chrome抓包结果:

IE访问时的抓包结果:

 

从抓包信息不难发现:

内网IP 192.168.xx.xx 提供了两种代理模式:

1.  7层代理模式:  chrome走的是这种模式

2.  HTTP隧道模式: IE走的是这种模式

通过nslookup查看www.google.com.hk解析到的IP地址为: 192.168.xx.xx ,如下

 

说明

该dns: 10.xx.xx.xx 提供了wpad.dat 文件(wpad参考资料:http://yuelei.blog.51cto.com/202879/83841/ );

似乎是:

IE参考该文件,通过HTTP隧道模式完成请求

chrome没有参考该文件,直接发起了请求

为什么会这样?

原本chrome的代理等设置是和IE相同的,如此看来,有可能不同了,去chrome的设置中看看,发现如下可以地方:

有没有发现,这里无法“更改代理服务器设置”,原因是: 您的网络代理设置有扩展程序管理  正常情况为:

 

去扩展程序中看看,我安装并启用了如下两个插件:

Proxy SwitchySharp

Unblock Youku

这两个插件都有此功能,全部禁用后,恢复正常:

最后

那么哪些域名会走隧道呢? 访问如下地址:

http://10.xx.xx.xx/wpad.dat

其中 10.xx.xx.xx 为你的dns服务器的IP地址;当然,也可能是dns告诉你的某个其他的IP地址,详情参考( http://yuelei.blog.51cto.com/202879/83841/ ),如下:

 

到此为止,浪费了1个小时