httpwatch是个很好的东西,但是对于常用的禁用cache的功能却没有,而Firebug 有禁用cache的功能,后来才发现,Firebug是如此禁用cache的:
Firebug只是一个Firefox的插件,是简单利用了Firefox的一个特性来实现的“禁用浏览器缓存”; 而httpwatch不仅用于Firefoxo,还用于IE,就不方便来如此实现了。
如果你使用的Firefox,但是没有安装Firebug,则不妨通过 about:config 的方式来实现“禁用浏览器缓存”
DevOps
httpwatch是个很好的东西,但是对于常用的禁用cache的功能却没有,而Firebug 有禁用cache的功能,后来才发现,Firebug是如此禁用cache的:
Firebug只是一个Firefox的插件,是简单利用了Firefox的一个特性来实现的“禁用浏览器缓存”; 而httpwatch不仅用于Firefoxo,还用于IE,就不方便来如此实现了。
如果你使用的Firefox,但是没有安装Firebug,则不妨通过 about:config 的方式来实现“禁用浏览器缓存”
1. php的sqlite的模块依然使用的是sqlite2, pdo_sqlite 模块使用的是sqlite3
2. sqlite的写操作是非常慢的,如下:
见表语句:
CREATE TABLE wireless (v varchar(16), PRIMARY KEY(v));
插入10000个IP:
插入速度如下:
$ php sqlite.php -t init
1000:45.657394886017
2000:91.184693813324
3000:133.79960989952
4000:176.86646604538
5000:218.9348089695
6000:261.49800491333
7000:306.47433900833
8000:351.71416902542
9000:397.750207901
9243:408.81617093086
结论:
1. 在所测试的数据量内, 每 1000 条数据需要45s时间, 即 45ms/条 , 应该算是比较慢的。
下面测试一个没有主键时的插入情况:
$ php sqlite.php -t init -d test.db
1000:41.796957969666
2000:83.843362092972
3000:125.97302293777
4000:169.13699889183
5000:212.61609697342
6000:255.99843406677
7000:299.17888689041
8000:339.0949409008
9000:376.1487801075
9243:385.17269802094
结论:
1. 每 1000 条数据需要41s时间, 即 41ms/条, 没有明显变化, 依然很慢
2. 虽然没有索引,但是查询速度却一点也没有变慢
就在不经意的时候,我们可能会把一个大的黑白名单直接写在PHP的数组中,然后使用in_array判断指定的值是否在名单内,这样每次查一个值是否存在则都需要将所有的名单值构造成一个数组,然后遍历这个数组来查找,相当于我们要遍历两次名单而且其中一次是需要字符串比较的。
首先补充一点知识:PHP数组的构造是通过执行字节码来完成的,如arr.php:
编译后生成的字节码如下:
下面我们测试一下构造一个数组的效率,测试方法:
实验1. 在函数中构造一个大的数组,第一次执行之前做编译的工作,后续的执行则不需要编译,这样的话,我们调用函数1000次,则我们认为时间基本上是消耗在数组的构造上的;为了测试构造数组的时间,函数中最后return true, 而不是 return in_array($key, $arr);
实现2. 改造程序,将数组定义成static的,则数组只构造一次,其它和实验1相同
总结: (实验1的时间 – 实验2的时间) / 1000 则基本是构造一次数组需要的时间
测试代码test.php如下:
$ php test.php
5.1018438339233
执行时间6s
给 $arr 添加static 关键字,代码如下:
执行时间:
#php test.php
0.0016131401062012
总结,根据实验的步骤中的公式来计算,可以知道初始化字节码执行时间约: 5s/1000 = 5ms ; 时间是比较长的
或许你会说如果将value当做key出现,则,可以使用 isset($arr[$key]) 而不是 in_array($key, $arr) 会更快些,应为in_array会遍历数组,而isset则是一个简单的hash就能判断。 但是问题是,如果将value当做key出现,则构造数组的时候,每个value都要做一个hash,这样构造数组的速度会更慢,如果每次构造能使用n次,则不失为一个好的办法,如果每次构造只使用一次,就有些不合算了。
下面对初始化1万个key的数组和1万个value的数组做一个比较:
1. 我们上面已近知道初始化1000次value的数组时间为5.1018438339233s
2. 下面我们通过如下函数测试初始化1000次key的数组的时间:
#php test.php
4.8184480667114
这里和我预想的不一样了,虽然每个key都要做hash,但是,初始化数组耗费的时间反而更少(虽然差别不大),稍后再研究一下初始化数组的内部逻辑
下面看一下如下代码的字节码:
似乎没有太大差别。。。
今天使用Fiddler构造一个POST请求,server端的PHP脚本的 $_POST数组中怎么也获取不到值,后来偶然发现是因为缺少了一个http头:
Content-Type: application/x-www-form-urlencoded
另外提示一点的是: 鉴于有如下功能,我们不需要去计算post数据的长度,然后手动添加Content-Length 头了:
PHP的代码包中提供了一个 .gdbinit 的gdb脚本文件,里面提供了20多个 gdb 的自定义命令,用于方便PHP的调试,下面举几个例子:
测试脚本a.php:
1 2 3 4 5 6 7 8 9 10 |
<?php $a = "AAA"; $b = "BBB"; test("phpor"); function test($name) { $m = "MMM"; $n = "NNN"; sleep(1); echo$name; } |
gdb 调试命令:
———————–
gdb php
set args a.php
break sleep
r
…
———————–
1. print_cvs 打印当前执行环境中已编译的PHP变量, 如:
1 2 3 4 5 6 7 8 9 |
(gdb) print_cvs Compiled variables count: 3 0 = name [0x9543f7c] (refcount=2) string(5): "phpor" 1 = m [0x9543f98] (refcount=1) string(3): "MMM" 2 = n [0x9543fb4] (refcount=1) string(3): "NNN" (gdb) |
2. printzv 打印指定的PHP变量, 需要指定地址, 如:
(gdb) printzv 0x9543f98
[0x9543f98] (refcount=1) string(3): “MMM”
(gdb)
3. 打印PHP的函数调用栈, 如:
(gdb) zbacktrace
[0x95770a4] sleep(1) /usr/home/junjie2/a.php:11
[0x9576fe0] test(“phpor”) /usr/home/junjie2/a.php:7
(gdb)
4. print_ft 打印函数表( HashTable )
(gdb) set $eg = executor_globals
(gdb) print $eg.function_table
$6 = (HashTable *) 0xa5bd450
(gdb) print_ft $eg.function_table
[0xa5bd450] {
“zend_version\0” => “zend_version”
“func_num_args\0” => “func_num_args”
“func_get_arg\0” => “func_get_arg”
“func_get_args\0” => “func_get_args”
“strlen\0” => “strlen”
“strcmp\0” => “strcmp”
“strncmp\0” => “strncmp”
“strcasecmp\0” => “strcasecmp”
“strncasecmp\0” => “strncasecmp”
“each\0” => “each”
…
学习:
1. 通过阅读 print_cvs 命令的实现,可以知道可以通过prev_execute_data来打印上一执行空间的PHP变量,如:
(gdb) printzv *executor_globals.current_execute_data->prev_execute_data->CVs[1]
[0x9543408] (refcount=1) string(3): “AAA”
(gdb) printzv *executor_globals.current_execute_data->prev_execute_data->CVs[2]
[0x95433ec] (refcount=1) string(3): “BBB”
(gdb)
2. 通过 op_array->vars 来找到对应的变量的名字
(gdb) printf “%s\n” ,executor_globals.current_execute_data->prev_execute_data->op_array->vars[1].name
a
(gdb) printf “%s\n” ,executor_globals.current_execute_data->prev_execute_data->op_array->vars[2].name
b
3. 修改了一下 print_cvs 命令,通过参数来获取每个执行空间的PHP的已编译变量
使用方法:
———————
(gdb) zbacktrace #查看PHP的调用栈
[0x8ce2078] sleep(1) /usr/home/junjie2/a.php:9
[0x8ce1fe0] test(“phpor”) /usr/home/junjie2/a.php:5
(gdb) print_cvs #查看当前执行空间中的PHP变量
Compiled variables count: 3
0 = name
[0x8cae3d0] (refcount=2) string(5): “phpor”
1 = m
[0x8cae93c] (refcount=1) string(3): “MMM”
2 = n
[0x8cae958] (refcount=1) string(3): “NNN”
(gdb) print_cvs 2 # 查看指定执行空间中的PHP变量, 这个参数给大了也没关系,最多打印最外层的PHP变量
Compiled variables count: 2
0 = a
[0x8cae408] (refcount=1) string(3): “AAA”
1 = b
[0x8cae3ec] (refcount=1) string(3): “BBB”
(gdb)
———————
4. 有时候需要借助环境变量,如:
(gdb) print_ft (HashTable *)0xa5bd450
A syntax error in expression, near `’.
(gdb) set $phpor=(HashTable *)0xa5bd450
(gdb) print_ft $phpor
[0xa5bd450] {
“zend_version\0” => “zend_version”
“func_num_args\0” => “func_num_args”
“func_get_arg\0” => “func_get_arg”
“func_get_args\0” => “func_get_args”
“strlen\0” => “strlen”
“strcmp\0” => “strcmp”
“strncmp\0” => “strncmp”
5. 打印指定的PHP变量
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |
define print_pval ____executor_globals set $p = $eg.current_execute_data.CVs set $c = $eg.current_execute_data.op_array.last_var set $v = $eg.current_execute_data.op_array.vars set $i = 0 set $name = $arg0 #printf "search php var: %s c:%d\n", $name, $c while $i < $c #printf "name: %s\n", $name set $n = $v[$i].name # use strcmp but == if strcmp($n, $name) == 0 if $p[$i] != 0 printzv *$p[$i] # use loop_break but break loop_break end end #printf "i %d, %s\n", $i, $v[$i].name set $i = $i + 1 end if $i == $c printf "no found var named: %s\n", $name end end |
PHP 的一个错误
如果使用PHP来写一个后台程序,可能会考虑在程序中将标准输入、标准输出、标准错误给重定向,这样就不需要在启动程序的时候来做重定向(因为这样很容易忘记);在C中有比较正规的写法,但是PHP中没有找见对应的实现,今天想到一个变通的办法:
1. 使用ob_start(function); 来设置自定义的输出过滤器
2. 使用set_error_handler(function); 来实现自定义的标准错误处理器
然后,在自定义函数中就可以随意处理了,实例:
man 中说到:
Read and execute commands from filename in the current shell environment and return the exit status of the last command executed from filename.
例子:
—— a1.sh ——
#!/bin/sh
./b.sh #如此执行则b.sh 必须有可执行权限
——————-
—— a2.sh ——
#!/bin/sh
. b.sh #如此写法则b.sh 可以没有可执行权限
——————-
—— b.sh ——
#!/bin/sh
sleep 100
——————-
执行:
sh a1.sh #进程中会看到 b.sh
sh a2.sh #进程中不会看到 b.sh
PHP不支持多线程编程,于是,当需要同时执行多个任务的时候,就有些力不从心了;对于有些任务可以通过异步的方式来处理,如: 同时执行多个http请求;对于有些计算型的需求,或者是异步实现很麻烦的时候就不好办了。
当我再一次看fork/exec/system/source等类似的命令或系统调用的时候,觉得他们和之间的异同比较有意思,比如:
fork: 创建子进程,当前进程继续运行
exec: 当前进程直接让位于要执行的程序,用不返回
system: 使用当前进程的环境,创建一个子进程,等待子进程执行完成后返回; system=fork+exec+waitpid
于是想到了PHP中的popen,该方法可以和执行一个外部命令,但是不阻塞当前进程,只需要使用循环去收集执行结果就行了。
对于web程序,通过异步的http请求将任务提交给本机的web server或许比popen更加合算一些。