关键字:
亲和性 cpu affinity
参考文章:
http://www.ibm.com/developerworks/cn/linux/l-affinity.html
http://www.linuxjournal.com/article/6799
DevOps
关键字:
亲和性 cpu affinity
参考文章:
http://www.ibm.com/developerworks/cn/linux/l-affinity.html
http://www.linuxjournal.com/article/6799
计算机中正在执行的程序称为进程,进程中单一顺序的控制流叫做线程,进程是资源管理的最小单位,线程是程序执行的最小单位。在操作系统设计上,从进程演化出线程,最主要的目的就是利用线程共享同一地址空间的特点,更好的支持对称多处理(SMP)以及减小(进程/线程)上下文切换开销。
Solaris是Sun公司开发和发布的一种现代操作系统,是UNIX系统的一个重要分支,下面就其内部的线程模型做一些介绍和讨论。
Solaris线程模型的设计目标:
主要有四个方面:
①.能够描述各种情况下的线程间工作机制
②.支持代价尽可能小的线程
③.既支持单CPU实现,又支持多CPU实现
④.保持对现有UNIX版本的兼容性
Solaris线程模型的实现方法:
线程库的高级内核具有多处理及多线程特性,因此Solaris提供了大量的用户级线程库,其使用了一种两层的线程库模型:在高层是用户线程,而底层则是轻量级进程(LWP)。
LWP其实就是内核线程,是Solaris中真正的可调度实体。内核只关心LWP,而不关心用户线程。
用户线程由线程库管理,线程库支持用户线程及LWP之间的一到一、多到多、多到一映射,并且用线程库管理用户线程与LWP池之间的映射关系及用户线程的调度。
Solaris有两种用户线程: 绑定线程(bound threads)和未绑定线程(unbound threads)。一个绑定线程就是用户线程与LWP之间的一一映射,一个未绑定线程则没有一个固定对应的LWP。在一个进程中,线程库在LWP池上对用户线程进行调度。其结构图如下:
对以上两者进行比较,未绑定进程由线程库来实现用户线程获得LWP的调度,而不需要内核的参与,这种方式的线程上下文切换比较快,并且更节省内核资源,solaris根据一定的策略提供一个LWP池,供上面更多的线程分享。
绑定线程和LWP是一对一关系,因此实时调度性要好,但是由于内核的加入,比较浪费资源。绑定线程比起非绑定线程的开销要大。因为绑定线程可以改变它所在的LWP的属性,LWP在绑定线程退出后不会被缓存,在新的绑定线程生成时,操作系统将提供一个新的LWP。仅仅在线程需要只有在所在的LWP内可用的资源时(例如虚拟的定时器或者一个指定的堆栈),或者为了实现实时调度而必须使线程对于内核可见的场合下,才需要使用绑定线程。
Solaris对线程的控制与同步:
内核根据LWP的调度类型和优先级对它们进行调度。进程建立时有一个初始LWP被建立,并且继承父进程的调度类型和优先级。一般来说,绑定的用户线程继承底层的LWP调度类型和优先级,而未绑定的则继承父进程的调度类型和优先级。
Solaris内核使用一种抢先的基于优先级的调度机制,高优先级的LWP比低优先级的LWP先执行。Solaris线程库使用优先级对用户线程在LWP池上进行调度,每次选择一个LWP执行已经就绪的用户线程。如果某LWP因无限等待而阻塞,线程库则将其对应的用户线程的上下文保存起来,并分派另一个用户线程到该LWP上执行。线程库通常建立足够多的LWP,以保证进程不发生”饥饿”。
线程的同步用于共享数据,转换和控制线程执行,保证程序安全。Solaris支持4种线程的同步原语,分别是互斥锁,信号量,多读进程单写进程锁,条件变量。
内核级线程和用户级线程都具有这些原语操作。一条原语执行时创建一个包含线程信息的数据结构,对每个同步对象只能执行加锁和解锁两项操作,但内核和线程库没有提供防死锁机制。
总结:
Solaris作为多线程,多进程型的操作系统,其关于线程实现机制方面一直是业界领先的,了解solaris的多线程实现机制不但能够帮助我们充分理解操作系统对多线程的控制原理,而且对多线程程序的编写技巧的提高也有很大启发。
cat /proc/interrupts
CPU0 CPU1
0: 858356378 818936397 IO-APIC-edge timer
8: 1 0 IO-APIC-edge rtc
9: 0 0 IO-APIC-level acpi
11: 0 0 IO-APIC-level ohci_hcd
15: 19 0 IO-APIC-edge ide1
177: 71976246 38927350 IO-APIC-level ioc0
185: 30 0 IO-APIC-level ioc1
193: 0 0 IO-APIC-level eth2
201: 0 0 IO-APIC-level eth3
209: 9605286 0 IO-APIC-level eth0
217: 208 408548541 IO-APIC-level eth1
NMI: 0 0
我们发现eth0基本粘在了cpu0上,而eth1基本粘在了cpu1上,通过中断号209 217来查看一下:
cat /proc/irq/217/smp_affinity
00000002
cat /proc/irq/209/smp_affinity
00000001
就是说通过修改对应中断号的文件smp_affinity,就可以将某个中断号指定到某个cpu上了; 不过该文件是内存里面的,重启机器就没有了,应该在其它地方可以修改,再研究…
更多参考: http://www.ibm.com/developerworks/cn/linux/l-cn-linuxkernelint/index.html
这里的Linux命令行系列是翻译自http://www.linuxguide.it/的,如果你英语够好,推荐你去看原版的。这是第一篇,主要介绍关机重启等操作和查看系统信息等操作的命令。
关机重启等操作
shutdown -h now 关机
init 0 关机
telinit 0 关机
shutdown -r hours:minutes & 定时关机
shutdown -c 取消定时关机
shutdown -r now 重启
reboot 重启
logout 注销
查看系统信息
arch 显示机器的结构
uname -r 显示使用过的内核版本
dmidecode -q 显示硬件系统的组件
hdaparm -i /dev/hda 显示硬盘的特征, 有的硬盘可能不支持
hdparm -tT /dev/sda 在硬盘上执行一个测试的读操作
cat /proc/cpuinfo 显示CPU信息
cat /proc/interrupts 显示中断情况
cat /proc/meminfo 检查内存使用情况
cat /proc/swaps 显示交换文件信息
cat /proc/version 显示内核的版本
cat /proc/net/dev 显示网络适配器和(流量)统计
cat /proc/mounts 显示挂载的文件系统
lspci -tv 显示PCI设备
lsusb -tv 显示USB设备
date 显示系统日期
cal 2007 显示2007年的时间表
date 041217002007.00 设置日期和时间 格式为(MonthDayhoursMinutesYear.Seconds)
clock -w 保持BIOS中日期的改变
文件的特殊属性操作
chattr +a file1 让文件或目录仅提供附加用途
chattr +c file1 将文件或目录压缩后存放
chattr +d file1 将文件或目录排除在倾倒操作之外
chattr +i file1 把这个文件变成不可变的文件,不允许删除、修改、重命名和创建链接
chattr +s file1 允许一个文件被安全地删除
chattr +S file1 即时更新文件或目录
chattr +u file1 语序你在取消的情况下恢复一个文件的内容,预防意外删除
lsattr 显示特殊的属性
摘自: http://www.hinn.cn/2008/01/linux_command_1.html
这里面几个比较有趣的命令:
cat /proc/interrupts
该命令使我发现有些中断(如某个网卡的中断)可以锁定在某个cpu上,如:
[root@login openid]# cat /proc/interrupts
CPU0 CPU1
0: 858356378 818936397 IO-APIC-edge timer
8: 1 0 IO-APIC-edge rtc
9: 0 0 IO-APIC-level acpi
11: 0 0 IO-APIC-level ohci_hcd
15: 19 0 IO-APIC-edge ide1
177: 71976246 38927350 IO-APIC-level ioc0
185: 30 0 IO-APIC-level ioc1
193: 0 0 IO-APIC-level eth2
201: 0 0 IO-APIC-level eth3
209: 9605286 0 IO-APIC-level eth0
217: 208 408548541 IO-APIC-level eth1
NMI: 0 0
LOC: 1677207962 1677207961
ERR: 0
MIS: 0
怎么可以将某些(个)中断指定到某个cpu来处理呢?
cal 12 2009
December 2009
Su Mo Tu We Th Fr Sa
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
dmidecode 可以查看机器的一些硬件信息,对于我们查看机器的性能有很大作用
chattr +i file1
该命令锁定一个文件,这是一个非常强制性的锁
这些都是小命令,大用途
zip命令的基本用法是:zip [参数] [文件1] [文件2]
简单的例子:
把本目录下的test文件打包成test.zip文件:zip test.zip test/* ,如果在文件中用绝对的路径,那么在压缩文件中也是绝对路径。就是说,如果你 zip test.zip /home/test/* ,那么在压缩文件中也是这样的层次关系。
参数列表:
-a 将文件转成ASCII模式
-F 尝试修复损坏的压缩文件
-h 显示帮助界面
-m 将文件压缩之后,删除源文件
-n 特定字符串 不压缩具有特定字尾字符串的文件
-o 将压缩文件内的所有文件的最新变动时间设为压缩时候的时间
-q 安静模式,在压缩的时候不显示指令的执行过程
-r 将指定的目录下的所有子目录以及文件一起处理
-S 包含系统文件和隐含文件(S是大写)
-t 日期 把压缩文件的最后修改日期设为指定的日期,日期格式为mmddyyyy
unzip命令的基本语法是:unzip [参数] zip文件
简单例子:
把本目录下的test.zip文件解压:unzip test.zip
参数列表:
-l 列出压缩文件所包含的内容
-v 显示详细的执行过程
摘自: http://www.hinn.cn/2008/01/linux_zip_unzip.html
http://bbs2.chinaunix.net/viewthread.php?tid=1623454
[root@login f2r]# nslookup
> server 8.8.8.8
Default server: 8.8.8.8
Address: 8.8.8.8#53
> set type=a
> google.com
Server: 8.8.8.8
Address: 8.8.8.8#53
Non-authoritative answer:
Name: google.com
Address: 74.125.67.100
Name: google.com
Address: 74.125.45.100
Name: google.com
Address: 74.125.53.100
> sina.com
Server: 8.8.8.8
Address: 8.8.8.8#53
Non-authoritative answer:
Name: sina.com
Address: 12.130.152.116
>
8.8.8.8 太强悍的;
还有更强悍的: 4.3.2.1
比较值得思考的是:
这种事情由商业公司干不好吧
都用8.8.8.8,那google要干掉竞争对手,岂非太容易了。
这次导数据,有所得,也有所失。
1. 如果可能的话,尽量使用文件处理;
a. 因为我对业务没有足够的了解,没有使用文件处理
b. 因为数据不太干净,没敢使用文件处理
2. 本来只处理正查表就够了,由于我对业务的不熟悉,使得处理时间翻倍了
3. sql语句总是可以优化的:
a. 把select * 修改为指定的需要的某个或某几个字段,而且尽量让这几个字段出现在使用的索引里,这样本次查询就不需要访问数据文件了
b. 大数据量的分批查询有两种方法: 根据某字段做hash; 根据某字段排序,注意order by where limit
4. 着实领教了文件系统的cache对mysql的影响。
t1表结构:
uid fid ftype timestring
primary key(uid,fid);
目前要将t1表中的数据一条一条地写到t2表中:
t2表结构:
uid fid ftype dual
primary key(uid,fid);
1. 我们暂且不考虑通过处理文件的方式来导数据,只研究一条一条地该怎么做
2. 因为t2中需要t1中的ftype,为了不需要访问t1表的数据文件,可以将t1的主键重建为:
primary key(uid,fid,ftype);
3. 因为t1的数据量很大(1000万吧),所以需要分部分读取,然后处理,分部分的方法有两种:
a.
for($i = 0; $i< 127; $i++) {
…
$sql = "select * from t1 where mod(uid,127) = $i";
…
}
b.
$i = 10000;
$start = 0;
while($i == 10000) {
…
$sql = "select * from t1 where uid > $start order by uid limit 10000";
$result = mysql_query($sql);
…
$cntDealed = count($result);
$start += $cntDealed;
…
}
4.
第一种办法计算量大一些,每次要遍历所有的数据,但是不需要排序
第二种办法需要处理的数据量越来越少,速度越来越快,但是做了一些不太必要的排序操作
5. 如果我们的操作90%的情况下需要除主键外的某一个字段,而且这个字段很小,为了提高查询速度,可以考虑将该字段添加到逐渐里面去,尽管他逻辑上可以不是主键。
strace -tt -o a.strace hdparm -t /dev/sda
/dev/sda:
Timing buffered disk reads: 76 MB in 3.01 seconds = 25.26 MB/sec
查看a.strace 观察hdparm的测试原理
open("/dev/sda", O_RDONLY|O_NONBLOCK) = 3
nanosleep({3, 0}, {3, 0}) = 0
15:30:01.048912 read(3, "\353H\220\0\216\320\274\0|\373\216\330\374\271\200\0\213"…, 2097152) = 2097152
15:30:01.097253 getitimer(ITIMER_REAL, {it_interval={1000, 976}, it_value={999, 951984}}) = 0
…
打开要测试的设备,每次读取2M的数据,测试3秒钟,最后读取的数据总量除以3秒,得出平均每秒读取的数据量
本次测试每秒25MB的速度,是比较慢的,一般的磁盘也要80MB/s
strace -tt -o a.strace hdparm -T /dev/sda
/dev/sda:
Timing cached reads: 3112 MB in 1.91 seconds = 1632.99 MB/sec
先读取一大批数据,然是使用下面的调用来测试:
15:42:40.729945 lseek(3, 0, SEEK_SET) = 0
15:42:40.730000 getitimer(ITIMER_REAL, {it_interval={1000, 976}, it_value={996, 835457}}) = 0
15:42:40.730066 lseek(3, 0, SEEK_SET) = 0
15:42:40.730121 getitimer(ITIMER_REAL, {it_interval={1000, 976}, it_value={996, 835457}}) = 0
15:42:40.730186 lseek(3, 0, SEEK_SET) = 0
好像是测试的磁盘的寻道,但是为什么总是定位在开始,不明白????
通过把Content-Type设置为application/octet-stream, 可以把动态生成的内容当作文件来下载,相信这个大家都会。 那么用Content-Disposition设置下载的文件名, 这个也有不少人知道吧。 基本上,下载程序都是这么写的:
1 |
<?php<br />$filename = "document.txt";<br />header('Content-Type: application/octet-stream');<br />header('Content-Disposition: attachment; filename=' . $filename);<br /><br />print "Hello!";<br />?> |
这样用浏览器打开之后,就可以下载document.txt。
但是,如果$filename是UTF-8编码的,有些浏览器就无法正常处理了。 比如把上面那个程序稍稍改一下:
1 |
<?php<br />$filename = "中文 文件名.txt";<br />header('Content-Type: application/octet-stream');<br />header('Content-Disposition: attachment; filename=' . $filename);<br /><br />print "Hello!";<br />?> |
把程序保存成UTF-8编码再访问,IE6下载的文件名就会乱码。 FF3下下载的文件名就只有“中文”两个字。Opera 9下一切正常。
输出的header实际上是这样子:
1 |
Content-Disposition: attachment; filename=中文 文件名.txt |
其实按照RFC2231的定义, 多语言编码的Content-Disposition应该这么定义:
1 |
Content-Disposition: attachment; filename*="utf8''%E4%B8%AD%E6%96%87%20%E6%96%87%E4%BB%B6%E5%90%8D.txt" |
即:
经过试验,发现几种主流浏览器的支持情况如下:
IE6 | attachment; filename="<URL编码之后的UTF-8文件名>" |
FF3 | attachment; filename="UTF-8文件名" |
attachment; filename*="utf8”<URL编码之后的UTF-8文件名>" | |
O9 | attachment; filename="UTF-8文件名" |
Safari3(Win) | 貌似不支持?上述方法都不行 |
这样看来,程序必须得这样写才能支持所有主流浏览器:
1 |
<?php<br /><br />$ua = $_SERVER["HTTP_USER_AGENT"];<br /><br />$filename = "中文 文件名.txt";<br />$encoded_filename = urlencode($filename);<br />$encoded_filename = str_replace("+", "%20", $encoded_filename);<br /><br />header('Content-Type: application/octet-stream');<br /><br />if (preg_match("/MSIE/", $ua)) {<br /> header('Content-Disposition: attachment; filename="' . $encoded_filename . '"');<br />} else if (preg_match("/Firefox/", $ua)) {<br /> header('Content-Disposition: attachment; filename*="utf8\'\'' . $filename . '"');<br />} else {<br /> header('Content-Disposition: attachment; filename="' . $filename . '"');<br />}<br /><br />print 'ABC';<br />?><br /> |