12月 092012
 

主要js文件:

http://imgcache.qq.com/ptlogin/ver/10013/js/xui.js?v=10007

建议将该文件格式化后分析,可以通过fiddler 自动响应的功能使用格式化的文件,然后在函数: onQloginSelect 上设置断点,然后跟踪下去就行了。

 

关键技术:

1. 浏览器插件,IE下使用 ActiveObjectX ,其它浏览器使用embed

2. 登录请求通过对域名的限制来实现

 

QQ登录插件文件:

C:\Program Files\Tencent\QQ\Bin\TXSSO\bin\npSSOAxCtrlForPTLogin.dll

 

分析的结果和下面文件中描述的一致,所以不再细说。曾经分析过,只是没有记录,都给忘了,这里记录一下。

 

相关参考资料: 搜索关键字:“embed application nptxsso”

http://1.lanz.sinaapp.com/?p=152

http://www.dewen.org/q/1027

http://www.udpwork.com/item/7598.html

 

学到的一些知识:

——————————————– 摘自上面参考资料

原来,QQ 使用了历史很悠久的 NPAPI(Netscape Plugin Application Programming Interface)接口。NPAPI 几乎支持所有主流浏览器,包括 FireFox、Chrome、Opera(IE 从 5.5 后停止支持 NPAPI,转而使用 ActiveX)。

打开 chrome://plugins/ 我们可以发现自动登录的有关插件,而在路径 C:\Program Files (x86)\Common Files\Tencent\TXSSO 下就可以找到关于 SSO 的相关动态链接库。

Tencent_SSO_plugin

np 插件一般命名都会加np前缀 如 QQ 的这个 npSSOAxCtrlForPTLogin.dll,只要按照标准的写法,放在浏览器会加载的地方,用的时候写个标签就可以在 js 里面调用了。于是跨浏览器(无视 IE)的插件开发变得相当可行。运行在 NPAPI 插件中的代码拥有当前用户的所有权限,不在沙箱中运行,所以它的扩展程序在被 Chrome 网上应用店接受前要求人工审核。

————————————————–

注意“插件”与“扩展”的区别,这里说的是“插件”; 上面提到的“人工审核”机制是怎么做到不审核就无法使用的呢? 在浏览器上通过都需要该浏览器的厂商审核通过?

 Posted by at 下午 12:11
9月 282011
 

   txt记录用来保存域名的附加文本信息,txt记录的内容按照一定的格式编写,最常用的是spf格式,spf用于登记某个域名拥有的用来外发邮件的所有ip地址。mx记录的作用是给寄信者指明某个域名的邮件服务器有哪些,spf格式的txt记录的作用跟mx记录相反,它向收信者表明,哪些邮件服务器是经过某个域名认可会发送邮件的。spf的作用主要是反垃圾邮件,主要针对那些发信人伪造域名的垃圾邮件。  按照spf格式在dns中增加一条txt类型的记录,将提高该域名的信誉度,同时可以防止垃圾邮件伪造该域的发件人发送垃圾邮件。  spf格式比较复杂,一个最典型的spf格式的txt记录例子为“v=spf1 a mx ~all ”,表示只有这个域名的a记录和mx记录中的ip地址有权限使用这个域名发送邮件。其中v=spf1表示这条txt记录使用的是spf格式版本1;a和mx表示a记录或者mx记录;~all表示除了前面所指定的其他ip地址统统不认可。

 Posted by at 上午 8:39
2月 212011
 

技术篇  

    概述  

    20世纪80年代以来,随着个人计算机(Personal  Computer)的不断发展和普及,一种全新概念的计算机网络逐步建立并迅速膨胀,最终成为今天大家所熟悉的、世界上最大的国际性计算机互连网 –Internet。人们在Internet上可以轻松地通过各种搜索引擎查找自己需要的信息,与世界各地的人通过E-mail等多种方式实现实时和非 实时的通讯。Internet是当今世界上最大的开放式计算机网络,它成功地将分布在世界各地的无数个计算机网络连接起来,大大提高了全球信息的流动,提 高了人们之间的通信交流。经过几十年的发展,从小到大,功能不断丰富,使用也越来越简便,同时新技术不断出现,继续推动着Internet的不断高速发 展。  

    内容分布网络–Content Distribution  Network(CDN)是构筑在现有的Internet上的一种先进的流量分配网络。该网络将网站原服务器中的内容存储到分布于各地的缓存服务器 (Cache  Server)中,通过网络的动态流量分配控制器,将用户请求自动指向到健康可用并且距离用户最近缓存服务器上,以提高用户访问的响应速度和服务的可用 性,改善Internet上的服务质量。由于内容分布网络可以有效地提高网络资源的利用效率,在提高ISP的广域网带宽利用率的同时提高用户的访问速度, 增加网站的服务可用性和抵抗黑客攻击的能力,因此受到广泛的重视,是一个正在兴起的并高速发展的技术产业。  

    CDN概念的提出是从1998年开始。当时美国麻省理工大学(MIT)的一批研究生通过分析当时Internet网络状况,提出了 一套能够实现用户就近访问的解决方案,最终设计并实现了其独有的系统,在此基础上于2000年建立了世界第一家提供商用CDN服务网的专业技术公司 –AKAIMA。该公司的网络遍布世界各地,目前共有超过10,000个各类服务器分布在66各国家的100多个网络中,为诸如 YAHOO!,CNN.COM等世界级著名公司提供CDN服务。  

    目前,国际上众多的知名厂商如Cisco、Nortel、F5  Network、Radware、ArrayNetworks等公司纷纷推出自己的CDN解决方案或产品。Nortel甚至预言将来的互联网将以CDN为 基础。根据调查,全世界在CDN产品方面的投入,2000年为1亿2千万美元左右,到2003年,这一数字将剧增至14亿美元左右;而用于CDN服务方面 的支出,在2000年仅为9千7百万美元,到2003年将超过20亿美元。  

    国外除了AKAIMA这样的独立的专业CDN服务提供商外,大型的IDC企业也纷纷加入到这个行业中,如国外著名的IDC– Digital Island通过其遍布全美国的众多的数据中心,建立了其自己的CDN网络,将CDN服务作为一种增值服务向它的数据中心的客户提供。  

    中国的互联网从上世纪90年代末开始高速发展,但网络带宽远远满足不了用户数目的增加,不仅影响了网络服务质量,同时,也制约了流 媒体(Streaming  Media)等新业务的发展。正是基于这样的原因,从2000年底开始,中国的CDN产业逐步开始起步,出现了包括ChinaCache等多家公司在内的 CDN服务提供商,大型数据中心如世纪互联数据中心有限公司也开始提供类似的服务。其中ChinaCache作为中国最早的CDN服务商,目前已经在全国 建立了超过26个节点覆盖全国的网络,每个节点都通过100Mbps-1000Mbps独享带宽接入骨干网。目前正在为包括搜狐(Sohu)、新浪 (Sina)、TOM.COM、21CN、可口可乐公司等著名ICP或知名企业的网站服务。  

    CDN的出现  

    现有Internet发展存在的问题  

    Internet是人类历史发展中的一个伟大的里程碑,人类正由此进入一个前所未有的信息化社会。Internet如此快速的发 展,每天都有很多网络连入Internet。虽然没有任何一个人或组织可以对Internet具有控制权,但大家共同遵守国际标准的通讯协议,各子网间相 互协作共享资源,实现相互间信息和数据发送及接收。  

    在传统的Internet网络的结构下,用户访问一个网站的的基本过程,如图2-1所示。  

    传统的访问模式虽然简单,但存在几个主要的问题,会严重影响Internet用户的访问效率和质量  

  1. 用户在自己的浏览器中输入要访问的网站的域名www.domain.com  
  2. 浏览器向本地DNS请求对该域名的解析  
  3. 本地DNS将请求发到网站的授权DNS(Authoritative DNS server)  
  4. 授权DNS将服务器的地址作为解析结果(IP地址)送给本地DNS  
  5. 本地DNS再将解析结果返还给用户,同时将该域名的解析结果保存在内存中,并直接响应下一个用户的解析请求。直到相应的TTL(生存周期)过期,才再向网站授权DNS请求解析  
  6. 用户得到IP地址后,就可以直接对网站进行访问

    传统的访问模式虽然简单,但存在几个主要的问题,会严重影响Internet用户的访问效率和质量  

  • 可用性低  
  • 可扩展性低  
  • 访问效率低

    目前困扰Internet的一个严重的问题是访问效率无法提高。Internet是一个开放的网络,在这个开放的网络上,访问和寻址都是通 过分布在网络上的众多的路由器来将包从一个网段传递到另一个网段,由于地域分布的广泛,用户对网站的访问必须经过许多路由器的转接,才能最终到达网站的 WEB服务器,中间可能要跨过多个ISP和网络。即使在理想情况下,路由器的每一次转接(HOP),都会造成一个延迟,虽然单个这样的延迟时间较少,但当 网络规模很大时,HOP数会大量增加,造成的延迟也会更加明显。而且,任何一个路由器的故障或者拥塞都可能造成访问的中断或者延迟,严重影响访问的质量。  

    不同网络之间的互联是通过对等点(peering points)连接在一起,这些互联点的带宽比较狭窄,也是导致Internet访问速度慢的一个重要瓶颈。  

    用户对网页的访问是通过HTTP协议向原服务器发出请求,这样用户要在浏览器上看到一个完整的页面就需要与原服务器的多次交互访问才行,使由于路由器转接引起的延迟对页面访问过程的影响成倍增加。图2-2说明了HTTP协议的访问过程。  

    同时,IP协议中不同物理网络对帧大小的限制不同,使网页中的一个Object可能要被分解到更多个包中进行传递,进一步加大了路由器转接延迟引起的总延迟时间。  

    从上面的计算公式可以看到,通过提高网络的带宽可以降低网页的响应时间,但要注意,网络中的瓶颈不一定是用户的接入点,而很可能是不同网络运营商之间的对等点。  

    对于同一个用户下载同一个页面,第一项即页面的大小与网络最小带宽的比值是基本一致的。第三项处理时间是指服务器和用户的PC机的 处理能力,该项随着网站服务器的负载而变化。所以网站的服务器处理能力越强,其响应时间相对也会更快,在相同条件下,公式的第二项将会对响应时间产生重要 的影响。从图2-2可以看到,当用户通过HTTP协议访问网站时,首先必须建立一个TCP连接,然后才能向WEB服务器发送GET请求,同时等待服务器的 响应。由于现在页面的设计越来越复杂,页面中的Object的数目往往多达30-50个,使往返次数增加。而每次往返时间则会因为经过的路由器的增加而增 加。所以缩短网站与用户之间的举例是提高访问速度的一个有效方法。即将用户要访问的内容推送到离用户最近的地方。  

网站镜像  

    在CDN出现以前,为了能将网站的内容安置到离用户更近的地方,人们提出了网站镜像的解决方案,但它的应用同样存在几个重要的缺陷:  

  • 对用户不透明:
        网站在设立镜像站点后,必须要给每个镜像站点设立相应的域名,由于用户访问通常是直接访问其主站,因此必须在主站的显要 位置上放置各镜像站点的链接,这样用户才能访问到相应镜像站点。这样的设置增加了用户访问的复杂性。而且在镜像站点由于故障停机后,链接不能有效及时的修 改,导致部分用户通过链接对镜像站点的访问得不到服务,影响服务质量,  
  • 数据同步困难:
        传统镜像站点使用服务器,将原站点的全部内容通过定时同步的方式拷贝过来,同步周期长,不灵活。  
  • 镜像站点较少:
        由于设立镜像站点的周期长,技术要求高,维护监控费用高,一般只有较大的网站或公司才能在重要城市设立镜像站点,因此服务的范围有限。

CDN的工作原理  

    CDN(Content Distribution  Network),即内容分发网络,其目的是通过在现有的Internet中增加一层新的网络架构,将网站的内容发布到最接近用户的网络"边缘",使用户 可以就近取得所需的内容,从更本上解决Internet网络拥塞状况,提高用户访问网站的响应速度。  

    CDN的基本工作原理就是广泛采用各种Cache服务器,将这些Cache服务器分布到用户访问相对集中的地区或网络中,在用户访 问网站时,利用全球负载均衡技术(Global Server Load  Balance-GSLB),将用户的访问指向到离用户距离最近的工作正常的Cache服务器上,由Cache服务器直接响应用户的请求。如果Cache 服务器中没有用户要访问的内容,它会根据配置自动到原服务器去抓取相应的页面并提供给用户。因此一旦CDN网络正常运行后,内容的分布,用户访问的定位全 部是自动的。  

    图2-3是CDN网络工作原理的示意图。  

    CDN网络的分类  

    虽然CDN的基本概念和服务本质上是一样的,但按照其服务目标客户群的不同,还是可以将其划分成3类,如表2-1所示  

    

        

            

            

            

        

        

            

            

            

            

        

        

            

            

            

        

        

            

            

            

        

        

            

            

            

        

        

            

            

            

        

    

CDN分类 目标客户 CACHE安装的位置
Internet类型 覆盖型(Internet-Overlay) 内容的拥有者或提供商 多个数据中心(IDC),ISP的接入端,网络对等点
对等型(Internet-Peering) 内容的拥有者或提供商 网络对等点上
托管型(Internet-Hosting) 内容的拥有者或提供商 数据托管服务商的多个数据中心
用户型(Subscriber) 最终Internet用户 ISP自己的接入端
企业型(Enterprise) 公司 公司总部和分支机构所在地

    CDN系统主要组成部分  

    从概念上看,一个CDN的工作原理不是特别难于理解,因为CDN网络的建设并不依赖于非常复杂或难于理解的技术。但无论选择何种技术,要建立一个高效可靠的CDN,都需要至少5个基本部分组成。  

  • 原始服务器
        为了便于管理和配置,CDN网络中各个节点一般都使用Cache服务器来保存用户频繁访问的网站内容,这些服务器中只保留一 个副本,因此对于网站来说,其内容必须要有原始存放的地方,所以要根据网站的大小用一个或多个服务器用来保存原始的WEB内容。大部分情况下,原始服务器 安装在IDC中,由内容提供商自己负责维护和管理。  
  • GSLB控制服务器
        CDN网络只有有效地解决了可扩展性和可用性才能称得上是一个有价值的解决方案,换句话说,如果由于内容 分布使服务变得缺少可靠性和缺少扩展的可能,就与CDN的初衷相违背了。GSLB控制服务器是一些专用的具有高可靠和高冗余性的设备,用来实现将流量指向 到那些正常工作的Cache服务器上,并在他们工作异常时及时将流量专走。这些控制器应该能够直接或间接地取得分布在各地的CDN节点中Cache服务器 的工作状态和性能,并能够判断用户的来源,以保证用户能被有效的分配到离其’逻辑上’最近最健康地节点上。  
  • 节点–Cache和本地负载均衡服务器(SLB)
        在各个节点上,Cache服务器扮演Web服务器的角色,这些机器保存着原始服务器上相应内容的副本以响应用户的请求。
        有 两种方式可以实现将内容分布到各节点的Cache上,一种是’拉’的模式,在这种方式下,Cache在刚开始的时候什么内容都没有,在接受用户的请求后, 才代替用户到原服务器去抓取内容,同时保存一份副本在本地。’推’的方式是指将预先指定的内容通过专门的方式传送到CDN网络中所有的或指定的Cache 服务器上,这种方式的优点是第一个用户也能得到很好的服务,但由于这种服务需要对内容进行相对复杂的控制和管理,所以一般只对最有用的内容采取这种方式。 事实上在实际CDN网络的环境中,’拉’和’推’这两种方式一般都会混合使用。
        在每个节点上,一般都会有多于一个Cache服务器用于提供不同 的服务或提高每个节点的处理能力,例如,有的Cache服务器专门用来支持HTTP服务,有的专门支持FTP服务,有的提供流媒体服务。所以需要一个本地 负载均衡控制器(Server Load Balancer)来实现流量分配的功能。  
  • 内容管理系统
        CDN网络本质上是一个’内容的网络’,因此对内容的管理是一个复杂的任务,无论是采用’拉’或’推’的方式, 都需要预先做许多判断,如哪些内容可以缓存,哪些内容可以缓存多久或哪些内容根本不能保留在Cache服务器中,必须直接回原服务器。这些都很依赖于内容 提供商提供的内容和目标的客户群。虽然许多传统的内容管理工具或软件能够实现对内容的管理,但主要是针对传统的Web服务器,但与CDN内容管理有这本质 的区别。对于Internet CDN网络,一个完善和稳定的内容管理系统更是网络成功的关键。  
  • 网络监控管理系统
        每个CDN网络都需要有一个网络监控和管理中心,这和任何一个系统或网络都需要网管中心一样。这是保证整个系统正常运转的关键。
        由 于CDN网络是一个分布式系统,如何实现集中监控是保证系统可靠、稳定运行的重要因素,网络监控系统,必须要能够实现分布检测,集中告警,保证能够在第一 时间发现故障并定位故障。而且由于CDN网络是一项内容服务,因此在监控网络连通性的同时,还要对应用层的各项服务进行监控,如各节点的Cache服务器 是否可以正常工作,工作状态如何,Cache的命中率有多高等进行监控。

    GSLB控制器实现技术  

    全球负载均衡技术(GSLB,Global Server Load  Balance)是一种将SLB的概念扩展到广域范围的技术,与SLB在一个单独的节点上为一组服务器提供负载均衡服务不同,GSLB提供了一种对多个、 并且地域上不在一起的服务器群(节点)提供提高服务可用性的服务,其最终目的就是为了增加服务的可用性和提供更高的性能。GSLB在实现上可以分为两个方 面,一方面是如何实现将用户的请求指向到选定的节点上,一方面是研究如何确定最佳的节点。  

    用户请求重定向的方式  

    实现用户请求指向到选择的节点的方式主要有3种,分别是:  

  • 基于HTTP重定向  
  • 基于DNS的解析  
  • 基于路由协议

    基于HTTP重定向  

    在实现将用户的访问指向到需要的另一个地方的所有方式中,HTTP重定向是一种最直观的方式,HTTP协议中定义了一种方式允许 WEB服务器在响应用户请求时包括一个重定向的错误码(302)同时包括重定向的URL。这些信息通知浏览器必须要到新的URL上才能取得所需的信息。这 样,用户的访问就能被有效地引导到一个合适的节点上。图3-1显示了其工作过程。  

    实现的具体流程如下:  

  • 用户在自己的浏览器中输入vwww.domain.com  
  • 到本地DNS请求域名的IP地址  
  • 本地DNS到domain.com的授权域名服务器解析  
  • 授权域名服务器返回解析结果  
  • 浏览器向服务器A发出HTTP请求  
  • 服务器发现自己不是最佳的服务器,返回的响应是重定向到wwwB.domain.com  
  • 用户通过域名解析重新定位wwwB.domain.com的地址  
  • 最终到最佳的服务器上抓取网页的内容

    使用HTTP重定向方式的最大优势在于GSLB控制器可以直接得到用户的真实的IP地址,并可以以此为基础来选择离用户最近的节点。但在实 际应用中,需要考虑以下几个潜在的问题。第一,用户访问时需要两次域名解析的过程,因此在真正取得所要访问内容前的延迟比较大;第二,只适用于HTTP服 务;第三,用户在浏览器中看到的链接会由于分配的节点不同而不同,有时会使用户感到迷惑;第四,由于所有的HTTP请求在真正到达最佳节点前都要到 GSLB控制器,因此,GSLB控制器可能成为网络的瓶颈而影响整个网络的性能。  

    基于DNS解析  

    用户在访问网站之前,都需要通过DNS服务器将域名解析成IP地址,再发起真正的HTTP请求,因此可以通过在DNS中修改配置, 来实现用户的重新指向。在实现上可以有两种方式。一种是直接利用BIND  DNS自有的RTT测试时间来实现,一种是在负责实现GSLB功能的DNS中设置所有节点的VIP,然后根据用户的位置和当时网络的情况将域名解析到一个 或多个VIP上。基于DNS解析实现GSLB的工作流程如下:  

  1. 用户在自己的浏览器中输入要访问的网站的域名www.domain.com  
  2. 浏览器向本地DNS请求对该域名的解析  
  3. 本地DNS将解析请求发到ICP的授权域名服务器(Authoritative  DNS),授权域名服务器通知本地DNS,相应频道的别名是www.sub-domain.domain.com,并且sub- domain.domain.com的的授权域名服务器已经是GSLB控制器  
  4. 本地DNS向GSLB控制器发出域名解析请求  
  5. GSLB控制器根据预设策略,选择最佳节点,并将结果(IP地址)返回本地DNS  
  6. 本地DNS将对应的IP地址发给用户  
  7. 用户向最佳节点发出请求  
  8. 节点中的Cache服务器响应用户的请求,提供相关内容

    通过路由协议实现GSLB  

    要实现这种方式,必须在每个节点都配置同样的VIP地址,每个域名在DNS中的A记录只对应一个IP地址,利用路由协议本身具备的最佳路径的算法,就能将请求指向到最佳的站点上。图 3-3显示基于路由协议的GSLB是如何实现的。  

    在这种方式下,A、B两个节点分别位于不同的地方,但有同样的VIP,即IP地址,并与路由器相连,在这里,路由器必须要能够通过 ARP(Address Resolution  Protocol,地址解析协议)看到这个VIP,即应该能够PING通这个地址,由于这个VIP可用,路由器知道如何通过自己,将包发给这个IP地址, 同时它会将这个路由信息通过路由协议在网上传播并最终到达位于网络边缘的路由器A和B。这时,即使这两个节点都是同时可用的,对于路由器A和B来说就像是 到同一个点有2条路由路径,不会影响路由器的正常工作。  

    当用户对网站的访问到达一个路由器,如A。路由器A查看自己的路由表,以便确定如何将包发到目的地,他可能发现2个不同地路由,于 是根据路由协议算法决定一条最佳的路由,例如OSPF(Open Shortest Path  First),计算每条可用路径的路由开销并选择开销最小的,用户的访问将达A节点。  

    这种方式充分利用了路由器现有的动态选择路由功能,最大的优势就在于不需要专用的GSLB控制器就能实现GSLB功能。但是由于网 络上路由器的配置各不相同,如有的路由器可能会配置成在同时有多个路由路径时会在这多个路径上进行负载均衡,在极端的情况下将导致TCP的三次握手无法正 常的完成,从而影响用户的访问。因此这种方式一般是在一个较小的ISP网络中,CDN网络的建设者必须对ISP网络非常了解,并应该清楚地知道网络上的路 由器采用的路由协议配置才有可能保证CDN网络服务的可靠和安全。  

    选择最佳节点基本原则  

    在Internet上,网络环境瞬息万变,所以GSLB控制器在某一时刻决定某一个用户请求需要被指向到某个节点,在下一时刻可能 同样的用户请求会被指到与刚刚访问的节点在物理上相距非常远另一个节点上。这些都是由GSLB设定的选择节点的策略决定的。无论GSLB控制器的选择最佳 节点的策略或算法是什么,它在做出判断之前都必须要对CDN网络中的各种数据进行搜集和整理,当任何一个用户的请求到达时,再根据这些信息做出决定。  

    CDN网络是一个分布的网络,对于一个运营级的Internet  CDN,网络可能有几十个甚至上百个节点,但只有几个GSLB控制器来实现全局的控制,因此对于GSLB控制器来说,主要的处理能力是放在控制策略和算 法,并将搜集到的信息进行整理,而具体的对信息的搜集和探测一般都会由每个节点的代理(Agent)来完成。代理与GSLB控制器之间通过专用接口协议传 递信息。在实际的CDN网络中,这种代理通常都安装在各个节点本地的SLB上。  

    虽然网络上的数据多种多样,信息搜集和探测的方式也很多,但GSLB控制器在选择节点时有几个基本原则是必须遵循的。  

    服务可用性原则  

    由于GSLB控制器的目的就是要在复杂的网络环境中实现系统(或服务)的最大可用性,所以选择节点的一个基本要求就是服务必须是可 用的。对GSLB控制器来说,最重要的是需要持续地监控节点的健康情况并只将用户指向到那些可以提供服务的节点。这部分工作可以依赖于各节点的SLB设 备,因为这些设备具备检测服务器工作状态的能力。所以只要在GSLB设备和SLB设备之间建立有效的接口,保证信息的传递就能够解决这一问题。当 然,GSLB设备本身也可以直接对服务器的工作状态进行探测,从2、3层到第4层,甚至第7层。如GSLB设备可以简单地发一个Ping的请求到相应的节 点,检查网络环境是不是通畅,也可以发一个HTTP请求,看服务器返回的状态代码是否是’200 OK’,以此决定服务器的工作状态是否正常。  

    节点负载状态  

    这个原则也是很容易理解的,由于每个节点有不同的容量和当前的负载状态,如果将用户的请求指向到负载已经很重的节点上,即使用户到 节点的跳数(Hop)少,也有可能导致由于节点超负载而影响服务质量。因此GSLB控制器可以将这两个值比率作为一种加权值,在选择节点时考虑进去。为了 能够测量节点的负载状况并把它考虑进去,GSLB控制器必须了解节点能够承载的最大容量以及当前的负载,将下一个请求发送到有更多可用资源的节点上。  

    就近分配  

    首先要明确的一点是在这里所说的就近指的是’逻辑’上的近,如两点之间Ping的延迟时间短,两点之间经过的路由器跳数少等。而不是指广州和湖南之间的距离比广州到上海的距离近。虽然在实际情况下物理距离近的两个地方其’逻辑’距离通常也会比较近。  

    要实现就近分配,就必须要了解每个节点与用户之间的距离,可以有两种方式来确定:  

  • 静态IP段划分
        在Internet上,每个设备都有一个IP地址,IP地址是由一些专门的机构来管理的。在世界范围内,IP地址被分配 到不同的国家和大洲,一块地址由Asia Pacific Network Information  Center(APNIC)管理并分配给亚太地区的用户,一块地址被保留给American Registery for Internet  Numbers(ARIN) 供南北美洲的用户使用。而Reseaux IP Europeens Network Coordination  Centre(RIPE NCC)则管理着另一块地址为欧洲和非洲服务。
        当GSLB控制器在选择就近站点时,首先能得到用户的IP地址或代表用户请求DNS解析的本地DNS的IP地址,然后GSLB控制器就能够使用这个IP地址与已知的按区域划分的地址块进行匹配来选择不同的节点。如用户的地址在北京地区的地址块中,就将用户指向北京节点。  
  • 动态选择就近的节点
        由于Internet上网络环境的变化是非常频繁的,用户可能分布在世界的任何一个角落,因此在测量用户 与节点之间的距离及响应时间时都只能以统计的方式来实现,即只能按一定的时间间隔和频度来采样。同时,由于’用户’的数量非常大,无论是对代表用户的 DNS还是对用户都不可能作到完全探测,只能假设某一IP段的用户是在同样的网络环境中,如假设一个C段的IP是具有相同的网络环境,到同一个节点具有同 样的’逻辑距离’。
        目前,测量用户与节点的’逻辑距离’有两种方式,一种是用设备进行探测(Probing)的方式;另一种就是所谓的’赛跑’(Racing)方式。

    CDN服务的内容  

    CDN网络是一个分布的网络,分布于各地的节点大量利用Cache服务器将内容缓存在本地,以提高用户的访问效率和网络的容量。  

    相对于传统的路由和网络交换技术,CDN是一个全新的领域,技术的发展日新月异,服务的内容目前已经不仅仅局限于HTTP协议和基本静态内容。下图说明了CDN服务的发展基本趋势。  


图4-1 CDN服务发展趋势

    静态Cache服务器工作原理  

    Cache服务器通过存储用户需要经常访问的内容来提高响应时间及节省网络的带宽。当一个用户在自己的浏览器中输入 http://www.domain.com并最终到达Cache服务器时,如果这是Cache收到的对这个页面的第一个HTTP的请求,由于Cache 服务器内没有这个内容,所以会直接向原服务器请求内容,并将内容保存在本地,如内存和硬盘中,同时将相应的页面响应给用户,当第二个用户请求同样的内容 时,Cache服务器检查后发现内容已经保存在本地,因此立即响应用户而不用回原服务器去取,第二个用户将得到比第一个用户更快的响应时间,同时,由于 Cache服务器没有通过Internet回原服务器去取,也节省了带宽。  

    通常情况下,一个WEB页面包括很多个内置的对象(Embedded Objec),如小按钮或图片,作为页面内容的一部分,浏览器需要分别取得每个对象,才能组装和显示完整的页面,这时,Cache服务器也需要能够分别缓存这些对象。  

    Cache服务器能根据用户的请求,自动到原服务器去抓取内容,并保存在本地,这是与传统的镜像服务器工作原理上的一个重要区别, 它极大地减轻了数据同步地工作量。另外,Cache服务器还能够在硬盘容量满的情况下,自动将访问频度相对较低的内容删除掉,以保留最新的和访问频度较大 的内容,这样,可以更有效地提高硬盘资源的利用率。  

    流媒体内容的缓存技术  

    流媒体基本介绍  

    流媒体(Streaming  Media)是一种可以使音频、视频和其它多媒体能在Internet或Intranet上以实时的、无需下载等待的方式进行播放的技术。流媒体文件格式 是支持采用流式传输及播放的媒体格式。流传输方式是将视音频等多媒体文件经过特殊的压缩方式分成一个个压缩包,由视频服务器向用户计算机连续、实时传送。 在采用流传输方式的系统中,用户不必像非流式播放那样等到整个文件全部下载完毕后才能看到当中的内容,而是只需经过几秒或几十秒的少量缓冲时间即可在自己 的计算机上利用相应的播放软件对压缩的视、音频等流媒体文件进行播放,流媒体文件的剩余部分将在播放的过程中继续下载,实现播放与下载的同步进行。  

    常用流媒体格式介绍  

    由于不同的公司发展的文件格式不同,传送的方式也有所差异,因此,我们必须非常清楚各种流媒体文件的格式。  

    到目前为止,互联网上使用较多的流媒体格式主要有美国Real Networks公司的RealMedia、微软公司的Windows Media和苹果公司的QuickTime  

    

        

            

            

            

            

        

        

            

            

            

            

        

        

            

            

            

            

        

        

            

            

            

            

        

        

            

            

            

            

        

    

流媒体格式 控制协议 数据传输协议 下层传输协议
Real Network RTSP RDT TCP或UDP
WMT MMS MMST TCP
WMT MMS MMSU UDP
QuickTime RTSP RTP UDP或TCP

    工作模式  

    根据流媒体播放的性质不同,流媒体Cache服务器可以工作在两种模式下,一种是流媒体直播,一种流媒体点播。  

  • 流媒体直播
        在进行流媒体直播时,无论使用UDP或TCP进行传输,第一个用户请求到达流媒体Cache服务器后,它会与原服务器建立一 个数据流通道,服务用户。当有新的用户来请求同样的内容时,流媒体Cache服务器会自动地将原来的数据流分拆(Splitting),同时给后续的用 户,而不需要从原服务器提取任何多于的流。同时在流媒体直播完成后,流媒体Cache服务器中并不保留直播的内容。  
  • 流媒体点播
        流媒体Cache服务器可以支持对流媒体内容的点播工作模式,在这个模式下,当流媒体Cache服务器收到一个用 户请求后,它判断这个内容是否可以缓存,然后检查请求的内容是否已经在自己本地,如果媒体文件不在,流媒体Cache服务器向原服务器请求内容,同时将流 发给请求的用户后续的对同一个媒体文件的请求都直接由流媒体Cache服务器提供内容,而不需要到原服务器取。  
  • 4.2.4 版权保护
        DRM(Digital Rights  Management)技术是流媒体内容发展的一个新趋势,提供内容加密管理、数字许可证管理等功能,是对在线传播及离线数字媒体内容进行版权保护的全套 解决方案,通过CDN网络,内容提供商可以方便地对各种音乐、图象等媒体文件进行加密保护,使受保护的多媒体文件不会被用户非法的屏拷和复制,同时利用 CDN网络运营商丰富的网络和设备资源,将内容推送到离用户最近的地方,提高了用户的访问质量。对于受保护的媒体文件,用户即使拷贝到其他机器,也无法正 确使用
        当客户使用了DRM技术后,可以控制每个用户对每个流媒体文件的使用权限,如,控制流媒体文件可以被用户播放的次数,在什么时间端内被播 放,从而保证用户只能在数字内容提供商规定或用户自选的付费方式下播放数字内容。而且如果用户试图通过修改计算机时间来绕过播放时间限制将会使已经购买的 播放许可失效,彻底杜绝了对流媒体文件的非法使用。
        实现的基本原理框图如下:    

        


        

              

    1. 将需要保护的内容进行打包,加密。使文件中包含着取得解密密钥的服务器的URL地址  
    2.         

    3. 将加密的文件通过网站进行发布  
    4.         

    5. 用户可以自由地将其下载到自己的计算机上  
    6.         

    7. 在播放之前,媒体播放器会自动连接到文件预先指定的DRM服务器上,选择所要购买的权利,如半个月内可以播放3次  
    8.         

    9. 取得相应的密码  
    10.         

    11. 通过取得地密码,用户就可以播放了
    12.     

        

    动态内容的缓存技术  

    任何一个Web网站的内容都是在不断更新和变化,但这并不意味这这个网站的内容就是动态内容,事实上,动态的内容是指用户每次点击 相同的链接时取的的内容是由Web服务器应用程序生成的,如常见得ASP,JSP等,与此相对应,静态内容一般就是指由文本、图像和多媒体组成,在用户每 次单击相应链接时基本保持不变。现在解决动态内容缓存的最新技术就是通过ESI技术来设计网站的内容。  

    ESI技术工作原理  

    动态生成的内容能为用户带来丰富精彩的页面,网站开发者也可以更容易和更灵活地控制相关的内容,但在享受这些便利的同时,也增加了 网站数据库和应用服务器的处理压力的。当网站的访问量增大后,硬件和数据库的投资是非常巨大的,即使如此,仍然有可能导致页面的严重延迟甚至访问失败。  

    用户访问动态生成的内容速度慢的根本原因在于动态生成的内容需要经过一个复杂的过程,首先,根据用户请求的不同将用户的请求分配到 应用服务器相应的软件模块中,软件模块必须通过运算决定需要从数据库中提取什么样的数据给用户,然后再从数据库中提取出相应的数据按照定义的格式传给用 户。这些冗长的过程导致用户访问速度变慢,同时增加了服务器的负载。  

    在实际环境中,一个动态生成的页面,当中可能只有少量的内容是频繁变化的或是个性化的,对于传统的Cache服务器来说,为了能够 保证页面的时效性,却由于页面中这些少量的动态内容而无法将整个页面进行缓存。ESI(Edge Side  Include)通过使用简单的标记语言来对那些可以加速和不能加速的网页中的内容片断进行描述,每个网页都被划分成不同的小部分分别赋予不同的缓存控制 策略,使Cache服务器可以根据这些策略在将完整的网页发送给用户之前将不同的小部分动态地组合在一起。通过这种控制,可以有效地减少从服务器抓取整个 页面的次数,而只用从原服务器中提取少量的不能缓存的片断,因此可以有效降低原服务器的负载,同时提高用户访问的响应时间。  

    ESI是一种简单的标识语言,开发人员可以使用它标志内容片断以便通过相应的Cache服务器来加速缓存。同时ESI还定义了一套 内容效验标准,可以实现原服务器对Cache服务器中缓存内容的管理,提高了网站对内容的控制能力。CDN网络也可以利用在分布全国各地的节点中安装支持 ESI的Cache服务器来提供对网站动态内容提供CDN服务。  

    ESI的主要优点  

    ESI是一个开放的规范,在实际应用中有许多突出的优点:  

  • 公开的标准,可以保证遵循这个标准的不同厂家的设备之间可以兼容  
  • ESI在设计时就考虑了Cache服务器作为中间层,因此非常适合于CDN网络的应用  
  • ESI  Cache服务器在组合页面的时候,不用象Java服务器那样执行相应得Java代码来处理商业逻辑,因此在发送页面之前不用进行大量的计算、格式化页面 和从数据库提取数据操作,而只用将相应的片断组合在一起,因此在同等硬件条件下,比Java服务器处理的请求更多。  
  • ESI定义了完善的兼容机制,即使用户访问当中没有经过ESI Cache服务器而直接访问原站点,仍然可以完整地访问设计完善的ESI网站  
  • ESI提供了复杂地冗错控制,保证在原服务器出现故障地情况下,Cache服务器仍然能提供有效页面给用户  
  • ESI规定了内容效验的标准,使原服务器可以灵活地控制Cache服务器中缓存的内容  
  • 通过使用ESI技术,可以通过在Cache服务器中重新组合的方式,在保证内容新鲜的同时,实现对页面内容最大程度的缓存,提高用户访问时的响应时间  
  • 通过使用ESI技术,可以保证一些带有个性化信息的页面中的大部分内容能被Cache服务器缓存,而只有个性化的片断回原服务器去取,提高用户访问时的响应时间

    CDN技术的未来  

    随着网络技术的发展,现有的各种网络,如数据网、电信网、移动网、广播电视网都将融入下一代网络(NGN)–一个以IP为基础的 覆盖各种资源的网络。到了那个时候,网络上的应用将更加丰富,同时只有将用户需要访问的内容尽可能分布到离用户最近的地方才能有效地提高网络的利用率,为 用户提供更高品质的服务,而这些都为CDN提供了无限的发展空间。  

    同时,各种国际标准化组织也不断推出新的技术和协议标准,保证了CDN支持的应用服务的发展,如前面提到的ESI技术的出现和发 展。此外,如RUP(Resource Update Protocol)、OPES(Open Pluggable Extension  Services)、iCAP(Internet Content Adaptation Protocol)  等协议标准的出项,将使CDN能支持更多更丰富的应用服务如内容过滤、广告插播等。  

    可以肯定,CDN技术将随着网络技术的发展而不断的前进,并成为Internt及将来NGN网络中不可分割的一部分。

 

原文链接: http://blogold.chinaunix.net/u2/66732/showart_545835.html

================================

相关参考:

http://idc.spforum.net/info/xinwen/Content.asp?iID=27620

http://www.techweb.com.cn/internet/2011-01-12/740419.shtml

 Posted by at 下午 7:30
1月 192011
 

web3.0  web3.0的倡导者和实践者——土豆先生 谈“什么是web3.0”,是目前最好的关于web3.0的阐述。
  我知道很多人在有人提到web2.0的时候就说,还会有web3.0。但他们并不知道web3.0是什么,会在什么时候实现,如何实现,web3.0有哪些特点。我在这里简单阐述一下我对3.0的理解,假如说web1.0的本质是联合,那么web2.0的本质就是互动,它让网民更多地参与信息产品的创造、传播和分享,而这个过程是有价值的。web2.0的缺点是没有体现出网民劳动的价值,所以2.0很脆弱,缺乏商业价值。web2.0是脆弱的,纯粹的2.0 会在商业模式上遭遇重大挑战,需要跟具体的产业结合起来才会获得巨大的商业价值和商业成功。web3.0是在web2.0的基础上发展起来的能够更好地体现网民的劳动价值,并且能够实现价值均衡分配的一种互联网方式。
  web2.0虽然只是互联网发展阶段的过渡产物,但正是由于2.0的产生,让人们可以更多地参与到互联网的创造劳动中,特别是在内容上的创造,在这一点上,web2.0是具有革命性意义的。人们在这个创造劳动中将获得更多的荣誉、认同,包括财富和地位。正是因为更多的人参与到了有价值的创造劳动,那么 “要求互联网价值的的重新分配”将是一种必然趋势,因而必然催成新一代互联网的产生,这就是web3.0。
  互联网的技术日新月异,互联网不断深入人们的生活,web3.0将是彻底改变人们生活的互联网形式。web3.0使所有网上公民不再受到现有资源积累的限制,具有更加平等地获得财富和声誉的机会。web3.0会从哪里开始呢?事实上,已经有了web3.0,只不过还没有得到足够多的了解。那就是电子商务领域和在线游戏。不管是BC还是CC,网民利用互联网提供的平台进行交易,在这个过程中,他们通过互联网进行劳动,并获得了财富。在线游戏通过积分的方式,角色扮演者通过攻城掠寨、不断地修炼、花费大量的时间,他们在那里可以获得声誉和财富,而这个财富通过一定的方式可以在现实中兑换,正所谓人生如同一场游戏,互联网会让人们的生活变得更像游戏一样。当前的论坛也提供积分,但由于缺乏个性,这个不会成为未来的主流,最有代表性的blog,却在积分方面做得很少,劳动价值没有体现,也因为这样,好的bloger将另起炉灶,以便得到更多,这是在追求一种更加均衡的分配方式。当这个2.0的参与者有足够力量和筹码的时候,他们就会要求一种对他们更公平合理的分配方式。在bloger个人力量不够的时候,可以通过联合的方式来争取自己的利益。
  web3.0到来的三个前提:1、博客技术为代表,围绕网民互动及个性体验的互联网应用技术的完善和发展。2、虚拟货币的普及和普遍,以及虚拟货币的兑换成为现实。3、大家对网络财富的认同,以及网络财务安全的解决方案。
  web3.0跟web2.0一样,仍然不是技术的创新,而是思想的创新,进而指导技术的发展和应用。web3.0之后将催生新的王国,这个王国不再以地域和疆界进行划分,而是以兴趣、语言、主题、职业、专业进行聚集和管理的王国。到时候真可谓是“皇帝轮流做,明年到我家”,你有机会打造出一个新的互联网王国而成为一个国王,也有可能会在互联网王国的民主竞选中成为总统,到时,你将拥有来自地球各个角落的网络公民。
[编辑本段]1 web2.0
  1.1 什么是2.0
  定义:所谓的2.0是互联网应用理念上和架构上的升级,而不是简单的某种技术的创新或者某种应用
  Ajax、blog、rss、wiki,这些是web2.0?Ajax只是一种一直以来都存在的javascript应用,blog只不过是个人主页的一种改进,rss只不过是xml中一种格式。
  所以关键的不再与技术,而在于理念。理念上,Ajax推崇异步web应用;blog推崇一个人为中心的内容管理;rss将分散的个人内容有效的聚集到一起。
  web2.0期间出现的应用,虽然有一定的技术含量在里面,但那不是主要因素,你没法从技术上解释web2.0,blog远不如bbs系统的技术成熟和复杂,但是理念更前卫。
  我曾经一向讨厌web2.0的叫法,主要是被一些人瞎忽悠搞得很烦。但是不得不承认,web2.0确实是一个非常成功的命名。所以今天也借着这种叫法来说事,就叫web3.0吧。
[编辑本段]2 web3.0
  从经济状况上说,Web 2.0 完全是个失败者。像 MySpace 和 Facebook 这样的社交网络公司的确拥有忠实的粉丝群,但它们实际上并没在盈利。据预计,2008 年 MySpace 的收入将为 6 亿美元,这离其母公司新闻集团(News Corp.)给它设定的几十亿美元销售目标相距甚远。提供短信服务的 Twitter 公司根本没有任何业务模式。视频分享网站 YouTube 是唯一一家卖了个好价钱的公司,两年前谷歌公司(Google)在它身上花了 16.5 亿美元,结果到现在都没想出该如何利用它挣钱。
    社交媒体的卫士们曾指望 2008 年成为 Web 2.0 [科技类出版商蒂姆·奥雷利(Tim O’Reilly)四年前发明了这个词,用来形容能让用户发布和分享内容的新一波互联网创新技术] 打翻身仗的一年。而事实上,过去的 12 个月却令人失望。自 2007 年 Twitter 声名鹊起以来,几乎再没出现过让行业面貌一新的公司。现有的这些网站确实改变了我们在网络上的互动方式,但它们并未能像亚马逊公司(Amazon)和雅虎公司(Yahoo)这些 Web 1.0 的前辈们那样创造新的盈利方式。
    其中一个原因是,今天的网络新兴公司所处的经济环境比第一波网络经济热潮时恶劣得多。首次公开发行股票的大门几乎关闭:在过去一年中,只有 6 家靠风险投资支持的美国公司上市,而且没有一家是网络行业的。另外,那些潜在的收购者—从雅虎这样的互联网公司到传统媒体业的哥伦比亚广播公司(CBS)这类企业集团,自己就在忙於应付大麻烦。
    被收购并不是救治社交网络公司的灵丹妙药。这些公司都没有切实可行的业务模式,基本上只依赖发布广告—也就是人们所说的横幅广告—来盈利。但营销商对於在网站上登广告的热情也开始减退,尤其对在社交类网站上做广告持怀疑态度。实际情况是,当你在 Facebook 上浏览昨晚节日派对的照片时,你很有可能不会去注意牙齿美白的广告。由於这些网站上充斥用户自己制作的内容,因此这些页面庞大的浏览量让 Web 2.0 公司无法收取像门户网站那么高的广告费用。举个例子,雅虎的新网站上一个横幅广告的费用可能是 Facebook 的 30 倍以上。
    大部分的业内观察家认为,Facebook 能想出在这些网站上放广告的高招。2008 年秋天,首席执行官马克·扎克伯格(Mark Zuckerberg)首次推出 Beacon,当时被称为一种“社交广告”战略,能监测用户在电子商务方面的偏好,并发送信息给他的好友。扎克伯格受到了有关侵犯隐私的强烈指责,而 Beacon 也遭到冷落。Facebook 最近发布 Facebook Connect,让用户能够通过登录 Facebook 帐号链接到其他网站。网络发布者对此欣喜万分,但公司目前主要依靠的还是增长缓慢的“传统”网络广告形式。根据不同资料来源,公司 2008 年的收入预计将达到 2.75 亿美元,这个数字仍未能让公司盈利。
    Accel Partners 公司的吉姆·布雷耶(Jim Breyer)是 Facebook 最大的外部投资人,他仍持乐观态度。他宣称,“到目前为止有利的成果还未显现,但我坚信在未来几年内必将到取得成果。”他还解释说,他认为这些公司还处於婴儿期。事实上,Accel 刚宣布了提供合计达到 1 亿美元的两项基金,它们将投入到几家成立不久的社交媒体公司。
    确实,Facebook 和 MySpace 这类网站仍有可能在经济上变得强大起来。想想吧,亚马逊最初也只是一家网上书店,而谷歌起步时不过是再多了一个搜索引擎。然而,今天的 Web 2.0 公司可能会发现自己已经被改造,甚至在新一波网络创新技术的光芒下黯然失色。扩展了网络功能的新兴公司正在崭露头角,它们开发了可以挂靠现有网站的位置服务系统和财务支付系统。这类公司一般自食其力,大部分时间都能实现盈利,并且可能很快就会被收购。即使是在如今严峻的经济形势下,这些新兴企业还在筹集资金,试图进行改变整个人生或是行业的致命出击。欢迎来到 Web 3.0 时代!
  2.1 web2.0只是开始和过渡
 
  web2.0虽然在理念上有了一定的升级,但还是远远不够的,我们仍然可以看到很多问题,我只说三个:blog的发布系统、评论系统和插件应用
  2.1.1 发布系统
  内容管理是blog的最基本功能,现在blog的系统也无非是实现了What You See is What you Get (WYSIWYG) 的可视化编辑,实现了分类,复杂点的实现了TAGs。内容的索引能力都是无一例外的很差(blogger可能会好点,具体没研究),版本控制似乎还没有哪个blog有,现在看来,这些功能还稍显复杂,但当一个blog堆积了1000篇文章的时候,索引和修改都会变得非常困难。就如我的blog,想要找一篇历史文章,我都用google去搜索,想要改动什么文字,我宁可重新写一篇新的,想要重新整理整个Blog?那我一定是疯了- –
  所以,未来blog(其实也无所谓blog,应该是个人网络中心,下面我会讲到)的内容管理一定会加入现在wiki里面的版本控制功能,集成功能强大的全文索引功能。
  我已经很久没更新blog,多半原因是后台太难用了,今天装了Live writer才有动力写篇文章上来。在网速和浏览器速度没有足够快之前,我还是宁可多花几分钟的时间下载和安装一个客户端,在享受更强大编辑功能同时,节省很多时间。
  2.1.2 评论系统
  上面我说到blog的技术成熟度远低于bbs,评论系统就是其中之一,纵观现在所有的blog系统和bsp,我还没见过哪个blog系统的评论功能能跟 Discuz比。blog不需要功能复杂的评论?那你可就错了,去看看老徐的博客,随便那篇文章不是成百上千的评论?你觉得新浪的评论系统够用吗?它起码有分页,比我用的mt强多了,但还是无法实现丰富的内容编辑和索引。
  说道评论系统不得不说的是trackback,trackback 作为一种blog之间内容关联评论功能,本来是想泥补跨站内容关联的功能缺陷,但实现的太蹩脚太简单,以至于很多人不知道这个东西怎么用,却被 spammer找到空当大肆利用。现在已经成为一个鸡肋,很多人在扬言trackback已死。
  除trackback外的评论内容,留言者都无法管理和监控,虽然有些blog系统有自动邮件提醒的功能,但这是远不够的。
  所以未来评论系统也一定会强化。
  2.1.3 插件应用
  blog系统的不足远不止发布系统和评论系统,插件是目前填补系统功能不足的最有效手段,wordpress的成功,就得益于完善的插件平台,得到了广大开发者的支持。
  但是wp的插件系统缺陷是显而易见的,我做了好多年php开发的人,使用起来都觉得头大,非技术人员就不用说了。另外,wp的插件是无法迁移到其他平台上用的,尤其是跨语言的平台。
  现在国外有一些平台,已经在做这样的标准,通过一个REST风格的url就可以忽略平台限制,使用插件。比如netvibes、Facebook、iGoogle、live,国内,sohu blog也引进了netvibes的uwa框架,尝试做开放式blog widget平台。
  这有点类似于rss的应用,用xml的标准推行内容传播,Open Widget则是将widget作为一种内容,通过xml的标准传播。
  没有哪一家服务供应商或者平台开发者能够满足所有用户的需求,只有Open的大千世界,才是大家所期望的,所以Open Widget一定会成为一种趋势。
  好了,说了这么多,无法而是想证明web2.0只是一个过度,那么什么才是web3.0呢?
  2.2 什么是web3.0
  其实说到这里,很多人应该已经看出来,没有什么所谓的2.0、3.0,因为你没法准确的界定他是什么样的应用,也没法界定它是什么时候开始的,什么时候结束,它只是互联网本身发展的一种趋势。
  我要说的3.0,是我目前所能想象的未来互联网应用的框架。
  a、网站内信息可以直接和其他网站信息进行交互和倒腾,能通过第三方信息平台同时对多家网站信息进行整合使用;
  b、用户在互联网上拥有自己的数据,并能在不同的网站上使用;
  c、完全基于Web,用浏览器即可实现复杂的系统程序才具有的功能
  可以说Web3.0是三广+三跨(广域的 广语的 广博的 跨区域 跨语种 跨行业)
  现实中的每一个行业都是在不断的细分和完善中发展的,比如建筑业、金融业,都已经有比较清晰的划分并且仍在细化,这是几百上千年的发展过程中建立起来的。而互联网才不过发展了不过短短十几年,对于一个可以涵盖几乎所有传统行业的领域来说,现在的互联网应用细分程度还远远不够。就如软件工程里面说的,软件开发的标准和规范还十分简单,开发方法和模块的重用程度远远不够。
  互联网也是如此,各种应用的细分、完整性和重用程度远远不够。
  所以我认为,未来互联网应用的发展方向一定是向着更加细分、更加专业、更加兼容的方向发展,内容管理将有专业的内容管理提供商,comments将有专业的 comments服务商;插件将有类似于rss的统一标准,而且也会出现像feedburner、google reader这样的widget托管平台和订阅平台。
  blog,将演变为个人中心,个人中心中的所有内容只有一个域名和一个页面,剩下的所有的服务都由专业服务商提供,用户只需将需要的应用以widget的方式添加到自己的页面上,就可以享用各种各样完善的服务。
  但也不会是像google ig、netvibes这样的集中型个人主页,因为他们没有个性,灵活性也不够。也不会是sohu这样的blog平台,因为各种服务都不是一家公司提供的,bsp可能回归到最原始的个人主页服务,提供一个二级域名和一个静态空间。
  那么最主要的一个问题:帐号由谁提供呢?OpenID肯定会成为web3.0的中坚力量,将各个平台有机的连接起来,是你无论走到哪,都用同一个帐号,内容处处关联。
  而id 服务本身是需要跟信用挂钩的,这是虚拟和现实之间必须建立的桥梁,现有的社区中信用服务都是依靠某种技术手段建立,都很费劲,而且无法跟现实中的人和信用建立起完整有效的关联,我们不难想到,直接掌握最可靠信用的是银行,所以未来提供OpenID或者互联网身份服务将是银行建立的一种服务,很可能成为银行的某种业务。
  在这种模式下,互联网服务已经跟传统的服务行业一样,提供专业服务,收费,互联网的盈利模式也将随之改变。
  2.3 Web3.0的特征分析
  作为Web2.0的替代物,Web3.0仍然是建立在Web2.0的基础之上,并且实现了更加“智能化的人与人和人与机器的交流”功能的互联网模式。区别于通常意义上的互联网研究,本文从广播电视媒体网络化角度出发,归纳总结了Web3.0四个方面的主要特征,具体如下。
  (1)微内容(Widget)的自由整合与有效聚合。
  Web3.0将应用Mashup技术对用户生成的内容信息进行整合,使得内容信息的特征性更加明显,便于检索。将精确地阐明信息内容特征的标签进行整合,提高信息描述的精确度,从而便于互联网用户的搜索与整理。同时,对于UGC的筛选性过滤也将成为Web3.0不同于Web2.0的主要特征之一。对于互联网用户的发布权限经过长期的认证,对其发布的信息做不同可信度的分离,可信度高的信息将会被推到互联网信息检索的首项,同时提供信息的互联网用户的可信度也会得到相应的提高。
  最后聚合技术的应用将在Web3.0模式下发挥更大的作用,TAG/ONTO/RSS基础聚合设施,渐进式语义网的发展也将为Web3.0构建完备的内容聚合与应用聚合平台。将传统意义的聚合技术和挖掘技术相结合,创造出更加个性化、搜索反应迅速、准确的“Web挖掘个性化搜索引擎”。
  (2)适合多种终端平台,实现信息服务的普适性。
  Web3.0的网络模式将实现不同终端的兼容,从PC互联网到WAP手机,PDA,机顶盒,专用终端,不只应用在互联网这一单一终端上。
  现有的Web2.0只能通过PC终端应用在互联网这一单一的平台上,面临现在层出不穷的新的移动终端的开发与应用都需要新的技术层面和理念层面的支持。而Web3.0将打破这一僵局,使得各种终端的用户群体都可以享受到在互联网上冲浪的便捷。
  实现融合网络的普适化、公用显示装置与个人智能终端的通用,同时加入E-RAD的应用与研发,使得嵌入式技术在Web3.0模式下发挥更大的效力。
  (3)良好的人性化用户体验、以及基础性的个性化配置。
  Web3.0同样以人为本,将用户的偏好作为设计的主要考虑因素。Web3.0在对于UGC筛选性的过滤的基础上同时引入偏好信息处理与个性化引擎技术,对用户的行为特征进行分析,既寻找可信度高的UGC发布源,同时对互联网用户的搜索习惯进行整理、挖掘,得出最佳的设计方案,帮助互联网用户快速、准确地搜索到自己想要感兴趣的信息内容,避免了大量信息带来的搜索疲劳。
  个性化搜索引擎以有效的用户偏好信息处理为基础,对用户进行的各种操作以及用户提出的各种要求为依据,来分析用户的偏好。通过偏好系统得出的结论再归类到一起,在某一内容主题(如体育方面)形成一种内容,搜索的聚合,推送,达到更好的满足用户搜索,观看的需要。将这一技术引入广播电视中来,将会给传统电视带来巨大的影响。对于数字机顶盒的应用,IPTV、WebTV的推广提供了更好的聚合推送业务。
  个性化引擎的建立是一偏好系统为基础,偏好系统的建立要全面而且与内容聚合相联系。有了一定的偏好分析,才能建立起完善的个性化引擎。
  (4)有效和有序的数字新技术。
  Web3.0将建立可信的SNS(社会网络服务系统),可管理的VoIP与IM,可控的Blog/Vlog/Wiki,实现数字通信与信息处理、网络与计算、媒体内容与业务智能、传播与管理、艺术与人文的有序有效结合和融会贯通。
  Web2.0模式下的SNS¬——网络社交平台,只是简单地将人与人通过互联网这一平台连接起来。通过互联网注册在SNS的平台上结交朋友这一途径,并不能确保注册信息的可靠性和有效性,并不是每一次交际圈的扩展都会带来相应的利益需求,这一过程进行下去的结果将会导致本身信息的外泄和零乱、不可靠信息的泛滥,颠覆了人们想利用互联网来扩展人际交往的初衷。这一问题在Web3.0模式下,将通过对用户的真实信息的核查与认证这一方式来解决。高可信度的信息发布源为以后交际圈的扩展提供了可靠的保障,与此同时,人们在交际的同时,也可以更迅速地找到自己需要的人才,并且可以完全信任这些可信度高的用户提供的信息,利用这些进一步扩展对自己的有利的交际圈。
  Web3.0模式下可管理的VoIP与IM,同样为互联网用户的使用提供了方便快捷的服务方式。可信度越高、信用度越好的用户发布的信息将会被自动置顶,既提高了信息源发布者的可信度,同时使得这些有用、真实的信息更快地出现在用户的面前,发挥信息的最大效力,提高了信息的使用率、降低了信息查找的时间损耗。
  Web3.0模式下可控的Blog/Vlog/Wiki,同样也是为了提高消息的利用率与查找信息的便捷度而生的。这些原本在Web2.0模式下允许用户随意发布的Blog/Vlog/Wiki会使得网络上堆积大量杂乱无章的信息,为用户的搜索带来了极大的不便。由此,Web3.0提出了“可控”这一概念,使得信息的发布与使用连接起来,如果想搜索高可信度的信息,可以点击可信度高的用户撰写的Blog/Vlog/Wiki,实现可信内容与用户访问的对接。
[编辑本段]web3.0典型应用:
  雅蛙是中国目前web3.0最杰出的代表。原因如下;
  1.雅蛙实现了网站信息自由聚合,真正做到了以人为本的web3.0网络理念;
  2.web3.0不是一个超脱的新理念,而是一个在web1.0 2.0理念上的升华和人性化体验,在这里仍然有非常自由的,兴趣相投的人聚合在一起,交流、讨论;
  3.雅蛙开发的很多实用工具能让用户轻松体验一页聚合博客、QQ空间、行业资讯、收发邮件、天气预报、搜索引擎等等工具。一个页面实现所有互联网信息的互通。
  一句话说网络:Web1.0 — 信息共享,Web2.0 — 信息共建,Web3.0 — 知识传承,Web4.0 — 知识分配,web5.0 — 语用网。
  任何人在试用过我们免费开放了的知识界产品之后,都会欣然理解“什么是Web3.0系统”等浅显问题的。

 Posted by at 下午 7:23