首页 | DV动态 | 数码产品 | 视频采编 | 网站建设 |
【收藏DV】
  最近3月排行
·赤马劫
·985、211、双一流
·上了大学也没体面工作,我们是否还要上大学- 附一组数据
·许小年:碎片化信息让人变得无知,要少看手机多读书
·许小年:浅析日本失去的30年——兼评“资产负债表衰退”
·高中英语-单词表
·常用网管软件下载,持续更新中...
RSS的来龙去脉
2006/5/23 14:24:22
 

  RSS最早是由NetScape定义的一套新闻频道标准,由于当时NetScape在与微软的IE浏览器竞争中每况日下,只推出了RSS 0.9版本,并没有推出RSS的正式版本,与此同时,微软在IE4.0中设计了一个叫做新闻频道的功能,其中与RSS相类似的概念是CDF(Channel Definition Format),并提出Push互联网的概念,即将信息"推"给用户,今天我们在MSN的主页中还能看到"My MSN"一项,就是这个概念的痕迹,不过Push互联网没有找到合适的应用方式,IE的后续版本中最终抛弃了这一功能。


  RSS应用开始于近两年流行的Web log(博客),Dave Winner使这一标准重新找到了用武之地,他将RSS标准升级到0.91和0.92版本,RSS成为Web Log作者logger间传递新闻主题和内容的主要方式,随着Web Log的日渐流行,RSS也逐渐被许多新闻网站认可。

  RSS的广泛应用,标准化呼声也日渐升高。W3C对RSS制定了RSS1.0标准,将RSS定义为RDF Site Summary,RDF(Resource Description Framework)资源描述框架是一个语义网概念,但由于W3C与Dave Winner并未就此达成一致,2002年9月,Dave将自己的RSS0.9X升级到RSS2.0,因此目前RSS1.0与RSS0.9X/RSS2.0是相对独立的标准。

  上述3段经历,似乎可以解释RSS英文的三种不同缩写方式Really Simple Syndication、Rich Site Summary、RDF Site Summary,尽管对于RSS还存在着许多分歧,RSS未来的发展也存在一些不确定性,但有一点是共同的,RSS目标是成为互联网信息沟通的通用标准。

  RSS对于互联网意义

  RSS的标签很少,是一个非常简单的协议,技术实现也非常方便,正因为如此,在一些人眼中,RSS只不过一个简单的标记语言而已,说他能够深刻影响互联网实在有些小题大做。

  从RSS的历史发展来看,RSS是一种信息沟通标准,RSS借助XML技术形式,完成互联网站点间信息的自动传送,XML是解决互联网机器通信的重要基础,与HTML是适合于人阅读的信息模式不同,XML是适合于机器阅读的信息模式。

  RSS作为站点间的信息沟通标准,有两个特点,一个是网站间自动完成,不需要人工介入,二个是传送的内容是一个分类的索引信息。从自动完成这一点看,将对互联网信息传送的速度和广度产生影响;从RSS的内容是分类的索引信息这一点看,具有语义的含义,互联网信息的定义将从纯粹的文本符号上升到有语义联系的层面。

  由此可见,看起来十分简单的RSS技术实际上承载着格式化互联网信息,并赋予互联网语义的重任。不过,RSS只是一个索引信息,并没有完整解地决信息沟通的问题。

  RSS的使用情况

  RSS最初主要由Web Log类的网站使用,是Web Log作者logger间传递新闻主题和内容的主要方式,后来,新闻网站使用RSS也越来越普遍。

  分析国内的RSS的分布可以粗略得出如下结论:

  RSS目前在信息源类的网站中有较多的使用。例如:博客网站,博客很多是博客作者发表的原创作品,例如:博客中国www.blogchina.com,中国博客www.blogcn.com;新闻网站,新闻网站是新闻机构的网络窗口,具有自己的新闻源。例如:新华网www.xinhua.com ,人民网(目前开通了英文版俄文版)www.people.com.cn。

  RSS在搜索引擎类的网站中作为聚合新闻频道使用,应用比较广泛。例如:百度,古狗。

  RSS还被大量的新起网站当作力推的重点,这种免编辑的新闻模式,不仅被人们看成是一种新业务的金矿,而且实实在在的节省成本。

  RSS客户端也有多家公司在力推,新浪点点通阅读器,看天下,周伯通等等。

  与RSS相关联的另一个概念就是新闻定制,你可以通过RSS客户端或者新闻聚合站点,对你感兴趣的新闻版面进行定制。

  这种看起来很有意思的崭新的新闻形式,并没有得到用户群广泛的门户网站的大力响应,目前只看到新浪推出RSS,而且推广RSS的力度方面不见大张旗鼓。

  整体看来,RSS处在"主流"乏力,"非主流"兴奋的一种状态。导致目前RSS目前状况的原因可以从两个方面来分析,一个是业务方面,另一个是价值链方面。

  RSS业务形势分析

  作为信息源的网站,提供了RSS方式,能够方便客户对内容的直接访问,扩大内容的影响力;对于信息接收的网站,可以方便的接收多家信息,并能实时跟踪,达到广泛、及时的目的。

  由此看来,作为一种新型信息交流标准,RSS为互联网任意两个站点间提供了自动的信息沟通方法,这对于需要加强信息传递的网站来说,具有重要意义。

  但是,RSS并没有给出信息交流的最终答案。

  RSS虽然改变了互联网以前仅能传递"符号",内容意义只有在使用者看到的时候才能理解的状况,达到按照内容分类进行传递的目的,也就是能够传输语义,但是,由于RSS规定的内容分类的含义非常有限,人们在利用RSS分类(或者称为频道)识别信息的时候,经常会出现人们希望的信息和得到的信息不够一致的情况,这说明RSS的语义特征并不成熟,RSS不能够达到良好承载语义的目标。

  RSS语义承载能力不够,表现在新闻聚合中有两个问题,一个是从新闻源传来的新闻信息,聚合到一起的时候显得混乱,不条例,冗余(相似信息重复)非常明显;另一个问题,如果根据RSS分类进行新闻个性定制,你定制到的新闻可能和你希望的新闻有出入,你关心的消息可能漏掉了,或者有很多看到的消息是你不关心的。

  许多网站是通过转载信息而不是原创,表面看,似乎可以利用RSS新闻聚合提升内容整合的实时性和广泛性,但由于RSS语义承载能力的不足,在未来很长一段时间内,对内容的识别还需要依来于编辑,因此,对于门户这种需要表现独立信息视角的网站而言,不大可能采取RSS进行新闻聚合。

  RSS在提高信息传输的效率的同时也会带来负面效果,对于一些需要保护版权的信息内容,或者不希望其他网站利用自动化手段能够快速访问的信息源来说,提供RSS的效果适得其反,采用了RSS之后,非常方便其他网站对内容进行引用,这对于非常需要人气的门户而言,并不是个好消息,这或许解释了门户网站没有积极的向外提供RSS索引的原因,因为RSS是给机器看的,而门户广告最想要人看。

  RSS互联网价值链分析

  传统门户网站最重要的盈利形式是广告,包括主页广告、专栏页广告和内容页广告,主页和专栏页通常是标题索引的页面,访问内容基本上都需要通过标题索引页面,因此这里是门户网站广告价值的核心点,尤其是网站主页。

  通过对RSS的业务形势分析,我们能够看到RSS对现存的互联网价值链的冲击,RSS加速了信息从源到接收段的传输,使得建立在信息传输中间环节的互联网价值缩水。

  对门户来说,首页广告和专栏页广告承载着门户的重要收益,假如全面推广RSS方式,首页和专栏页的浏览率肯定会大幅下降,其收益也会大受影响。

  另外,RSS使得免编辑的网站大量出现,免编辑网站比人工网站的信息更新更快,尽管内容质量方面离替代编辑还有很长的路要走,但这对于那些靠"拷贝"加"粘贴"搞起来的网站而言无疑是个噩耗,古狗新闻网站的两年来的快速发展,很能说明问题。

  值得关注的是,RSS在冲击传统互联网价值链的同时,并没有为自己找好市场价值,古狗公司新闻网站还一直处在亏损状态,其他以聚合为特征的新闻网站利好消息也少。

  由于标题索引页面是标题的集中地,与看新闻内容有些段落的内容看几句话就可以跳过去不同,标题之间没有必然关联,网民常常不能随意忽略,看标题索引比看内容更需要专注,因此,在这些地方投放广告更容易扰民。

  一些RSS聚合网站在寻找和传统网站的竞争优势的时候,推广所谓绿色看新闻的概念,目的就是利用RSS直接索引标题,免除用户索引页广告骚扰之苦;客户端的RSS阅览器,除了能够同时从多个站点获取新闻外,免除索引页广告,也是一个重要的优势。

  问题也来了,如果主页和专栏页不投入广告,内容页由于版权的关系,常常需要直接链接,以RSS为核心的新闻模式价值点究竟在何处?RSS推崇者非常迷惑。一种可能的方法是让看新闻的用户付费,推所谓有偿新闻,但在以免费为核心的互联网新闻传播中,是否具有足够的吸引力让用户掏钱?

  如果价值链中只有最终的用户能够享受好处,这种价值链变革是缺乏长久动力的。

  RSS的未来

  今天,RSS风潮已经席卷而来,问题和机遇都已经摆上了桌面,处在变局中不利位置的互联网企业确实比较为难,无论如何,他们应该关注并理解这种变化,需要在变化的价值链中重新找回自己的奶酪,选择退缩和观望,虽然能够延缓自己已经形成的价值链潜在的快速嬗变,但是由于处在价值链中企业并不是自己一家,竞争的环境中,你不做还会有别人做,与其让别人做还不如自己做,新浪的态度或许正是这一状况的真实写照,不温不火,能进能退。

  RSS为互联网信息定义提供了简洁的标准,并为更广泛的互联网信息定义提供发展方向,RSS对互联网的影响是深远的,但是由于RSS的不确定性,RSS对互联网的影响将不会在短期内快速释放,RSS对既定互联网价值链的冲击,也会对RSS普及产生负面影响,明天的互联网,我们不仅仅要正面RSS的存在,更要关注RSS所引起的整个互联网格式化、语义化的大潮流。

三大核心功能:

RSS
Permalink
Trackback Ping

RSS
首先谈RSS,RSS其实很多朋友都已有了解。RSS是站点用来和其他站点之间共享内容的一种简易方式(也叫聚合内容),通常被用于新闻和其他按顺序排列的网站,一段项目的介绍也可以是包含新闻的全部介绍等。或者仅仅是额外的内容或者简短的介绍。这些项目 的链接通常都能链接到全部的内容。网络用户可以借助RSS Reader在不打开网站内容页面的情况下阅读支持RSS输出的网站内容。网站提供RSS输出,有利于让用户发现网站内容的更新。

现在很多站点都有RSS Feed,那么为什么是Blog的核心呢?RSS 本质上中是一种遵循W3C RDF规范的XML格式,Blog和RSS结合十分紧密,自Blog一诞生以来,标准的Blog站点都支持RSS技术规范,能够包含网站的Logo、Link、标题、内容等等。

Permalink

中文翻译一般叫做固定链接,其实我觉得翻译成静态链接更为贴切。下面切入正题:

不得不承认,将动态网页链接rewriting成静态链接是最保险和稳定的面向搜索引擎优化方式。

此外随着互联网上的内容以惊人速度的增长也越来越突出了搜索引擎的重要性,如果网站想更好地被搜索引擎收录,网站设计除了面向用户友好(User Friendly)外,搜索引擎友好(Search Engine Friendly)的设计也是非常重要的。进入搜索引擎的页面内容越多,则被用户用不同的关键词找到的几率越大。在Google的算法调查一文中提到一个站点被Google索引页面的数量其实对PageRank也是有一定影响的。由于Google 突出的是整个网络中相对静态的部分(动态网页索引量比较小),链接地址相对固定的静态网页比较适合被Google索引(怪不得很多大网站的邮件列表归档和BLOG按日期归档的文档很容被搜的到),因此很多关于面向搜索引擎 URL设计优化(URI Pretty)的文章中提到了很多利用一定机制将动态网页参数变成像静态网页的形式:
比如可以将:
http://d4e.org/showthread.php?t=12327
变成:
http://d4e.org/2004/09/08/01

实现方式主要有2种:

基于url rewrite
IIS的ISAPI REWRITE(免费下载)
基于path_info
具体实现细节不是本文重点,不再细述。很多BLOG程序后台都能打开此功能,也要注意WEB服务器的设置,使用***无法设置服务器的朋友请参考path_info的一些资料。

静态地址还有什么好处:

隐藏后台实现:这在后台应用平台的迁移时非常有用:当从asp迁移到java平台时,对于前台用户来说,根本感受不到后台应用的变化;
简化数据校验:比如我们需要将应用从news.asp?id=234迁移成news.php?query=234时,前台的表现可以一直保持为 news/234.html。从实现应用和前台表现的分离:保持了URL的稳定性,而使用WEB服务中的mod_rewrite甚至可以把请求转发到其他后台服务器上。
从技术层面来讲,论坛如果想被搜索引擎更多的关注的话,同样可以实现Permalink。

Trackback

TrackBack最早是Movable上的一个小功能。可以说就是这个小功能在blog界却掀起了一场革命。

TrackBack为将全世界无数个blog连接起来的功能。例如,当你读了某个网站的文章,想对此写下自己的感想。这个时候利用网站准备的讨论功能进行留言是很最常见的做法。但这样只是把自己的评论意见写下来向别人的网站投稿,而你自己手里却什么也没留 下。

TrackBack 则与之有很大的区别。可以把评论写到自己网站上。然后向原始文章的服务器发送该网页的URL及标题、部分正文、网站名称等信息(注)。尽管这一过程只是称之为“发送TrackBackPing”,但通过这种办法,在原始文章的地方就留下了你的评论的URL 、标题等部分信息。当然别人也可以向原始文章发送TrackBack Ping,所以在原始文章中就将包括你的TrackBack Ping在内的所有评论都记录了下来。

此外,如果你在自己网站上也设置了TrackBack Ping功能的话,那么谁都可以通过TrackBack Ping来发表针对你的意见了。这样,多家网站就通过相关话题而联接起来。各种评论在因特网上就像网眼一样联接起来。这样就创造出了与日记网站完全不同的文化。

注:发送地址采用原始文章指定的URL,这一URL就称为“TrackBack Ping URL”。TrackBack的技术标准刊登在“LowLife.jp”的blog网站上。

如果你使用的是服务商提供的Blog服务,服务商没有提供Trackback怎么办?或者你的空间不足以放下太多的Trackback回复,又怎么办?

到HaloScan.com去看看。

最后用一句话总结这三大功能:

RSS:能让用户更方便的订阅
Permalink:能更好的让你的文章被搜索引擎关注
Trackback:能更好的与其他Blog进行交流、讨论、沟通


什么是 RSS :rss.txt
RSS 系列介绍(一):RSS的一些背景资料

讨论与Blog相关的技术,不可不谈的就是RSS,这个缩写在英文中可以有几个源头,并被不同的技术团体做不同的解释。既可以是“Rich Site Summary”,或“RDF Site Summary”,也可以是“Really Simple Syndication”。为什么有这么多含义呢?这还要从RSS的一段今天也没有理清的关系说起。

今天肯定有人还记得IE 4刚刚推出来的时候有一个有趣的功能,那就是新闻频道。这个新闻频道的功能与Netscape推出的新闻频道是很相似的(当时Netscape还是市场上领先的浏览器)。为此Netscape 定义了一套描述新闻频道的语言,这就是RSS,只不过Netscape自当时起每况愈下,所以最终也没有发布一个正式的RSS规范(只发布了一个0.9版本)。而微软也在当时推出了支持自己IE的CDF(Channel Definition format)数据规格,与RSS非常接近。微软试图用新闻频道的功能把“推”(Push)技术变成一个应用主流,并与Netscape抗衡。不过出乎预测的是,“推”技术自始至终没有找到合适的商业模型,而且伴随着其他各类网络特性的出现,也日益无法显 现自身的优势。新闻频道在浏览器中的地位最终日暮西山,最后也在IE的后续版本中消失了。

新闻频道的确进入了低谷,但是RSS并没有被业界人士所抛弃。过去两年,Blog从一个专业群体开始,逐步成为了网络上最热门的新话题。而RSS成为了描述Blog主题和更新信息的最基本方法。于是RSS这项技术被著名Blogger/Geek戴夫·温那(Dave Winner)的公司UserLand所接手,继续开发新的版本,以适应新的网络应用需要。新的网络应用就是Blog,因为戴夫·温那的努力,RSS升级到了0.91版,然后达到了0.92版,随后在各种Blog工具中得到了应用,并被众多的专业新闻站点 所支持。在广泛的应用过程中,众多的专业人士认识到需要组织起来,把RSS发展成为一个通用的规范,并进一步标准化。一个联合小组根据W3C新一代的语义网技术RDF对RSS进行了重新定义,发布了RSS 1.0,并把RSS定义为“RDF Site Summary”。这项工作并没有与戴夫·温那进行有效的沟通,而戴夫则坚持在自己设想的方向上进一步开发RSS的后续版本,也并不承认RSS 1.0的有效性。RSS由此开始分化形成了RSS 0.9x/2.0和RSS 1.0两个阵营,也由此引起了在专业人群中的广泛争论。

因为争论的存在,一直到今天,RSS 1.0还没有成为标准化组织的真正标准。而戴夫·温那却在2002年9月独自把RSS升级到了2.0版本,其中的定义完全是全新的模式,并没有任何RSS 1.0的影子。这引发了网络上进一步争议,究竟让一个越来越普及的数据格式成为一个开放的标准,还是被一家公司所定义和控制,成为了争议的焦点。戴夫·温那并没有为自己辩解,他的观点是RSS还需要进一步发展,需要专业人士更明确的定义,不过恐怕这种轻描 淡写不能消除人们对RSS“被一家商业公司独占”的担心。

前面的铺垫对用户来说也许没有什么太大的意义,可能更多人关心如何在自己的Blog增加RSS输出,这样可以让很多新闻聚合工具(例如CNBlog刚刚推荐的NewzCrawler)很容易找到你并自动获得你在Blog中的更新内容。

所以我们会在后面的系列文章中逐步增加对RSS工具的介绍,以及如何在你的Blog中添加RSS输出格式和相关的标志链接。等不及的用户,可以先到我的个人站点上的一个临时链接地方尝试起来了,我提供了一个简单的RSS生成工具和相关的介绍(对Blogg er.com工具最佳,其他工具还没有做测试)。

P.S. goghs 的一个留言,供大家参考,普通用户大可以跳过: “关于RSS两个标准之争前段时间确实很激烈,很多局内人士被迫翻出了陈年老帐。有些争论甚至到了攻击的地步。跑开情感因素不论,作为一个完全的局外人,我个人是比较偏向于0.9x/2.0 (具体就是0.91 -> 0.92 -> 0.94 -> 2.0)的。1.0将rdf的命名空间重新加入了RSS,这有它的意义。但是从RSS使用的领域,至少是现在的使用目的而言,1.0标准显得过重了。相比之下2.0更简单更实用一点。 至于说一家公司控制标准的问题,其实从一开始RSS就处在这种状况之下,如果你认为它是被控制的话,从一开始就被控制了,即使在Netscape的年代。作为一个开放标准,这种控制并未对用户形成什么危险。 其实1.0背后也是一家公司,知名的O'Reilly。 从既有资源而言,0.9x系列占有压倒优势,我想2.0会作为当然的既得利益者,继续占有统治位置。

但是对于一个开发者来说,可能这种争论更容易被调和,因为你可以同时支持他们,甚至包括以前所有的标准。 这涉及两个方面: 1. source: 你可以生成两个版本,分别符合1.0和2.0规范。 或者你可以生成一个XML源,然后使用XSL/XSLT转换成1.0/2.0格式。 2. aggregator: 对不同的格式分别使用不同的解析。

当然,我希望最终还是能够互相妥协,只保留一个标准。不过这也许很难,因为这在计算机领域是最不常见的一件事。不管是公司之间,还是业余开发之间,都不容易达到一致。”

Isaac: goghs的留言很好,算是对这场标准的争论的一个补充吧。大家可能会奇怪,这种争论会不会对Blog的发展产生不利的影响。照我说,不一定,很可能是促进作用更多一些。不像最近国内的某些争吵,吵来吵去其实伤害了发展和进步。另外,从技术开发上来说,我 也非常支持0.92系列的简易性,把新浪新闻变成RSS 0.92并导入NewzCrawler 就是一个10分钟的工作,而RDF相对麻烦一点,当然也不过是处理一些额外的命名空间而已。但是从整体来说,Sementic Web(语义网)也需要大家的通力支持才能够有更好的未来,而作为承载语义网的一个重要部分,RDF应当被有责任感的人们所推动。不过我还是要承认RDF应用到RSS中还为时过早。


RSS 系列介绍(二)


--------------------------------------------------------------------------------
RSS与新闻聚合前面介绍了RSS的一些历史渊源,今天我再与大家聊聊RSS在新闻聚合,而下一次我还会介绍RSS在网站联合中的应用。

其实,RSS就是一段规范的XML数据,用一些大家约定的标记描述一个Blog或者一个新闻源的最近更新的内容。RSS是Blog走向社区化和快速普及的一个技术推动力,Blog也因此技术而走向了专业化领域。连同本来网络上的各种专业媒体提供的新闻源, 人们可以透过RSS在桌面上轻松访问大量与自己的兴趣相关的主题,而忽略掉访问网站带来的复杂过程,还有那些讨厌的花花绿绿的广告。新闻聚合(News Aggregation)和网站联合(Syndication)两个概念由此出现并广泛被Blogger们所采用。我们今天先谈谈新闻聚合。


所谓新闻聚合,就是通过软件工具或编程的方法从多个新闻源或Blog站点搜集新闻并在一个界面中提供给读者进行阅读。新闻聚合的基础条件就是这些新闻源都提供通用的数据格式,目前最流行的格式也就是RSS。也不知道是有了RSS,才有了新闻聚合的概念,还 是有了新闻聚合的想法,才出现了RSS的技术,总之技术最终应当是为人们的需要服务。目前网络上有一些流行的新闻聚合工具,他们都支持多种目前处于版本的RSS格式。我们在这里介绍几种比较流行的工具:


Aggie 是一个很小的新闻聚集工具,连同源代码下载也不过84K。唯一的限制是它建立在Microsoft .Net 框架上,所以运行起来还要这个平台的支持(.Net 框架的基本运行版本也要20M左右)。Aggie把用户登记的各种Blog或专业媒体新闻网站的信息都搜集在一起,并直接输出为一个本地网页,自动启动IE提供给用户进行浏览。

NetNewsWire 则是一个运行于Apple公司电脑上的新闻搜集和阅读工具。它提供的三个板块的版面格式与电子邮件应用非常类似,它可以直接在应用程序的界面中浏览新闻。

Straw 也是一个高效率的桌面新闻聚合工具,不过运行在GNOME环境中,在Linux和支持GNOME的UNIX环境中都能够运行。


CNBlog 心得集近期曾经推荐过NewzCrawler这个新出现的新闻聚合工具,这是我在PC桌面上看到的最好的新闻聚合工具了。无论从功能还是易用性方面来看,这个工具都比前面介绍的几个工具要更优秀。唯一的问题是,正式版本的NewzCrawler不是免费的 。现在我能够利用这个工具每天轻松地察看来自一些新闻站点(例如新浪和CNET等)的最新消息和一批我关心的Blog的更新内容,还能够便捷地用工具中内嵌的Blog输入工具把感兴趣的内容摘录到自己的Blog中,效率大增,真是令人产生了全球信息尽在指 尖的感受。当我们深入去想的时候,会发现这大概正是网络走向个性化和对传统媒体的一种挑战所在吧。

在新闻聚合的观念下,我相信Blog会与RSS共同发展,越来越成为人们最喜爱的信息来源。 (DVOL本文转自:中国DV传媒 http://www.dvol.cn)

欢迎关注微信公众账号:手机烟台(mYantai)

 

  上一篇:研究称上网者0.05秒断定网站优劣
  下一篇:算计搜索引擎 神秘公司“制造”排名发财
      更多...
::打印本页 ::      ::关闭窗口::


版权所有© 数码在线网站 DV OnLine©  鲁ICP备12016322号-1