语义网元素回顾

日期: 2010-12-15 作者:Bill Brogden翻译:刘志超 来源:TechTarget中国 英文

语义网的构想是希望通过最根本的语义内容,增加你在互联网上寻找相关信息的机会。作为几代人工智能研究人员的发现,人类大脑比电脑程序更好的将语义意图表达到文本上。创建语义网并不是一件容易的事情。但是,除了HTML和Web服务以外,语义网是W3C最关注的问题。

  回想起在万维网之初,如何能表达正确的语义学,但是,第一次使用“语义网”术语出现在1994年的首次WWW会议上。在Web元数据标准上做了很多的尝试,最终希望计算机能执行语义学敏感位置的数据。正式的语义网开始于2001年,引用于最初的介绍。   语义网有两件事情,是集成的通用格式和组合不同来源的数据,在原始的web上,主要集中在文档的交换。

也有……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

语义网的构想是希望通过最根本的语义内容,增加你在互联网上寻找相关信息的机会。作为几代人工智能研究人员的发现,人类大脑比电脑程序更好的将语义意图表达到文本上。创建语义网并不是一件容易的事情。但是,除了HTML和Web服务以外,语义网是W3C最关注的问题。

  回想起在万维网之初,如何能表达正确的语义学,但是,第一次使用“语义网”术语出现在1994年的首次WWW会议上。在Web元数据标准上做了很多的尝试,最终希望计算机能执行语义学敏感位置的数据。正式的语义网开始于2001年,引用于最初的介绍。

  语义网有两件事情,是集成的通用格式和组合不同来源的数据,在原始的web上,主要集中在文档的交换。也有关于语言的记录,如果将数据于现实世界的对象联系起来。这允许一个人、或者一台机器、以一个数据作为开始,然后移向一套无休止的数据库,虽然连接不是线性的,但是都做同样的事情。

  有许多不断进化的技术,促进了语义网的发展,所以W3C没有为他们设置单一的标准。这些平行的技术高速发展并广泛使用,然而其他人还在实验,只得到一些微不足道的启示。

  XML和统一字符编码标准

  XML的语法连同附加UNICODE标准的XML模板一起使用,几乎代表了所有的书面语言,为未来的发展打下坚实的基础。我们幸运的是,XML几乎已经得到了普遍的接受,因为其他语义网技术就没有那么幸运了。

  RDF(资源描述框架)

  作为一个常用的系统,W3C已经发布了一套RDF的相关标准,但是,开发者采取了各种各样的想法,如许多其他版本的RSS,使行业变得混乱。这些混乱可以看出,RSS在如此多的不同解释中真的就是标准吗?

  Web本体语言

  OWL是W3C的提议,旨在提高机器内容解释的可能性。2004年规范的缺陷引起了OWL2规范(2009)。OWL与RDF和所需的XML模板密切相关。如果你仍然停留在思考如本体论的抽象概念,请别担心。如果语义网要去实现的话,OWL最重要的一点是,需要一个具有共享意义的通用词汇。

  SPARQL是一个查询语言,用来使用RDF的数据。目前该项目正在征求对2008版本改进的建议。

  一个更好的开发本体论的例子

  很久以前,生物学家认为,他们在描述自然界时,有一个严重的语义问题 - 即,在世界各地,相同的植物或者动物可能有许多不同的名字。解决的办法是,由分类系统为所有生物提供一个统一的命名系统。此外,在描述生物之间关系的含义时,要有广泛的一致意见。因此,生物学已经伴随恰当的语义学在Web上定位数据。生物分类学是本体论的一个子集,它能处理分类的事情。因此,本体论占据了语义网的概念的重要位置。

  语义网目标的障碍

  我把障碍分为三个级别:偶然的、通过设计的和故意的。

  在“偶然”级别中,我们错误的使用词汇的用法。它使我发狂 - 我见过关于"rein"和"reign"之间的正确使用的混淆,甚至是在高流量的新闻报道中。 我怀疑这个问题部分原因是由拼写错误造成的 - "听起来像是我想要的单词,所以它一定是正确的!"正常运转的语义网要求一致的词汇。

  “通过设计”的障碍是,趋势朝向丰富的互联网应用(RIA)发展,它是通过各种技术,组装多个内容资源建立的。当如Flash、Silverlight和视频流等“插件”具有真实的内容时,RIA的主要部分可能不在是HTML了。实际提出的内容可以是任何东西,因为它是根据用户的输入组合起来的,所以,你怎么可能看到放在索引器中有关语义网的标签呢?

  语义网的“故意”障碍,我的意思是如,“优化搜索引擎”、建立假冒网站、发起恶意软件链接和盗窃身份犯罪等活动。每个自然灾害,扩散的网站打算用公众的爱好从有效的网站劫持网站的搜索,传播到恶意软件。因此,我们发现“信任”是语义网概述表的顶层。最早的Web学术版本假设对方所说的人和地点是正确的,所以,建立“信任”不是最初的设计要求。

  我认为语义网的概念正在改善网络经验,但是,仅仅在某些特定的领域,如在学术领域或行业。互联网持续的发明说明没有停止的迹象,大多数开发者并不是十分重视语义网的目标。

相关推荐

  • BEST:SOAP/XML和REST的替代方案

    虽然拥有大量的机架服务器,以及大量软件开发人员的组织,基于web和集成服务的SOAP和REST很适合他们,但也会出现问题。

  • Spring 烂!差!

    有些人可能对Spring的第一印象不太好,它真的很烂,很差吗,也许这只是你的一种偏见,它也有是自己的优点的。

  • 基于SOA架构的业务安全性研究

    SOA在提供价值链上企业之间信息共享和业务流程自动化的同时,也给业务信息安全带来了负面影响,且存在安全隐患,这些你知道吗?

  • Java读取配置文件的几种方法

    在现实工作中,我们常常需要保存一些系统配置信息,大家一般都会选择配置文件来完成,那么在Java怎样读取配置文件呢?