以文本方式查看主题 - 中文XML论坛 - 专业的XML技术讨论区 (http://bbs.xml.org.cn/index.asp) -- 『 Semantic Web(语义Web)/描述逻辑/本体 』 (http://bbs.xml.org.cn/list.asp?boardid=2) ---- 贴上一段我中期报告的绪论,关于语义Web=KR+Web (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=30454) |
-- 作者:river_hh -- 发布时间:4/12/2006 8:40:00 PM -- 贴上一段我中期报告的绪论,关于语义Web=KR+Web \section{引言} 如果简单地将信息系统看成由数据和处理数据的程序两个部分组成,那么信息系统的发展史可以看成是数据与程序在不同的层次上不断分离的过程。早在纸带机时代,数据和程序是紧密结合为一体的。硬盘等存储设备和文件系统的出现,使得数据与程序在物理上分离,即数据可以文件的形式存放在外存设备中,但数据的存储结构是硬编写在程序中。数据库技术的出现,将数据的存储结构从程序中脱离出来。数据库技术允许应用程序在数据的逻辑结构之上操作,而无需了解数据的物理存储方式。数据库中关系模型以及SQL查询的标准化使数据库技术迅速发展成为构建信息系统的核心,并形成了一个巨大的产业。但数据库技术的还存在如下的缺陷:数据的描述比较粗糙,大量的数据语义或领域知识没有明确表达;数据的语义是被硬编码在处理数据的程序代码中等等。基于知识的系统(Knowledge-based System)将数据的语义从程序中分离出来,通过逻辑的方法明确地描述数据的内涵语义,建立了数据描述与世界模型之间的语义关系,并将对数据的一些处理抽象和规约为基于知识的推理。 WWW是人类有史以来构建的最大的信息库,其中URI和HTTP创建一个全球范围内可访问的信息空间,在这个空间中,每个对象都有全球唯一的名字。与数据库技术相比,Web技术放弃全局一致性的约束,在保持局部信息一致性的基础上促使信息空间向全球性发展,消除了信息的获取、传送、存储和处理之间的孤岛现象,成为了众多信息系统的基础。万维网是人类有史以来构建的最大的信息库,它涉及几乎所有可想象的领域,包含这些领域中的文本和多媒体数据,且所有的数据都能通过互联网(Internet)进行访问。Web中信息的急剧增加导致了信息过载——Web中的信息找寻犹如在一个巨大的可滚动屏幕上查看内容非常详细的、并以非常小的字体展示的信息。尽管搜索引擎(例如google、百度、yahoo)在一定程度上能缓解该问题,但其基于关键字的搜索方式具有如下缺陷: 产生信息过载的主要原因是网页上文本、图形、图像等都是供人们阅读的,而Internet和计算机只是作为一种简单的中介工具。尽管网页中含有一些链接和特殊的信息使得计算机能定位相应的页面并以特定的方式显示文档,但网页中没有提供任何信息帮助机器理解网页的内容。语义Web的提出就是为了解决该问题。 %========================================================================================================= 语义Web(Semantic 传统的Web资源中的语义信息或领域知识以机器难以处理的自由文本的方式存在,资源间的语义关系是以一种隐含的方式存在,这些语义信息由于缺乏明确的描述而丢失。如果能明确表达Web资源语义,并把资源之间的关系冠以某种特殊的含义,在这种情况下,信息以语义良定义形式存在,则将大大提高资源的共享能力。这也就是语义Web的研究动机。知识表示技术是描述、建立和针对资源语义关系进行推理的有效途径,它在语义Web中有着重要的地位。从某种意义上,语义Web可以视为KR+Web。 %========================================================================================================= 知识表示(Knowledge Representation,KR)是人工智能的一个重要分枝,它吸取来自逻辑(Logic),本体(Ontology)和计算(Computation)领域的理论和技术,而成为一门多领域交叉的学科\cite{sowa00knowledge-representation}。其中逻辑为KR提供了形式化结构和推理规则,没有逻辑,知识表示将会是模糊的,将无法提供准则判断冗余的、冲突的声明(Statement);本体定义了与应用领域相关的事物的类型,没有本体,知识表示中所使用的术语和符合将会是非良定义的(ill-defined)、不清晰的(confused)、令人困惑的(confusing);计算则支持具体的应用并将KR与纯粹的哲学区分开,没有计算模型,逻辑和本体都无法在计算机程序中实现。因此,知识表示就是应用逻辑和本体的方法和技术,为具体的应用领域构造可计算的模型。知识表示的5个基本原则以及在人工智能中的5种角色\cite{davis93what-is-kr}: %========================================================================================================= 语义Web基本出发点是:将机器可读的信息加入Web页面,采用本体(ontology)技术精确定义Web资源中所共享的词汇,利用知识表示技术实现Web资源的自动推理,并应用Agent技术来协同处理Web中的信息。 首先,本体是实现知识共享的重要途径。本体的目标就是结构化领域知识,建立领域相关的统一的术语,给出这些术语之间相互关系的明确定义,促进知识的共享和重用。本体表示强调信息共享性,也就是说本体所表达的信息要为他人所充分接收。它所要表达的一般是共享知识,是一种约定和标准,而不是个人观点。本体的关键特征是:概念的层次性、特殊一般关系、部分整体关系。 其次,KR是实现Web资源推理的重要途径。推理即从已有的表达式中得到新的表达式,从规范表达的数据中获得间接数据,这对许多系统(例如数据检索)都是需要的,Web也不例外。 而且,KR的方法比传统的数据模型更加接近于人对客观世界的认知模型,由于人们对世界的认知模型在某种程度上体现出趋同性,所以基于知识的方法建立的资源描述比传统的方法(例如HTML、数据库等)建立的资源描述更易于集成和共享。 总之,KR能提供明确的、规范化的方法描述信息资源的语义,提高Web资源的可共享度,支持Web资源的自动发现、数据的直接交换和服务的无缝集成;缩短人的认知域与计算机的处理域之间的距离,支持人们用直观的语义对信息资源在概念层次进行操作。具体体现在: 但语义网不能取代现有的互联网。主要原因是本体的描述能力有限,现在的互联网的内容大部分不能用本体来描述。但是通过应用AI技术(特别是知识表示方法)就算我们只能解决1%的问题,由于Web的普遍使用,也会给社会带来巨大的效益。 抱歉,没有列出参考文献 |
-- 作者:npubird -- 发布时间:4/13/2006 12:11:00 AM -- 基本都是综述的话。 说说你的创新和Idea吧。 |
-- 作者:baojie -- 发布时间:4/13/2006 1:06:00 AM -- 写的还挺清楚. 下面一段话不太妥当. '但语义网不能取代现有的互联网。主要原因是本体的描述能力有限,现在的互联网的内容大部分不能用本体来描述。但是通过应用AI技术(特别是知识表示方法)就算我们只能解决1%的问题,由于Web的普遍使用,也会给社会带来巨大的效益。" 第一, 比较对象应是万维网, 不是互联网. 第二, 这个1%的说法很难被人接受, 最好换一个措辞. |
-- 作者:river_hh -- 发布时间:4/13/2006 2:19:00 PM -- 抱歉,说错了,上面是课程报告的绪论,不是中期报告。 我的一个Idea是关于dl和动作结合的混和逻辑系统。 Web服务作为一种自治、开放、平台无关的网络化构件广泛存在于当前的Web中。 描述逻辑是一类基于逻辑的知识表示语言,它在语义Web中起着重要的作用。许多基于DL的本体描述语言(例如DAML+OIL和OWL)都被用于描述Web服务的上位本体,例如DAML-S和OWL-S。 仅DL本身是不足以支持基于服务的过程推理。 我的一个工作就是如何结合DL和动作理论,结合语义环境的服务过程方面的建模和推理。 1 从Web服务以改变世界状态的方式影响外部世界的角度来看, 2 在描述服务时,我们通常都假定一个世界模型(World Model)的存在, 3 在一些采用AI技术进行服务组合的研究中,有的采用一阶谓词逻辑(First Order Logic,FOL)描述世界模 型,有的中采用ER模型描绘世界模型。 4 TBox描述了世界模型的结构,当前所获得的信息或事实则存放在ABox中。 5 动作和基于DL的世界模型之间的交互主要体现在: 2 能促进服务之间的互操作性。描述逻辑是多个Web本体描述语言的逻辑基础。 |
-- 作者:baojie -- 发布时间:4/13/2006 3:06:00 PM -- "DL最初是为静态知识的表示而设计" 这句话不妥. 建议看看时态描述逻辑, 和动态描述逻辑. (手册有介绍). 另外, 描述逻辑ALC_reg 等价于模态逻辑PDL, 而PDL正是为过程建模而设计的. |
-- 作者:baojie -- 发布时间:4/13/2006 3:11:00 PM -- "DL最初是为静态知识的表示而设计" 这句话不妥. 建议看看时态描述逻辑, 和动态描述逻辑. (手册有介绍). 另外, 描述逻辑ALC_reg 等价于模态逻辑PDL, 而PDL正是为过程建模而设计的. |
-- 作者:river_hh -- 发布时间:4/13/2006 3:36:00 PM -- 不太同意baojie的观点。我觉得时态dl和动态dl超出了dl,不具有dl本身的特点,善于表达hierarchy同时又 可判定(大多数dl系统)。 时态描述逻辑是对DL进行时态算子(until,since,now等)的扩展,我觉得时态描述逻辑是一种混和系统(hybrid formalism),用于定义一些本身具有时间特点的概念,例如Mortal。但是,我个人觉得时态描述逻辑很难应用起来。 动态dl也一样,是DL+PDL,它将动作视为模态算子,即动作导致状态的改变。但在那篇文章中,概念和动作的定义交织在一起,动作可以参与概念的定义,概念也参与了动作的定义。我认为这模糊了动作和世界模型的不同角色。个人认为这文章不是很persuasive。 还有一些不主流的文章,将一些关系(特别是可传递的关系)视为动作。 其他的还有dl与rule的结合(例如AL-log,CARIN等),国外大多数文章都称它们为混和逻辑系统。 当然dl与PDL和模态逻辑是能建立关系的。因为dl是只允许两个变量的FOL,模态逻辑和命题动态逻辑也有类似的特点。 |
-- 作者:baojie -- 发布时间:4/14/2006 1:15:00 AM -- 认真领会中 那OWL-S算不算描述动作的OWL本体呢? |
-- 作者:wason21cn -- 发布时间:4/14/2006 2:13:00 AM -- 楼主的这个idea很有创新,不过能不能具体说说怎样结合DL和动作理论。 还有关于modal logic 和Description Logic, 现在做他们关系的论文好像还不是很多,毕竟DL是最近这些年才开始搞,但是对于Modal logic已经有很成熟的一些算法, 总的来说DL的一些语言是Modal logic一些语言的不同句法的变体, 所以以后还会有很多关于DL的工作都会通过modal logic 来完成. 而且通过他们相互结合的应用也会越来越多。
|
-- 作者:icebuddy -- 发布时间:4/14/2006 10:43:00 AM -- 认真学习中 |
-- 作者:river_hh -- 发布时间:4/14/2006 3:22:00 PM -- OWL-S是用OWL描述的关于服务的本体。 从本体的角度看OWL-S的功能有两个: 一是规范了服务描述的结构,所以OWL-S也称为上位本体。一个服务一般有三个对象属性:表示(presents)、被描述(describedBy)和支持(supports),这三个对象属性的值域是:服务简档(ServicePro¯le)、 服务模型(ServiceModel)和服务基点(ServiceGrounding)。服务简档描述服务做什么,服务模型描述服务怎么做,而服务基点描述怎么访问服务。同时还给出了属性的约束:一个服务(Service)最多和一个服务模 型(ServiceModel)相关联,一个服务基点(ServiceGrounding)必须和一个服务(Service) 相关联。一个服务可以提供多个服务简档或者服务基点。 另一个功能是提供了描述服务的词汇,也就是说但你想发布一个Web服务时,可以采用这些词汇来标记。如果大家都采用这些词汇的话,这就能体现互操作性。 |
-- 作者:wolfel -- 发布时间:4/18/2006 12:19:00 AM -- DL结合动作的工作我没有看到,不过rule layer里面结合动作的,楼主可以参考MIT Sloan的Benjiamin Grosof的Situated Couteous Logic Program,他主要是做semantic web service的。 |
-- 作者:iamwym -- 发布时间:4/18/2006 5:38:00 AM -- 今天才有时间稍微看了下楼主的文章。 首先KR+web并不是新颖的观点,这是一个常识,至少在欧洲sw是个常识。记得好几年前的文章就有这样的内容,semantic web aims to bring together the strength of knowledge community and web community...而且没有引用,所以楼上有人说这个提法新颖,我不同意。 楼主作为课程的报告应该是没有问题了。 |
-- 作者:iamwym -- 发布时间:4/18/2006 5:50:00 AM --
这两个功能恐怕都不是从本体的角度看得出来的吧…… 两个所谓的功能任何web service的标准基本都有基本,你换wsdl也是一样解释得通的。这等于什么都没说,也不是owl-s的特点
|
-- 作者:river_hh -- 发布时间:4/18/2006 10:09:00 AM -- 谢谢12楼的iamwym。 的确,那只是课程报告中绪论关于什么是semantic web的一段。早在Tim Burners-Lee2001年的the semantic web中就已经提到semantic web就是要重用AI中的知识表示技术将Logic加入Web中,发挥Web的潜能。 那一段只是用自己的话把各种资料翻译组合了一下。没有给引用的原因可能是这个观点太Common了。 |
-- 作者:river_hh -- 发布时间:4/18/2006 10:11:00 AM -- 哦,错了,不是12楼,是13楼的iamwym,呵呵 |
-- 作者:river_hh -- 发布时间:4/18/2006 11:24:00 AM -- re 14楼的iamwym OWL-S将本体引入Web服务的主要目的是基于本体推理期望实现服务的自动发现、组合、互操作等目标。WSDL只是句法(syntax)级别的描述和互操作,OWL-S可以实现语义级别的。 |
-- 作者:admin -- 发布时间:4/19/2006 12:11:00 AM -- 同意14楼版主的意见 1)规范了服务描述的结构 OWL-S与WSDL不同之处在于OWL-S是一个本体,也就是说OWL-S里所选用的constructs来自OWL,不是乱用的。选用OWL里的constructs,确保了OWL-S可以利用OWL的推理能力。 另外就翻译与楼主交流一下:
|
-- 作者:river_hh -- 发布时间:4/19/2006 11:01:00 AM -- shy,我在11楼的话的确不太正确。谢谢两位的批评。 这样说可能更恰当一些。 要描述OWL-S的作用是需要与WSDL进行比较。 WSDL用XML Schema描述抽象类型,而OWL-S用OWL类描述抽 象类型。WSDL/XSD表达不了OWL-S的语义,而OWL-S表达不了WSDL的绑定信息。 OWL-S和WSDL是互补的。OWL-S没有定义准确描述消息的抽象结构,工业界广泛采用的消息 描述的标准格式是WSDL,因此OWL-S也是借此作为服务绑定机制。 至于服务简档和服务基点,计算所韩老师是这么提的。 |
W 3 C h i n a ( since 2003 ) 旗 下 站 点 苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》 |
445.313ms |