基于OWL的机械制造业基础工业工程本体研究

VIP免费
3.0 陈辉 2024-11-19 5 4 3.26MB 72 页 15积分
侵权投诉
第一章 绪 论
1
第一章 绪
§1.1 课题的来源及意义
随着网络的日益普及与计算机技术的迅猛发展,速度、知识和网络使得企
的竞争模式与竞争规则不断更新,从而在全球范围内造就了一个利用信息技术,
将速度和知识结合起来创造新价值的新经济时代,这就是继农业经济、工业经济
之后的知识经济时代。知识经济时代的到来,使得企业将重心从物质资本转向知
识价值,换句话说,“知识”的价值比“资源”的价值更高。因此,企业的发展基
础、核心竞争力和发展战略势必都与“知识”挂钩且密不可分。企业在提高产品
利润的同时,也必须将“知识”作为其重要组成部分,重视知识资本,接受知识
带来的机遇和挑战,并通过对知识的搜集、加工、共享与创新,从而获得知识所
带来的价值。
管理大师彼得·德鲁克曾说过:“知识生产力已成为竞争和经济发展的关键,
这是不可逆转的发展趋势。”开启了现代管理之门的美国“泰罗制”使得“科学管
理”取代了“经验管理”,勘称企业管理的第一次革命,而为了适应知识经济时代
而出现的“知识管理”则是企业管理的第二次革命[1]对企业而言,面对因特网和
外界的海量信息,如何有效的组织、管理和维护知识并进一步为员工或用户提供
高效率的服务,已经成为现代企业提高竞争力的重点和难点,其中知识的获取、
收集、共享和重用又是其中的重中之重。
目前,信息获取方式的主要手段是通过网络搜索引擎,如我们常用的百度
Google等。24CNNIC(中国互联网络信息中心)调查结果显示:截止至2009
6月,搜索引擎的使用率达69.4%,比2008年末增加1.4个百分点(见表1-1[2]
可见搜索引擎是网民获取所需信息的基础应用和重要入口。
1-1 2008.122009.06搜索引擎用户的增长情况[2]
2008年底
2009年中
半年变化
使用率
网民规模(万人)
使用率
网民规模(万人)
增长量(万人)
增长率
68.0%
20300
69.4%
23457
3157
15.6%
除此之外,还有其他2种信息获取方式,但都各有其优缺点(见表1-2因此,
从企业的角度来说,想要得到准确的、符合企业内部需求的知识,使用上述传统
的信息检索方式是不可取的。于是,本体技术脱颖而出,它赋予信息和知识以语
义含义,具有良好的概念层次结构和逻辑推理功能。
基于 OWL 的机械制造业基础工业工程本体研究
2
1-2 各信息获取方式的优缺点
知识和信息获
取的主要方式
优点
共同缺点
网络搜索引擎
功能强大;
易用性强;
数据库大;
搜索速度快,可以
在短时间内获取大
量的信息等。
这些技术主要依赖于
编码技术,通过分类
模式来描述给定的信
息;通过基于字符串
匹配的全文检索技
术,来搜索用户提交
的关键词。其共同缺
点:没有从语义层次
上对信息进行标引,
不能够满足用户在语
义和知识上的需求。
Yahoo、Sina 等
站点
采用目录分类的方
式;
查询的专指度较高
等。
Dialog 之类
商业数据库
信息质量很高
检索到的信息较全
面等。
本体是领域知识规范的抽象和描述,可以构造丰富的概念间的语义关系,
够准确描述概念含义以及概念之间的内在关联;同时具有一定的推理和学习能力,
能通过逻辑推理获取概念之间的隐含关系。其最大贡献在于它可以将某个或多个
特定领域的概念和术语规范化,为其在该领域或领域之间的实际应用提供便利。
因此,将本体引入到企业知识库的模型构建中来,可以实现一定程度的语义匹配,
有效提高检索效率。
本文将本体论方法应用到机械制造业基础工业工程相关领域,构建该领域
本体,从而实现领域知识的共享、集成和重用,能够使企业相关人员清楚地了解
到该特定领域的相关元素、关系和概念,让知识表达更加准确便捷,辅助他们进
行更好的、更快速的决策。
§1.2 研究背景
§1.2.1 本体的研究现状
本体最初属于哲学领域的一个概念,指的是“哲学中研究世界的本原或本性
的问题的部分”。之后,被应用到计算机、人工智能、知识工程等领域,其用途是
为了表达人们对于问题领域知识的共同理解,并以显示的方式描述问题中概念及
其之间的关系。自20世纪90年代初以来,本体技术受到了众多科研人员和开发人
员的关注,从概念理论到逻辑基础,从实现语言、开发工具到方法论,都已初步
形成了本体的理论框架和技术体系,并在应用研究方面得到了迅速的发展。如今,
本体的构建被看作是一种改进知识工程过程、实现知识共享和复用、异构系统间
互操作的重要手段。
1、国外研究现状
“本体”一词一被提出,就对计算机及相关领域产生了不小的冲击,并引发
第一章 绪 论
3
了国外的科研人员与开发人员的研究热情。这些年来,国外的本体研究不仅活跃
而且涉及的应用领域较为广泛,有信息检索、软件工程、软件复用、知识工程、
数字图书馆、和语义Web等。发展至今,无论是理论研究还是应用研究可谓是硕果
累累。
在本体理论研究中,尤其对概念及其分类的研究中,最具代表性的人物是
Guarino (意大利帕多瓦大学LADSEB-CNR<Institute for Systems Theory and
Biomedical Engineering>的高级研究员Guarino等人分析总结了概念及其特性、
分类以及概念间的关系,并提出了用于指导概念分类的一种可行理论。
Guarino的理论归纳如下:概念分类理论的基础是概念的元特性。以概念的元
特性为出发点,按照一定的规则,把具有相同元特性组合的概念归为一类,进而
给出一般意义上的概念分类体系。概念的基本元特性包括:持久特性、非持久特
性、反持久特性、半持久特性、载体标识特性、支持标识特性、外部依赖特性等[3]
后来,在此基础上Guarino提出了本体驱动的通用建模模式和“本体层”的概念
[4]研究了表示本体的本体约定[5]并探索了本体在物理对象、STEP语义方面的应
[6],其成果具有非常高的参考价值。
在应用研究方面,成果体现在一些较为知名且被广泛应用的“本体”系统:
Cyc(常识知识库)是一种面向基于知识库、综合日常生活常识、建立综
合本体及数据库的人工智能系统,由斯坦福大学知识系统实验室负责开发。该系
统于1984年启动,目的是通过本体开发为常识推理提供基础。Cyc拥有庞大的知识
库,包含6000多个概念及60000个相关实例。Cyc中的知识采用一种增量式的一
阶谓词逻辑微积分First-Order Predicate Calculus, FOPC ) 的 CycL Cyc
representation language表示语言表达。Cyc知识库中包含简单的声明、推理规则、
推理控制规则,在知识库的基础上,可以使用推理机产生新的推断。它最重要的
关系是isa
(说明一个概念是某一集合的一个实例<某一集合的一个元素在本体中称
为实例>)和genls(说明的是某一集合是另外一集合的子集)Cyc本体按照模块
Module组织,称为微理论Microtheory每个微理论包括某一特定领域知识
和推理所需的概念,如空间、时间、因果、智能体等。某一领域本体可能包括多
个微理论,以反映该领域建模的不同侧面和前提。在这个意义上,Cyc不是一体的
集成本体,而是一个微理论的网络,该网络的并集为若干领域提供本体约定[7]
WordNet(叙词网)是一种基于心理语言规则的网络叙词表检索系统,由
美国普林斯顿大学认知科学实验室(Cognitive Science Laboratory)的George A.
Miller教授从20世纪90年代初期开始负责开发。该系统主要是对英语词汇及词汇间
的关联关系进行描述:列出每个英语词汇的不同含义,针对不同的含义列出相应
基于 OWL 的机械制造业基础工业工程本体研究
4
的同义词集;此外,还列出了该词汇的关联关系:上类词、上系词、下位词、反
义词等。WordNet被看作是研究者在计算语义学、进行文本分析时的可获取的最为
重要的资源[8]
FrameNet框架网)是一种基于语言库的计算机词典系统,由美国国家科
学基金National Science Foundation,NSF赞助、加州大学伯克力分校的国际计算
机科学研究所International Computer Science Institute, ICSI开发。该系统采用框
架语义Frame Semantics描述架构:基于对从大规模文本词语中抽取出来的例句
进行手工标注的语义注释,以及由词汇专家和语言学家示例的对上述语义模式的
系统分析,具有强有力的语义分析能力。FrameNet的特征体现在:句子中的单词
与语义框架的关联;单词通过语义框架与其他词汇的关联;不同的语义框架之间
的关联[9]
OntoSeek是一种基于在线黄页和产品目录的内容检索系统,它的第一个原
型系统由IBM苹果电脑公司的意大利分公司与意大利国家科研委员会系统科学和
生物工程研究所合作开发。该系统把本体用作有语义信息的领域词汇表,将一个
本体驱动的内容匹配机制与一个的具有中等表达能力的表示形式化系统相结合,
试图将本体论和大辞典数据库相互集成,以便提供一个可以使用领域内任意词汇
进行交互式语义查询的系统[10]
GUMGeneralized Upper Model通用上层模型)SESUS(感觉本体)
Mikrokosmos都是面向自然语言处理的体系。GUM是一种独立于专业领域的语言本
体,由南加州大学信息科学研究所Information Sciences Institute, ISIBill Mann
Christian Matthiessen等人开发。它支持多语种处理,包含基本的概念及独立于各
种具体语言的概念组织方式,其表示语言为LoomSENSUS为机器翻译提供概念
结构,包括7万多个概念,是一个结构性很强的语言本体,但缺乏有深度的学科知
识;
Mikrokosmos也支持多语种处理,由新墨西哥州立大学的计算研究实验室开发,
概念揭示程度深入、覆盖学科范围广泛,并采用一种不依赖于语种的、语言中立
的中间语言文本含义表示法”TMRText Meaning Representation来表示知识[3]
2、国内研究现状
国内对于本体的研究,无论是在理论应用的研究,还是在技术手段的实现
面,都较国外的研究相对滞后且存在不小的差距。起初国内的本体研究工作只是
着重于翻译国外的论文来向国内介绍和传播本体理念和发展状况,经过十多年的
发展,国内近几年来对于本体的应用研究也日趋见多,也出现了一些有一定影响
力的本体研究成果。国内研究本体的主要三支科研队伍有:中国科学院,哈尔滨
工业大学计算机系和浙江大学人工智能研究所。代表人物有:陆汝钤院士、金芝
第一章 绪 论
5
博士,王念滨博士和高济教授。
国内最早进行本体研究的是浙江大学人工智能研究所的高济教授。1985年,
他参与开发了地质探矿专家系统GPEGeologic Proving Expert,提出了一种用于
人工智能专家系统的知识表达方式——基于规则的联想网络ANBRAssociate
Network Based on RulesANBR将智能系统获取的知识表达分为:外部形式——
基于规则的知识结构,用于知识的获取和知识库管理;内部形式——分块联想网
络,用于驱动推理控制。1987年,他提出了过程控制的动态层次分布概念,为分
布式问题求解(Distributed Problem Solving, DPS)领域开发动态和层次处理方法。
1994年开始,高济教授致力于基于表示本体论(Representation ontologies)的智能
系统开发工作,研究基于本体的智能系统开发方法OMSIOMSI方法包含3个层次:
知识建模(Modeling、知识共享(Sharing)和综合集成(Integrating1996年,
高济教授采用OMSI方法成功开发了一个中等规模的知识库系统——输电网规划
专家系统TRANSPES以及若干试验性系统。2003,钟凌燕与高济教授提出一
种基于UML的本体论建模方法并开发出了基于Agent技术的虚拟组织集成框架
IFVOIntegrated Framework for Virtual Organization为虚拟企业各成员在通信过
程中产生语义冲突的问题提供解决方案[11]
此外,国内比较有影响的本体研究还有[12]
①常识知识的实用性研究——常识本体的研究(中科院数学所陆汝钤,2000
常识知识的实用性研究的主要目的是建立一个大规模的常识知识库Pangu
探讨利用常识知识来解决一些实际问题(如:机器翻译和自然语言理解等)Pangu
知识库采用Agent和本体来表达知识,其中Agent强调包装和继承,重视事物之间的
纵向联系,而本体主要进行常识知识的横向联想,因此本体论方法是面向Agent
法的一个很好的补充。在Pangu中,一个本体描述分成3部分:静态本体元的集合
Static Extension动态本体元的集合Dynamic Extension本体网Ontonet
后者也是一个语义网络,由从属于该本体的所有Agent构成。每个本体表述
ontology)从属于某个AgentBelief部分,本体网的全体形成了该知识库的本体
结构。
②基于本体的软件需求获取方法(中科院数学研究所金芝,2001
在大型信息系统的开发过程中,如何快速地获取和准确地表达用户需求,
个问题引起了软件工程界的重视,从而引发了许多需求获取方法的研究。金芝博
士提出的基于本体的需求获取方法,是以企业本体和领域本体作为需求获取的元
模型,以此指导和规范整个需求获取过程,并通过对领域模型的重用,完成目标
系统的模型构造。其主要思想是:1)通用企业本体作为企业描述层的元模型,
基于 OWL 的机械制造业基础工业工程本体研究
6
规范企业描述并使之系统化,保证企业描述的完整性和一致性;2)领域本体作
为领域元模型,定义企业描述在特定领域的约束,同时提供领域可重用概念及其
关联;3)领域软件需求模型作为领域分析的结果,支持目标系统需求模型的构
造。金芝博士认为应用软件的需求获取过程将分为三个阶段:1)在企业本体指
导下获取用户的应用描述;2)以领域本体为牵引,扩展应用描述,直到满足系
统的完整性约束;3)通过重用领域软件需求模型,构造目标系统的需求模型。
③大规模知识系统的研究——学科本体的研究(中科院计算技术研究所曹存
根,2003
NKI
(国家知识基础设施)是一个庞大的、可共享的知识群体,为科研、教学、
科普和知识服务提供有效的基础。该系统拥有大量的学科本体,包括:1)地理本
体:如国家本体、城市本体、地理位置本体等;2)化工本体:如有机物本体、化
工过程本体等;3)有关人的本体:如人物本体、书籍本体、论文本体;4)生物
本体:如植物本体、动物本体、真菌本体;5)中西医本体:如草药本体、药膳本
体、中成药本体、经络本体、疾病本体等。
NKI在对很多本体进行本体论分析时,定义了属性之间以及关系之间的公理。
并且引入了强公理和弱公理的概念。在强公理不成立的情况下,以弱公理代替强
公理进行推理,再在以后的推理中,由于新知识的加入或确定性高的公理的加入
逐渐强化公理,以提高公理的确定性。
HowNet(知网)(董振东教授)
HowNet是一个在线的常识知识库(Common-sense KB,用于自然语言处理。
它以汉语和英语的词语所代表的概念为描述对象,以揭示概念之间及概念具有的
属性之间的关系为基本内容,不仅包含中文词典中概念间及其属性间的关系,还
包含与中文对应的英文概念及其属性间的关系。HowNet中涉及到的关系有:1
下位关系;2)同义关系;3)反义关系;4)对义关系;5)部件-整体关系;6
属性-宿主关系;7)材料-成品关系;8)事件-角色关系;9)相关关系;10
场所-事件关系11)时间-事件关系;12)工具-事件关系;13)实体-值关
系 ; 14) 值 - 属 性 关 系 等 。 HowNet 采 用 的 是 知 网 知 识 系 统 描 述 语 言KDML
Knowledge Database Markup Language)来确保概念描述的一致性和准确性。
目前本体主要应用于4大领域(图1-1:教育(31%、计算机软件(28.5%
政府(17%)和商业服务(17%,而在制造业方面尽占了8.6%[13]
摘要:

第一章绪论1第一章绪论§1.1课题的来源及意义随着网络的日益普及与计算机技术的迅猛发展,速度、知识和网络使得企业的竞争模式与竞争规则不断更新,从而在全球范围内造就了一个利用信息技术,将速度和知识结合起来创造新价值的新经济时代,这就是继农业经济、工业经济之后的知识经济时代。知识经济时代的到来,使得企业将重心从物质资本转向知识价值,换句话说,“知识”的价值比“资源”的价值更高。因此,企业的发展基础、核心竞争力和发展战略势必都与“知识”挂钩且密不可分。企业在提高产品利润的同时,也必须将“知识”作为其重要组成部分,重视知识资本,接受知识带来的机遇和挑战,并通过对知识的搜集、加工、共享与创新,从而获得知...

展开>> 收起<<
基于OWL的机械制造业基础工业工程本体研究.pdf

共72页,预览8页

还剩页未读, 继续阅读

作者:陈辉 分类:高等教育资料 价格:15积分 属性:72 页 大小:3.26MB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 72
客服
关注