语义网,三段论和世界观(2003)

2021-01-09 14:19:34

首次发布于2003年11月7日在“网络,经济和文化”邮件列表中。订阅邮件列表。

在过去的几年中,W3C的语义Web项目已经以多种方式被描述:对当前Web的扩展,其中信息具有明确定义的含义,是机器可以分析Web甚至是Web上所有数据的地方其中机器推理将无处不在且具有强大的破坏力。但是,这种笼统的描述存在的问题是,他们没有回答一个明显的问题:语义网有什么用处?

简单的答案是这样的:语义Web是创建三段论的机器。三段论是一种逻辑形式,首先由亚里士多德(Aristotle)描述,其中某些内容被陈述,但从陈述中得出的东西必然与陈述的内容不符。" [有机体]

语义网由断言组成,例如" shirky.com的创建者是Clay Shirky。"鉴于这两个陈述

-Clay Shirky是shirky.com的创建者-shirky.com的创建者居住在布鲁克林

您可以得出结论,我住在布鲁克林,从任何一份陈述中都无法得知。从那里,可以进一步耦合其他表达式,包括Clay Shirky,shirky.com或Brooklyn。

语义Web指定了在Web上公开这些断言的方法,以便第三方可以将它们组合起来以发现真实的但未直接指定的事物。这是语义网的承诺-它将改善您当前使用三段论的生活的所有领域。

三段论不是很有用#尽管三段论自亚里士多德以来就已经存在,但在查尔斯·道奇森(Charles Dodgson)(更名为刘易斯·卡洛尔(Lewis Carroll))的著作中于19世纪达到了神化论。他的三段论常常采取独奏形式,其中一对链接的断言的结论变成了要与其他链接相联系的新断言。

-不能检查的出血疗法是一种嘲讽-不可轻视金盏花Tin-切开手指后会检查出血的疗法是有用的-所有关于出血的模拟疗法都是卑鄙的

这使您得出结论,金手指Tin会在您割断手指时检查出血情况。

尽管三段论很吸引人,但在现实世界中却无法很好地发挥作用,因为我们使用的大多数数据都不适合这种轻松的重组。结果,语义网也不会非常有用。

语义网上的工作人员极大地高估了演绎推理的价值(通常是人工智能项目中的一个永久主题。)该错误的最大传播者是亚瑟·柯南·道尔,他的福尔摩斯故事对人们对人类智能的理解造成了更大的损害。比Rene Descartes以外的任何人都重要。杜伊尔已经说服了几代读者,当他们认为通过链接先验事实得出不可避免的结论时,非常聪明的人会做什么。正如福尔摩斯(Folmes)所说的那样,当您消除了不可能的事情时,无论多么不可能的事情,剩下的都是真理。

这种情绪之所以具有吸引力,恰恰是因为它描述了一个比我们自己简单的世界。在现实世界中,我们通常使用部分,不确定或上下文相关的信息来进行操作。当我们必须根据这些信息做出决定时,我们会猜测,推断,暗示,做我们上次做的事情,做我们认为我们的朋友会做的事情,或者耶稣或琼·杰特会做的事情,我们做所有这些事情,还有更多,但我们几乎从不使用实际的演绎逻辑。

结果,我们所做的几乎所有陈述,甚至看似显而易见的陈述,都不像语义网所要求的那样真实。德鲁·麦克德莫特(Drew McDermott)在其对PureReason的出色批判[Computational Intelligence,3:151-237,1987]中,提出了可以通过构建足够详细的演绎支架来创建人工智能的概念。他得出结论说,这种方法存在致命缺陷,并指出"一定是我们想要[推论]的大部分推论是推论的,否则根本就无关紧要从给定的公理集中推导出多少个定理。 #34;尽管对“纯粹理性的批判”不仅早于语义网,而且也早于实际的网,但批评仍然存在。

-shirky.com的创建者居住在布鲁克林-居住在布鲁克林的人们讲布鲁克林口音

您可以从这对断言中得出结论:shirky.com的创建者将其发音为" shoiky.com。"与关于我的实际位置的断言不同,这是错误的。可以很容易地将这个错误忽略为“垃圾进,垃圾出”,但这并不是那么简单。 ofshirky.com的创建者确实居住在布鲁克林,有些居住在布鲁克林的人说话时带有布鲁克林的口音,但并不是所有人(美国)。

换句话说,每个陈述都是正确的,但以不同的方式都是正确的。引人注意的是,第二种说法是概括性的,只能在上下文中理解,但是这种方式是存在的。对给定语句要与上下文提供语句库进行交叉检查的任何要求(如果该语句仍具有更多上下文),将使该系统按比例毁灭。

我们以通用性描述世界#我们不能禁止概括,因为我们无法通过查看来了解哪些陈述是概括。即使我们可以,也无济于事,因为概括是表达的基本工具。 "居住在法国的人说法语在结构上与"没有区别居住在布鲁克林区的人们以布鲁克林口音讲话。"在任何人类的语境中"居住在Francespeak的人是正确的,但如果需要通用性,那就是错误的,因为有些法国移民和前移民不讲这种语言。

三段论之所以听起来有些固步自封,是因为它们以绝对荒谬的方式进行交易。考虑一下道奇森的这颗宝石:

-没有趣味的诗歌在真正有品味的人中不受欢迎-没有现代诗歌不受感情的影响-您的所有诗歌都以肥皂泡为主题-没有受影响的诗歌在有品味的人中很受欢迎-没有古代诗歌是主题肥皂泡

这种五行三段论是有史以来对语义网的最好的批评,因为它说明了这种形式的推理我们必须生活的世界,在这个世界中语言仅仅是用词完成的数学运算。实际的人类表达必须考虑到现实世界中的模棱两可,在这些模棱两可的人中,即使是那些真正有品位的人也不同意有趣或受到影响的地方,没有诗人,即使是最无趣的人,也不会写下所有关于肥皂泡的诗。

语义网的建议用途#道奇森的三段论实际上证明了形式的局限性,这种模式可以称为“没有概念的证明”,其中说明性示例的荒谬性破坏了要点。语义网也是如此。从W3C自己的站点考虑以下内容:

问:如何通过语义网购买书籍?答:您浏览/查询直到找到合适的报价来出售您想要的书。您向语义网添加信息,说您接受报价并提供详细信息(您的姓名,送货地址,信用卡信息等)。当然,您要添加它(1)具有访问控制,以便只有您和卖方才能看到它,以及(2)将其存储在卖方可以轻松获得它的地方,也许是卖方自己的服务器,(3 ),您将其通知卖方。您等待或查询确认卖家已接受您的确认,以及(以后)可能提供运输信息等。[http://www.w3.org/2002/03/semweb/]

本示例设置用于描述SemanticWeb的模式。首先,解决一些众所周知的问题。接下来,错误地解释它,以使困难的部分显得微不足道,而琐碎的部分变得很难。最后,祝贺您解决了琐碎的部分。

第一句话动摇了读者与书籍匹配的所有实际复杂性:"浏览/查询,直到找到合适的要约来出售想要的书。谁知道这是如此简单?与此同时,微不足道的支付操作却得到了奢侈的描述,目的是掩盖一个事实,那就是一旦找到要出售的书,使用信用卡就是显而易见的下一步。

合并数据库仅是在RDF中记录“个人名称”的问题。您数据库中的名称等同于" Name"在我的数据库中,然后将所有信息汇总在一起,让处理器考虑一下。 [http://infomesh.net/2001/swintro/]

从未处理过合并数据库的人不会使用“简单”一词。如果只需要创建一个域名名称词库,就不需要语义网。这个过程将在今天起作用。相反,要采用刘易斯·卡罗尔主义,要绕着实际的问题挥手致意-人的名字不是全球唯一的-掩盖了连接名字和人名的琐碎事。 Isyour" Person Name = John Smith"与我的" Name = JohnQ相同的人。史密斯?谁知道?不是语义网。处理器可以考虑关于这一点,直到硅抽烟而没有得到答案。

语义网的散布者不时尝试给它以人性化的面孔:

例如,我们可能想证明乔爱玛丽。我们发现这些信息的方式是,我们在受信任的站点上找到了两个文档,其中一个说":Joe:loves:MJS&#34 ;,另一个说":MJS daml:equivalentTo:Mary"。我们还从站点的维护者那里亲自获得了文件的校验和。要检查此信息,我们可以在本地文件中列出校验和,然后设置一些FOPL规则,说“如果文件&a”。包含乔爱玛丽的信息并具有校验和md5:0qrhf8q3hfh,然后记录SuccessA"," if文件' b'包含MJS等同于Mary的信息,并具有校验和md5:0892t925h,然后记录SuccessB&#34 ;,并且"如果SuccessA和SuccessB,则Joe喜欢Mary"。 [http://infomesh.net/2001/swintro/]

您可能想再次阅读第二段,以品尝其细致的细节和无知的混合。

任何15岁的人都知道,对爱的抗议,无论是求和还是不求爱,都不应一无是处。即使我们想从这个例子中摆脱爱情,我们将用什么代替爱情呢? Joe可能对Mary提出的断言的范围很大,但是可以普遍解释且不复杂的断言的子集很小。

举个例子:假设一家公司决定,如果某人销售超过100种我们的产品,那么他们就是超级推销员俱乐部的成员。现在,一个智能程序可以遵循此规则进行简单的推论:" John卖了102件东西,因此John是Super Salesman俱乐部的成员。" [http://logicerror.com/semanticWeb-long]

也许这是呈现微不足道问题值得语义干预的高水准:一个可以断定102大于100的程序被标记为智能。人工智能,我们来了。

元数据不是万灵药#语义Web基于元数据运行,并且许多元数据是不可信的,原因有很多,这些原因不易解决。 (例如,参见Doctorow,Pilgrim,Shirky