词源WordNet项目提供有关如何在不同语言中的单词的信息是源性相关的。
这些信息是从维基词典开采的大部分。半结构化数据变成机器可读的导源数据库,还包含一些额外的手动添加的结果关系。
在Lexvo.com提供的(旧版本)的一个非常基本的接口(旧版本)在Lexvo.com上提供了更高级的浏览界面将稍后可用。
基于JVM的ProGamming语言(如Java,Scala等)的编程访问。下载UWN库和词源Wordnet插件。
注意:新版本目前在工程中,预计将在2020年夏季发布。请尽快回复!
对于学术用途,请引用以下出版物:Gerard de Melo。词源Wordnet:跟踪单词历史:proc。 LREC 2014. Elra,2014年,巴黎,法国。 Gerard de Melo和Gerhard Weikum。迈向普遍的多语言知识库:多语种Wordnets的原则,建设和应用。第五届全球Wordnet会议的诉讼程序(GWC 2010)。 Narosa Publishing 2010,新德里印度。
如果您想向Etymology Wordnet提供贡献或者您有其他建议或研究建议,请与Gerard de Melo取得联系。如果您考虑到了特定的研究项目,则有几种方法可以提高数据。
最大的多语言知识图之一,将众所周知的WordNet数据库转换为大量的多语言资源,涵盖在单个语义组织的层次结构中超过100万字和数百万个命名实体的大量多语言资源。这是基于机器学习以及基于Menta扩展 Wikipedia.our衍生工程OpenwordNet-Pt(GitHub)正在谷歌翻译使用。 为链接数据Web和语义Web提供有关单词和其他语言相关实体的信息,导致英国库,西班牙语库和其他人将其数据链接到Lexvo.org和Lexvo的数据网络。 ORG又将其自身的数据连接到其他有价值的资源。 用于情感分析和细粒度的情感分析的数据集和资源,部分可用于多种语言。