第二步 在D2RQ平台上配置jena环境

时间:2020-12-08 02:28:08
第二步 在D2RQ平台上配置jena环境
2013年10月16日 9:48:53
搞了这么长时间语义,只用过protege这样的工具,一直没有落实到实际代码上。jena也看过好久了,总认为是hp公司的东西算不上标准,现在看来,jena已经是语义应用开发中最主流的工具了,我就此选择jena进行语义应用的开发了。
 
 
Getting started with Apache Jena

Apache Jena (or Jena in short) 是免费开源的java框架用于构建语义网应用和关联数据应用。这个框架包括不同的处理RDF数据的API接口。如果你是菜鸟,你可以选择从下面的教程中开始,你也可以浏览感兴趣的主题文档。
 
Tutorials
竟然发现有大牛已经做过翻译了,好吧,我转载在这里,我郑重声明转载了“april 1019”这位大牛的工作,

Jena文档《An Introduction to RDF and the Jena RDF API》的译文

文档里包含的内容很多,还是回到具体的配置上来。

 
Using the D2RQ Engine with Jena

 1. Jena Versions
    由于D2RQ内部嵌入了jena和SPARQL查询引擎,所以对jena和ARQ是敏感的。D2RQ只在相应的jena版本下工作。检索/lib/arq-X.Y目录下各包的版本,以下载合适的jena包。
    我下载的D2RQ是0.8.1,其/lib里面的jena的jar是2.7.0,所以从http://archive.apache.org/dist/jena/binaries/这里下载了apache-jena-2.7.0-incubating.tar.gz。还是解压到/opt文件夹下。
 
2. 配置路径
    新建一个eclipse工程jena_test,然后右键-Build Path-Add Library-User Library,再把/opt/D2RServer/d2rq-0.8.1/lib下的d2rq-0.8.1.jar,添加入项目中。类似再添加commons-logging-1.1.jar和slf4j-api-1.6.4.jar到项目中,然后把/lib/db-drivers下的JDBC也加进来。
    D2RQ下载时会忽略一些Jena/ARQ jar,但这些jar也有可以会用到。可以把下载的放到这个lib中去。
 
3. Logging
    D2RQ通过Apache Commons Logging的API记录日志信息。D2RQ搭载了Apache log4j(见注1),但你也可以使用不同的前端日志。
为了获取D2RQ的调试信息,设置日志记录器的级别从de.fuberlin.wiwiss.d2rq改为ALL.简单的方法即是把/lib/logging的目录添加到构建路径中,新建一个文件log4j.properties,包括以下内容:
log4j.rootLogger=INFO, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d{HH:mm:ss} %-5p %-20c{1} :: %m%n
log4j.logger.de.fuberlin.wiwiss.d2rq=ALL
我在/lib/logging下新建了log4j.properties文件,复制了上面的内容,并把它也加到了项目中。
 
4. 通过jena模型的API使用D2RQ
ModelD2RQ类为D2RQ映射数据库中的数据提供了一个Jena的模型视图。
下面的例子通过使用一个预先创建的映射文件介绍ModelD2RQ是如何创建的,也介绍了如何用Jena API从模型中提取论文及作者信息。
// Set up the ModelD2RQ using a mapping file
Model m = new ModelD2RQ("file:doc/example/mapping-iswc.ttl");
 
// Find anything with an rdf:type of iswc:InProceedings
StmtIterator paperIt = m.listStatements(null, RDF.type, ISWC.InProceedings);
 
// List found papers and print their titles
while (paperIt.hasNext()) {
    Resource paper = paperIt.nextStatement().getSubject();
    System.out.println("Paper: " + paper.getProperty(DC.title).getString());
 
    // List authors of the paper and print their names
    StmtIterator authorIt = paper.listProperties(DC.creator);
    while (authorIt.hasNext()) {
        Resource author = authorIt.nextStatement().getResource();
        System.out.println("Author: " + author.getProperty(FOAF.name).getString());
    }
    System.out.println();
}
m.close();
其中ISWC和FOAF类在Jena的schemagen工具中创建了, DC and RDF类也是Jena的一部分。
 
5. 通过jena图的API使用D2RQ
    在一些情况中,最好用低水平的Jena图的API,而不是模型API,D2RQ提供图的接口的实现,即GraphD2RQ.
下面的例子是介绍图API来查找2003年发表的所有论文。
// Load mapping file
Model mapModel = FileManager.get().loadModel("doc/example/mapping-iswc.ttl");
 
// Parse mapping file
MapParser parser = new MapParser(mapModel, "http://localhost:2020/");
Mapping mapping = parser.parse();
 
// Set up the GraphD2RQ
GraphD2RQ g = new GraphD2RQ(mapping);
 
// Create a find(spo) pattern
Node subject = Node.ANY;
Node predicate = DC.date.asNode();
Node object = Node.createLiteral("2003", null, XSDDatatype.XSDgYear);
Triple pattern = new Triple(subject, predicate, object);
 
// Query the graph
Iterator<Triple> it = g.find(pattern);
 
// Output query results
while (it.hasNext()) {
    Triple t = (Triple) it.next();
    System.out.println("Published in 2003: " + t.getSubject());
};
g.close();
 
5.1 还有一个CachingGraphD2RQ
除了CachingGraphD2RQ,还有一个CachingGraphD2RQ能够提供相同的API,使用LRU(最近最少使用算法)
缓存记忆最近几个查询的结果。这会改进重复查询的效果,如果数据库在CachingGraphD2RQ类的使用期间发生改变的话,会报出数据的不一致性。
 
6. Executing SPARQL queries against a ModelD2RQ
D2RQ可以通过D2RQ模型响应SPARQL查询,下面的例子介绍D2RQ模型是如何创建的,以及SPARQL查询是如何执行的、结果是如何写入控制台的。
ModelD2RQ m = new ModelD2RQ("file:doc/example/mapping-iswc.ttl");
String sparql =
    "PREFIX dc: <http://purl.org/dc/elements/1.1/>" +
    "PREFIX foaf: <http://xmlns.com/foaf/0.1/>" +
    "SELECT ?paperTitle ?authorName WHERE {" +
    "    ?paper dc:title ?paperTitle . " +
    "    ?paper dc:creator ?author ." +
    "    ?author foaf:name ?authorName ." +
    "}";
Query q = QueryFactory.create(sparql);
ResultSet rs = QueryExecutionFactory.create(q, m).execSelect();
while (rs.hasNext()) {
    QuerySolution row = rs.nextSolution();
    System.out.println("Title: " + row.getLiteral("paperTitle").getString());
    System.out.println("Author: " + row.getLiteral("authorName").getString());
};
m.close();
 
7. The D2RQ Assembler
D2RQ自带Jena编译器,Jena编译器的规格是RDF的配置文件,文件描述了如何构建一个Jena模型。更多的Jena编译器的信息,请看 Jena Assembler quickstart page.
下面的例子介绍了D2RQ模型的编译规格
@prefix : <#> .
@prefix ja: <http://jena.hpl.hp.com/2005/11/Assembler#> .
@prefix d2rq: <http://www.wiwiss.fu-berlin.de/suhl/bizer/D2RQ/0.1#> .
 
<> ja:imports d2rq: .
 
:myModel
    a d2rq:D2RQModel;
    d2rq:mappingFile <mapping-iswc.ttl>;
    d2rq:resourceBaseURI <http://localhost:2020/>;
    .
D2RQ模型规格支持下面两种特性:
d2rq:mappingFile:必要的,使用D2RQ的映射文件的URI来构建模型。
d2rq:resourceBaseURI:设置基础URI来代替相对URI模型,转变为全URI。如果不特指的话,D2RQ会特选择一个适当的基础URI。
下面的这种惯例用法,将从一个模型规范中创建一个D2RQ模型,并把它写入控制台。
// Load assembler specification from file
Model assemblerSpec = FileManager.get().loadModel("doc/example/assembler.ttl");
 
// Get the model resource
Resource modelSpec = assemblerSpec.createResource(assemblerSpec.expandPrefix(":myModel"));
 
// Assemble a model
Model m = Assembler.general.openModel(modelSpec);
 
// Write it to System.out
m.write(System.out);
 
m.close();
 
8. Javadoc API documentation
    Javadoc API documentation for the latest releaseis available.
 
 
注1:Log4j是Apache的一个开放源代码项目,通过使用Log4j,我们可以控制日志信息输送的目的地是控制台、文件、GUI组件、甚至是套接口服务器、NT的事件记录器、UNIX Syslog守护进程等;我们也可以控制每一条日志的输出格式;通过定义每一条日志信息的级别,我们能够更加细致地控制日志的生成过程。最令人感兴趣的就是,这些可以通过一个配置文件来灵活地进行配置,而不需要修改应用的代码。
 
 
第二步就写到这里,供大家参考。有需要交流的可以加QQ: 1q7q1q5q3q6q0q1q8(去掉中间的q)。