lucene索引的更新和删除

时间:2023-03-09 02:57:00
lucene索引的更新和删除

索引的删除: 
IndexReader和IndexWriter都由删除索引的功能,但这两者是有区别的, 
使用IndexReader删除索引时,索引会马上被删除,其有两种方法,可以删除索引deleteDocument(int docNum)和deleteDocument(Term term)前者会删除编号为docNum的document,后者会删除带有term的document。但是用这个类删除有局限性,当用此类打开的索引后来修改后会报StaleReaderException异常,并且当其他writer已经打开此索引时也会报异常。

IndexWriter可以根据多种情况进行删除deleteAll()删除所有的document、deleteDocuments(Query… queries)删除多个查询出来的document,deleteDocuments(Query query)删除query查询出来的document等等,但用Indexwriter执行删除的话一定要进行关闭,否则删除不会立马生效。

  1. Directory directory = FSDirectory.open(new File("d:\\lucene"));
  2. IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_34, new StandardAnalyzer(Version.LUCENE_34));
  3. //最大缓存文档数,控制写入一个新的segment前内存中保存的document的数目
  4. config.setMaxBufferedDocs(100);
  5. //控制一个segment中可以保存的最大document数目,值较大有利于追加索引的速度,默认Integer.MAX_VALUE,无需修改。
  6. config.setMaxBufferedDocs(Integer.MAX_VALUE);
  7. IndexWriter indexWriter = new IndexWriter(directory, config);
  8. indexWriter.deleteDocuments(new Term("id",index));
  9. //这两句一定要执行
  10. indexWriter.optimize();
  11. indexWriter.close();

索引的更新: 
IndexWriter可以更新索引。 
更新索引实际上是把要更新的document删除,然后把修改过的document加入到索引中,其方法是document(Term term,Document doc),第一个参数是删除含有term的document,第二个参数是更新后的document。

  1. Directory directory = FSDirectory.open(new File("d:\\lucene"));
  2. IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_34, new StandardAnalyzer(Version.LUCENE_34));
  3. //最大缓存文档数,控制写入一个新的segment前内存中保存的document的数目
  4. config.setMaxBufferedDocs(100);
  5. //控制一个segment中可以保存的最大document数目,值较大有利于追加索引的速度,默认Integer.MAX_VALUE,无需修改。
  6. config.setMaxBufferedDocs(Integer.MAX_VALUE);
  7. IndexWriter indexWriter = new IndexWriter(directory, config);
  8. Document doc = new Document();
  9. //设置Field的name是为了搜索时更精确,比如只想在title中搜索。
  10. Field idField = new Field("id", blog2.getId() + "", Field.Store.YES, Field.Index.NOT_ANALYZED);
  11. Field titleField = new Field("title", blog2.getTitle(), Field.Store.YES, Field.Index.ANALYZED);
  12. Field contentField = new Field("content", blog2.getContent(), Field.Store.NO, Field.Index.ANALYZED);
  13. Field dateField = new Field("date", blog2.getDate(), Field.Store.YES, Field.Index.NO);
  14. doc.add(titleField);
  15. doc.add(contentField);
  16. doc.add(idField);
  17. doc.add(dateField);
  18. indexWriter.updateDocument(new Term("id", blog2.getId() + ""), doc);
  19. //这两句一定要执行,不然的话,更新不会马上执行。
  20. indexWriter.optimize();
  21. indexWriter.close();