wiki:solr_nutch

Version 2 (modified by Dirk Wintergrün, 12 years ago) (diff)

--

Harvesting der www-Seiten mit Hilfe von Nutch

MPIWG nutch plugins

Für das Harvesting der www- Seiten des Institutes existieren zwei Plugins.

parse-mpiwg

source:mpiwg-nutch-plugins/src/plugin/parse-mpiwg

parse-MPIWG-metaTag

source: mpiwg-nutch-plugins/src/plugin/parse-MPIWG-metaTag