Apache Nutch

Why Trust Techopedia

What Does Apache Nutch Mean?

Apache Nutch is a web crawler software product that can be used to aggregate data from the web. It is used in conjunction with other Apache tools, such as Hadoop, for data analysis.

Advertisements

Techopedia Explains Apache Nutch

Apache Nutch is an open-source product licensed by the Apache Software Foundation. This developer community holds licenses for a range of Apache software tools that can sort and analyze data. One of the central technologies is Apache Hadoop, a big data analytics tool that is very popular in the business community.

Along with tools like Apache Hadoop and features for file storing, analysis and more, the role of Nutch is to collect and store data from the web through the use of web crawling algorithms.

Users can take advantage of simple commands in Apache Nutch to collect information under URLs. Users typically use Apache Nutch along with another open-source tool, a framework called Apache Solr, which can act as a repository for the data collected with Apache Nutch.

Advertisements

Related Terms

Margaret Rouse
Editor

Margaret jest nagradzaną technical writerką, nauczycielką i wykładowczynią. Jest znana z tego, że potrafi w prostych słowach pzybliżyć złożone pojęcia techniczne słuchaczom ze świata biznesu. Od dwudziestu lat jej definicje pojęć z dziedziny IT są publikowane przez Que w encyklopedii terminów technologicznych, a także cytowane w artykułach ukazujących się w New York Times, w magazynie Time, USA Today, ZDNet, a także w magazynach PC i Discovery. Margaret dołączyła do zespołu Techopedii w roku 2011. Margaret lubi pomagać znaleźć wspólny język specjalistom ze świata biznesu i IT. W swojej pracy, jak sama mówi, buduje mosty między tymi dwiema domenami, w ten…