I den här guiden går vi igenom hur du installerar Apache Hadoop, en ramverk för distribuerad lagring och bearbetning av stora datamängder, på Ubuntu 22.04. Denna installation kan vara särskilt användbar för användare av en VPS-server.
Förutsättningar
- Ubuntu 22.04 installerat på din server.
- Root-åtkomst eller sudo-rättigheter.
- En aktiv internetanslutning.
- Java Development Kit (JDK) installerat.
Steg 1: Uppdatera systemet
Öppna terminalen och kör följande kommando för att uppdatera systempaketen:
sudo apt update && sudo apt upgrade -y
Steg 2: Installera Java
Kör följande kommando för att installera OpenJDK:
sudo apt install openjdk-11-jdk -y
Steg 3: Ladda ner Hadoop
Ladda ner den senaste versionen av Apache Hadoop:
wget https://downloads.apache.org/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz
Extrahera zip-filen:
tar -xzf hadoop-3.3.1.tar.gz
Steg 4: Flytta Hadoop-mappen
Kör följande kommando för att flytta Hadoop-mappen till /usr/local:
sudo mv hadoop-3.3.1 /usr/local/hadoop
Steg 5: Ställ in miljövariabler
Öppna din .bashrc-fil:
nano ~/.bashrc
Lägg till följande rader i slutet av filen:
# Hadoop miljövariabler
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
Spara filen och ladda om .bashrc:
source ~/.bashrc
Steg 6: Konfigurera Hadoop
Navigera till Hadoop-konfigurationsmappen:
cd $HADOOP_CONF_DIR
Redigera core-site.xml:
nano core-site.xml
Lägg till följande konfiguration:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
Steg 7: Starta Hadoop-demoner
Kör följande kommandon för att starta NameNode och DataNode:
start-dfs.sh
Steg 8: Kontrollera installationen
Navigera till följande URL i din webbläsare för att kontrollera att Hadoop körs korrekt:
http://localhost:9870
Avslutning
Ditt Apache Hadoop-system är nu installerat och klart för användning. Genom att använda denna metod kan du enkelt hantera din databehandling från en VPS-server.