I denne vejledning vil vi gennemgå, hvordan du kan installere Apache Hadoop, et populært rammeværk til distribueret databehandling, på en Ubuntu 22.04-server. Denne installation kan være særligt nyttig for brugere af en VPS-server.
Forudsætninger
- Ubuntu 22.04 installeret på din server.
- Root-adgang eller sudo-rettigheder.
- Java installeret (Hadoop kræver Java 8 eller højere).
- En aktiv internetforbindelse.
Trin 1: Opdater systemet
Først skal du opdatere dit system for at sikre, at alle pakker er opdaterede:
sudo apt update && sudo apt upgrade -y
Trin 2: Installer Java
Installer OpenJDK:
sudo apt install openjdk-11-jdk -y
Trin 3: Download Hadoop
Download den nyeste version af Hadoop fra Apache’s officielle hjemmeside:
wget https://downloads.apache.org/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz
Trin 4: Udpak Hadoop
Udpak den downloadede fil:
tar -xzvf hadoop-3.3.1.tar.gz
Trin 5: Flyt Hadoop til /usr/local
Flyt Hadoop-mappen til /usr/local:
sudo mv hadoop-3.3.1 /usr/local/hadoop
Trin 6: Konfigurer miljøvariabler
Rediger din .bashrc-fil for at tilføje Hadoop-miljøvariabler:
nano ~/.bashrc
Tilføj følgende linjer til slutningen af filen:
# Hadoop
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin
export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64
Anvend ændringerne:
source ~/.bashrc
Trin 7: Konfigurer Hadoop
Kopier konfigurationsfilerne:
cd $HADOOP_HOME/etc/hadoop
cp *-site.xml.template *-site.xml
Rediger core-site.xml for at konfigurere HDFS:
nano core-site.xml
Tilsæt følgende konfiguration:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
Trin 8: Start Hadoop dæmoner
Kør følgende kommandoer for at starte HDFS og YARN dæmoner:
$HADOOP_HOME/sbin/start-dfs.sh
$HADOOP_HOME/sbin/start-yarn.sh
Afslutning
Dine Hadoop-applikationer er nu installeret og klar til brug. Denne løsning kan være særligt nyttig for dem, der ønsker at udføre distribueret databehandling fra en VPS-server.