Installera Apache Hadoop på Ubuntu 22.04

I den här guiden går vi igenom hur du installerar Apache Hadoop, en ramverk för distribuerad lagring och bearbetning av stora datamängder, på Ubuntu 22.04. Denna installation kan vara särskilt användbar för användare av en VPS-server.

Förutsättningar

Ubuntu 22.04 installerat på din server.
Root-åtkomst eller sudo-rättigheter.
En aktiv internetanslutning.
Java Development Kit (JDK) installerat.

Steg 1: Uppdatera systemet

Öppna terminalen och kör följande kommando för att uppdatera systempaketen:

sudo apt update && sudo apt upgrade -y

Steg 2: Installera Java

Kör följande kommando för att installera OpenJDK:

sudo apt install openjdk-11-jdk -y

Steg 3: Ladda ner Hadoop

Ladda ner den senaste versionen av Apache Hadoop:

wget https://downloads.apache.org/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz

Extrahera zip-filen:

tar -xzf hadoop-3.3.1.tar.gz

Steg 4: Flytta Hadoop-mappen

Kör följande kommando för att flytta Hadoop-mappen till /usr/local:

sudo mv hadoop-3.3.1 /usr/local/hadoop

Steg 5: Ställ in miljövariabler

Öppna din .bashrc-fil:

nano ~/.bashrc

Lägg till följande rader i slutet av filen:

# Hadoop miljövariabler
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

Spara filen och ladda om .bashrc:

source ~/.bashrc

Steg 6: Konfigurera Hadoop

Navigera till Hadoop-konfigurationsmappen:

cd $HADOOP_CONF_DIR

Redigera core-site.xml:

nano core-site.xml

Lägg till följande konfiguration:

<configuration>
   <property>
      <name>fs.defaultFS</name>
      <value>hdfs://localhost:9000</value>
   </property>
</configuration>

Steg 7: Starta Hadoop-demoner

Kör följande kommandon för att starta NameNode och DataNode:

start-dfs.sh

Steg 8: Kontrollera installationen

Navigera till följande URL i din webbläsare för att kontrollera att Hadoop körs korrekt:

http://localhost:9870

Avslutning

Ditt Apache Hadoop-system är nu installerat och klart för användning. Genom att använda denna metod kan du enkelt hantera din databehandling från en VPS-server.

Windows VPS Deutschland

Windows VPS España

Windows VPS Nederland

Windows RDS (Remote Desktop Services)

Windows VPS

Author: Łukasz Bodziony

Website: Windows VPS

Łukasz Bodziony is the CEO and founder of NETCLOUD24, a global VPS hosting brand proudly originating from Poland. With extensive experience in cloud computing, virtualization, and server management, he delivers high-performance Windows VPS and Remote Desktop Services (RDS) solutions to clients across Europe, North America, and beyond.

His expertise covers a wide range of technologies, including Microsoft Azure, Proxmox VE, Amazon Web Services (AWS), and numerous other virtualization and cloud platforms.

Beyond running his hosting business, Łukasz also provides professional paid server configuration and optimization services for companies and individuals. Outside of work, he is dedicated to caring for his children and building a secure future for them.

If you are interested in working with him or need expert assistance with your hosting, cloud environment, or server setup, feel free to reach out via Windows VPS.

Förutsättningar

Steg 1: Uppdatera systemet

Steg 2: Installera Java

Steg 3: Ladda ner Hadoop

Steg 4: Flytta Hadoop-mappen

Steg 5: Ställ in miljövariabler

Steg 6: Konfigurera Hadoop

Steg 7: Starta Hadoop-demoner

Steg 8: Kontrollera installationen

Avslutning

More on this topic

Related Articles