Willkommen bei Scribd!

Running Hadoop On Ubuntu Linux

Hochgeladen von

0% fanden dieses Dokument nützlich (0 Abstimmungen)

12 Ansichten15 Seiten

This document provides an overview of setting up Hadoop on Ubuntu Linux for both single-node and multi-node clusters. It discusses prerequisites, installation, configuration, starting and stopping the clusters, and basic usage of HDFS and MapReduce. It also briefly covers decommissioning nodes, backup processes, and tuning file sizes. Finally, it diagrams the architecture of an ITRI cloud storage system using Hadoop and iSCSI.

Originalbeschreibung:

runninghadooponubuntulinux-100928043105-phpapp01

Originaltitel

runninghadooponubuntulinux-100928043105-phpapp01

Copyright

Verfügbare Formate

PPT, PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

Copyright:

Verfügbare Formate

Als PPT, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

0% fanden dieses Dokument nützlich (0 Abstimmungen)

12 Ansichten15 Seiten

Running Hadoop On Ubuntu Linux

Hochgeladen von

Stanfield D. Jhonny

Copyright:

Verfügbare Formate

Als PPT, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 15

Im Dokument suchen

0

Running Hadoop On Ubuntu Linux

1
Introduction
Single-Node Cluster
http://www.michael-
noll.com/wiki/Running_Hadoop_On_Ubuntu_Linux_(Single-Node_Cluster)
Multi-Node Cluster
http://www.michael-
noll.com/wiki/Running_Hadoop_On_Ubuntu_Linux_(Multi-Node_Cluster)
Decommission
Issues
ITRI Cloud Storage System Architecture
Agenda
2
HDFS is highly fault-tolerant and is designed to
be deployed on low-cost hardware. HDFS
provides high throughput access to application
data and is suitable for applications that have
large data sets. HDFS relaxes a few POSIX
requirements to enable streaming access to file
system data.
Introduction
3
Introduction (cont)
HDFS Architecture (source:http://hadoop.apache.org/core/docs/current/hdfs_design.html
4
Introduction (cont)
HDFS multi-node overview (source:http://www.michael-noll.com/wiki/Running_Hadoop_On_Ubuntu_Linux_(Multi-Node_Cluster)
5
Introduction (cont)
HDFS multi-node cluster Architecture (source:http://www.michael-noll.com/wiki/Running_Hadoop_On_Ubuntu_Linux_(Multi-Node_Cluster)
6
Prerequisites
Sun JAVA 6
Add a hadoop system user
Configuration SSH public key authentication
Single-Node Cluster need to access localhost
Disabling IPv6
Hadoop installation
Configuration
<HADOOP_INSTALL>/conf/hadoop-env.sh
<HADOOP_INSTALL>/conf/core-site.xml
<HADOOP_INSTALL>/conf/mapred-site.xml
<HADOOP_INSTALL>/conf/hdfs-site.xml

Single-Node Cluster
7
Formatting the name node
<HADOOP_INSTALL>/hadoop/bin/hadoop namenode -format
Starting/Stop your single-node cluster
<HADOOP_INSTALL>/bin/start-all.sh
<HADOOP_INSTALL>/bin/stop-all.sh
Check hadoop processes are running
jps
Copy local example data to HDFS
<HADOOP_INSTALL>/ bin/hadoop dfs -copyFromLocal
/tmp/gutenberg gutenberg
<HADOOP_INSTALL>/ bin/hadoop dfs ls
<HADOOP_INSTALL>/ bin/hadoop dfs -ls gutenberg
Run the MapReduce job
bin/hadoop jar hadoop-0.20.2-examples.jar wordcount
gutenberg gutenberg-output

Single-Node Cluster(cont)
8
http://localhost:50030/ - web UI for MapReduce job
tracker(s)
http://localhost:50060/ - web UI for task tracker(s)
http://localhost:50070/ - web UI for HDFS name
node(s)

Single-Node Cluster(cont)
9
/etc/hosts
SSH access
Configuration
<HADOOP_INSTALL>/conf/masters
master
<HADOOP_INSTALL>/conf/slaves
master
slave
anotherslave01
anotherslave02
anotherslave03
<HADOOP_INSTALL>/conf/core-site.xml
<value>hdfs://master:54310</value>
<HADOOP_INSTALL>/conf/mapred-site.xml
<HADOOP_INSTALL>/conf/hdfs-site.xml

Multi-Node Cluster
10
Make a large cluster smaller by taking out a bunch of
nodes simultaneously. How can this be done?
Create a file excludes
slave97
slave98
slave99
Add configuration in <HADOOP_INSTALL>/conf/hadoop-
site.xml
<property>
<name>dfs.hosts.exclude</name>
<value>excludes</value>
</property>
<HADOOP_INSTALL>/bin/hadoop dfsadmin -refreshNodes
Decommission
11
NameNode backup
NameNode shutdown
DataNode shutdown
Add DataNode dynamically
Remove DataNode dynamically(Decommission?)
How to tune file/block size?
Big data testing
Issues
12
Cloud Storage System Architecture
HDFS
Client
HDFS
DataNode
HDFS
NameNode
HDFS
DataNode

iSCSI
Target
iSCSI
Initiator
VM
Volume
DMS
13
Read Flow
HDFS
Client
HDFS
DataNode
HDFS
NameNode
iSCSI
Target
iSCSI
Initiator
VM
Volume
I.1 I.2
I.4
1
4
5
6
I.5
I.3 I.4
DMS
2
3
14
Write Flow
HDFS
DataNode 1
HDFS
NameNode
1
4
5
6
HDFS
DataNode 2
7
VM (Domain-U)
HDFS
Client
iSCSI
Target
iSCSI
Initiator
VM
Volume
I.1 I.2
I.4
I.5
I.3 I.4 9
8
10
7.1 8.2
11
12
DMS
2
3

Das könnte Ihnen auch gefallen

Introduction To HDFS
Dokument21 Seiten
Introduction To HDFS
Shankar Ganesh
Noch keine Bewertungen
Apex Institute of Technology: Big Data Security
Dokument30 Seiten
Apex Institute of Technology: Big Data Security
So do so
Noch keine Bewertungen
Map Reduce
Dokument38 Seiten
Map Reduce
Fikret Toydemir
Noch keine Bewertungen
Principles of Operating Systems and Its Applications
Dokument140 Seiten
Principles of Operating Systems and Its Applications
ray bryant
100% (1)
INET ZERO - JNCIE-SP Workbook v1.0 Sample
Dokument19 Seiten
INET ZERO - JNCIE-SP Workbook v1.0 Sample
Alfredo Claros
Noch keine Bewertungen
Viasat Linkstar Modem DVB s2 Vsat
Dokument4 Seiten
Viasat Linkstar Modem DVB s2 Vsat
Nasreddine Baouche
Noch keine Bewertungen
XTRM Trill Vs SPB
Dokument31 Seiten
XTRM Trill Vs SPB
Larry Popescu
Noch keine Bewertungen
Introduction To HDFS
Dokument20 Seiten
Introduction To HDFS
Samuel temesgen
Noch keine Bewertungen
Hadoop File Complte
Dokument18 Seiten
Hadoop File Complte
rashant
Noch keine Bewertungen
Bda Manual
Dokument80 Seiten
Bda Manual
bhuvans80_m
Noch keine Bewertungen
Bda Practical
Dokument62 Seiten
Bda Practical
vijay kholia
Noch keine Bewertungen
04 Hadoop Setup 05 CLI 06 Running MapRed-1
Dokument42 Seiten
04 Hadoop Setup 05 CLI 06 Running MapRed-1
Manjula Annamalai
Noch keine Bewertungen
Big Data Lab Manual and Syllabus
Dokument71 Seiten
Big Data Lab Manual and Syllabus
startechbyjus123
Noch keine Bewertungen
Data Storage Data Processing: Hadoop Distributed File System (HDFS) Mapreduce
Dokument35 Seiten
Data Storage Data Processing: Hadoop Distributed File System (HDFS) Mapreduce
SUDHEER REDDY
Noch keine Bewertungen
BDA Lab Manual-1
Dokument60 Seiten
BDA Lab Manual-1
pavan chittala
Noch keine Bewertungen
How To Install Hadoop On Ubuntu 18
Dokument15 Seiten
How To Install Hadoop On Ubuntu 18
Koné Mikpan Hervé
Noch keine Bewertungen
DAN Lab ManuaL
Dokument53 Seiten
DAN Lab ManuaL
SARANYA A
Noch keine Bewertungen
Big Data Manual Ai
Dokument33 Seiten
Big Data Manual Ai
smitcse2021
Noch keine Bewertungen
Experiment No 1
Dokument13 Seiten
Experiment No 1
Aman Jain
Noch keine Bewertungen
Hadoop Tutorial
Dokument30 Seiten
Hadoop Tutorial
Hasan
Noch keine Bewertungen
Module - 4-2
Dokument32 Seiten
Module - 4-2
Raj Kumar
Noch keine Bewertungen
04 Hadoop Setup 05 CLI 06 Running MapRed
Dokument30 Seiten
04 Hadoop Setup 05 CLI 06 Running MapRed
Manjula Annamalai
Noch keine Bewertungen
HDFS
Dokument6 Seiten
HDFS
Siddharth Bubbul
100% (2)
Hadoop Installation
Dokument10 Seiten
Hadoop Installation
vishnu
Noch keine Bewertungen
Unit No. 7
Dokument45 Seiten
Unit No. 7
vishal phule
Noch keine Bewertungen
SEN-762 Advanced Big Data Analytics
Dokument39 Seiten
SEN-762 Advanced Big Data Analytics
بالیراجپوت
Noch keine Bewertungen
AICTE SPONSORED Faculty Development Programme (FDP) On "DATA SCIENCE RESEARCH AND BIG DATA ANALYTICS"
Dokument28 Seiten
AICTE SPONSORED Faculty Development Programme (FDP) On "DATA SCIENCE RESEARCH AND BIG DATA ANALYTICS"
D.KESAVARAJA
Noch keine Bewertungen
Big Data File
Dokument16 Seiten
Big Data File
Arnav Shrivastava
Noch keine Bewertungen
DevOps Pre-Requisites-as PDF
Dokument268 Seiten
DevOps Pre-Requisites-as PDF
puramganesh
Noch keine Bewertungen
BIG DATA WITH HADOOP, HDFS & MAPREDUCE (Hands On Training)
Dokument35 Seiten
BIG DATA WITH HADOOP, HDFS & MAPREDUCE (Hands On Training)
D.KESAVARAJA
Noch keine Bewertungen
TPhadoop
Dokument27 Seiten
TPhadoop
Abdou garba Hamissou
Noch keine Bewertungen
There Are Two Ways To Install Hadoop in Ubantu
Dokument10 Seiten
There Are Two Ways To Install Hadoop in Ubantu
Srinivasa Rao T
Noch keine Bewertungen
Hadoop Administrator Training - Lab Hand Book
Dokument12 Seiten
Hadoop Administrator Training - Lab Hand Book
debkrc
Noch keine Bewertungen
Hadoop Installation Steps
Dokument6 Seiten
Hadoop Installation Steps
Yashi Shekhar
100% (1)
BDA Practical
Dokument38 Seiten
BDA Practical
Jatin Mathur
Noch keine Bewertungen
High Availability Low Dollar Clustered Storage: Simon Karpen
Dokument24 Seiten
High Availability Low Dollar Clustered Storage: Simon Karpen
Simon Karpen
Noch keine Bewertungen
Rhel 6 Bind DNS Howto
Dokument8 Seiten
Rhel 6 Bind DNS Howto
raj2118
Noch keine Bewertungen
Module 1 Ppts Edited PDF
Dokument103 Seiten
Module 1 Ppts Edited PDF
pradeepkraj22
Noch keine Bewertungen
Hadoop: Fasilkom/Pusilkom UI (Credit: Samuel Louvan)
Dokument44 Seiten
Hadoop: Fasilkom/Pusilkom UI (Credit: Samuel Louvan)
Johan Rizky Aditya
Noch keine Bewertungen
Experiment No 1
Dokument15 Seiten
Experiment No 1
ZEESHAN KHAN
Noch keine Bewertungen
Chapter N2 HDFS The Hadoop Distributed File System - Matrix
Dokument37 Seiten
Chapter N2 HDFS The Hadoop Distributed File System - Matrix
Komal
Noch keine Bewertungen
Hadoop Shell Commands
Dokument63 Seiten
Hadoop Shell Commands
srikant4u4670
100% (1)
BDA Lab Assignment 1 PDF
Dokument20 Seiten
BDA Lab Assignment 1 PDF
parth shah
Noch keine Bewertungen
Hands-On Hadoop Tutorial
Dokument13 Seiten
Hands-On Hadoop Tutorial
Jomy Antony
100% (1)
Big-Data Computing: Hadoop Distributed File System: B. Ramamurthy
Dokument45 Seiten
Big-Data Computing: Hadoop Distributed File System: B. Ramamurthy
Harsh Patel
Noch keine Bewertungen
Hadoop Tutorial
Dokument13 Seiten
Hadoop Tutorial
sindhu sree
Noch keine Bewertungen
Module-2 PPT-1
Dokument126 Seiten
Module-2 PPT-1
Lahari bilimale
Noch keine Bewertungen
Web Server
Dokument65 Seiten
Web Server
antr
Noch keine Bewertungen
Cloudera Install
Dokument30 Seiten
Cloudera Install
chetana tukkoji
Noch keine Bewertungen
Bda A2
Dokument17 Seiten
Bda A2
Deepti Agrawal
Noch keine Bewertungen
A New Way To Store and Analyze Data: Presented By:: Harsha Jain
Dokument20 Seiten
A New Way To Store and Analyze Data: Presented By:: Harsha Jain
C. Valeriu
Noch keine Bewertungen
Part 03 Intro To Hadoop
Dokument22 Seiten
Part 03 Intro To Hadoop
Sahera Shabnam
Noch keine Bewertungen
Installing Multi Node Cluster - Handbook 2.0
Dokument2 Seiten
Installing Multi Node Cluster - Handbook 2.0
aadifx
Noch keine Bewertungen
Distributed Filesystems Review
Dokument30 Seiten
Distributed Filesystems Review
fmoreira9650
Noch keine Bewertungen
BDA Lab Assignment 2
Dokument18 Seiten
BDA Lab Assignment 2
parth shah
Noch keine Bewertungen
Hadoop Installation
Dokument11 Seiten
Hadoop Installation
Alekhya Abbaraju
Noch keine Bewertungen
Enabling R On Hadoop: July 11, 2013
Dokument29 Seiten
Enabling R On Hadoop: July 11, 2013
manishsg
Noch keine Bewertungen
Hadoop Distributed File System Basics
Dokument30 Seiten
Hadoop Distributed File System Basics
ashuvasuma
Noch keine Bewertungen
Business Intelligence & Big Data Analytics-CSE3124Y
Dokument26 Seiten
Business Intelligence & Big Data Analytics-CSE3124Y
splokbov
Noch keine Bewertungen
Hadoop Administration
Dokument97 Seiten
Hadoop Administration
arjun.ec633
Noch keine Bewertungen
Hadoop Building Blocks
Dokument30 Seiten
Hadoop Building Blocks
Kavya
Noch keine Bewertungen
Unit 2
Dokument53 Seiten
Unit 2
ahojg
Noch keine Bewertungen
Apache Hadoop: Developer(s) Stable Release Preview Release
Dokument5 Seiten
Apache Hadoop: Developer(s) Stable Release Preview Release
nitesh_mps
Noch keine Bewertungen
Quick Configuration of Openldap and Kerberos In Linux and Authenicating Linux to Active Directory
Von Everand
Quick Configuration of Openldap and Kerberos In Linux and Authenicating Linux to Active Directory
Dr. Hidaia Mahmood Alassouli
Noch keine Bewertungen
Clock Class PDF
Dokument16 Seiten
Clock Class PDF
Ravi
Noch keine Bewertungen
2020 11 14 - Log
Dokument2 Seiten
2020 11 14 - Log
Jumriyati Masa
Noch keine Bewertungen
Bandwidth Limiting With The PfSense Limiter
Dokument2 Seiten
Bandwidth Limiting With The PfSense Limiter
Aung Kyaw Thu
Noch keine Bewertungen
GP3600 Olt PDF
Dokument6 Seiten
GP3600 Olt PDF
Jose Vela
Noch keine Bewertungen
Krishan Saluja Lecture - 1 (2022-2023) Inherent Vulernabilities in Internet Architecture
Dokument27 Seiten
Krishan Saluja Lecture - 1 (2022-2023) Inherent Vulernabilities in Internet Architecture
Anshul Singh
Noch keine Bewertungen
ACL - SquidAcl - Squid Web Proxy Wiki
Dokument16 Seiten
ACL - SquidAcl - Squid Web Proxy Wiki
calitzin1
Noch keine Bewertungen
SFTP Adapter Guide SCC
Dokument19 Seiten
SFTP Adapter Guide SCC
Ernesto Heredia
Noch keine Bewertungen
Chapter 1: Introduction To Scaling Networks
Dokument33 Seiten
Chapter 1: Introduction To Scaling Networks
Nah Márquez
Noch keine Bewertungen
Assignment AJP
Dokument3 Seiten
Assignment AJP
Somesh Shewalkar
Noch keine Bewertungen
Networking Exam Paper March 2012 - Final
Dokument4 Seiten
Networking Exam Paper March 2012 - Final
Cedric Cedric
Noch keine Bewertungen
M842 4 1-40G-LW A4 E Screen
Dokument14 Seiten
M842 4 1-40G-LW A4 E Screen
riky
Noch keine Bewertungen
CRT 8500
Dokument151 Seiten
CRT 8500
Sandra Milena Viracacha
Noch keine Bewertungen
Oracle Communications Performance Intelligence Center 10.2 Feature Guide
Dokument92 Seiten
Oracle Communications Performance Intelligence Center 10.2 Feature Guide
fouad boutat
Noch keine Bewertungen
Telecommunications Director
Dokument2 Seiten
Telecommunications Director
api-76849554
Noch keine Bewertungen
OEA000200 LTE Protocols and Procedures ISSUE 1.01
Dokument279 Seiten
OEA000200 LTE Protocols and Procedures ISSUE 1.01
engluisteleco
Noch keine Bewertungen
Abis Over IP Configuration Locally From The BTS Side
Dokument12 Seiten
Abis Over IP Configuration Locally From The BTS Side
ehab-eng
Noch keine Bewertungen
Configuring A Squid Server To Authenticate Off Active Directory
Dokument6 Seiten
Configuring A Squid Server To Authenticate Off Active Directory
Shiv Shankar
Noch keine Bewertungen
John Lander C. Poligrates: Network Engineer
Dokument3 Seiten
John Lander C. Poligrates: Network Engineer
Veeji Swamy
Noch keine Bewertungen
Do Rift PDF
Dokument239 Seiten
Do Rift PDF
Mohamad Siblini
Noch keine Bewertungen
Pci Dss Compliance On Aws
Dokument29 Seiten
Pci Dss Compliance On Aws
Asd
Noch keine Bewertungen
9.2.1.6 Lab - Using Wireshark To Observe The TCP 3-Way Handshake
Dokument8 Seiten
9.2.1.6 Lab - Using Wireshark To Observe The TCP 3-Way Handshake
alief
Noch keine Bewertungen
IT Essentials v5 Chapter 6 Exam Answers
Dokument6 Seiten
IT Essentials v5 Chapter 6 Exam Answers
asdasda
Noch keine Bewertungen
E82DD5F8-4172-45FD-A38D-60DE670309AE
Dokument6 Seiten
E82DD5F8-4172-45FD-A38D-60DE670309AE
Sabawoonz fkz
Noch keine Bewertungen
Cisco Router Configuration Files, Startup-Config, Running-Config, Start-Up Configuration File, Running Configuration File
Dokument2 Seiten
Cisco Router Configuration Files, Startup-Config, Running-Config, Start-Up Configuration File, Running Configuration File
Muhammad Imran
Noch keine Bewertungen
RG-WALL 1600 Next-Generation Firewall Series Datasheet - 2018.12.28
Dokument8 Seiten
RG-WALL 1600 Next-Generation Firewall Series Datasheet - 2018.12.28
User 1890
Noch keine Bewertungen
Huawei Switch IEEE 1588v2 Technology White Paper
Dokument25 Seiten
Huawei Switch IEEE 1588v2 Technology White Paper
Adrian Marius
Noch keine Bewertungen