Willkommen bei Scribd!

Hadoop Tutorial

Hochgeladen von

0% fanden dieses Dokument nützlich (0 Abstimmungen)

80 Ansichten13 Seiten

Hadoop uses HDFS, a distributed file system based on gfs, as its shared filesystem. Relative paths are from / usr / your usr id Once you use the dfs (put something in it) hadoop currently configured with centurion064 as the master node.

Originalbeschreibung:

Originaltitel

HadoopTutorial.ppt

Copyright

Verfügbare Formate

PPT, PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

Copyright:

Attribution Non-Commercial (BY-NC)

Verfügbare Formate

Als PPT, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

0% fanden dieses Dokument nützlich (0 Abstimmungen)

80 Ansichten13 Seiten

Hadoop Tutorial

Hochgeladen von

becitratul

Copyright:

Attribution Non-Commercial (BY-NC)

Verfügbare Formate

Als PPT, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 13

Im Dokument suchen

Hands-On Hadoop Tutorial

Chris Sosa Wolfgang Richter May 23, 2008

General Information

Hadoop uses HDFS, a distributed file system based on GFS, as its shared filesystem

HDFS architecture divides files into large chunks (~64MB) distributed across data servers
HDFS has a global namespace

General Information (contd)

Provided a script for your convenience

Run source /localtmp/hadoop/setupVars from centurtion064 Changes all uses of {somePath}/command to just command

Goto http://www.cs.virginia.edu/~cbs6n/hadoop for web access. These slides and more information are also available there. Once you use the DFS (put something in it), relative paths are from /usr/{your usr id}. E.G. if your id is tb28 your home dir is /usr/tb28

Master Node

Hadoop currently configured with centurion064 as the master node Master node
Keeps track of namespace and metadata about items Keeps track of MapReduce jobs in the system

Slave Nodes

Centurion064 also acts as a slave node Slave nodes

Manage blocks of data sent from master node In terms of GFS, these are the chunkservers

Currently centurion060 is also another slave node

Hadoop Paths

Hadoop is locally installed on each machine

Installed location is in /localtmp/hadoop/hadoop0.15.3 Slave nodes store their data in /localtmp/hadoop/hadoop-dfs (this is automatically created by the DFS) /localtmp/hadoop is owned by group gbg (someone in this group must administer this or a cs admin)

Files are divided into 64 MB chunks (this is configurable)

Starting / Stopping Hadoop

For the purposes of this tutorial, we assume you have run the setupVars from earlier

start-all.sh starts all slave nodes and master node stop-all.sh stops all slave nodes and master node

Using HDFS (1/2)

hadoop dfs

[-ls <path>] [-du <path>] [-cp <src> <dst>] [-rm <path>] [-put <localsrc> <dst>] [-copyFromLocal <localsrc> <dst>] [-moveFromLocal <localsrc> <dst>] [-get [-crc] <src> <localdst>] [-cat <src>] [-copyToLocal [-crc] <src> <localdst>] [-moveToLocal [-crc] <src> <localdst>] [-mkdir <path>] [-touchz <path>] [-test -[ezd] <path>] [-stat [format] <path>] [-help [cmd]]

Using HDFS (2/2)

Want to reformat? Easy

hadoop namenode format

Basically we see most commands look similar

hadoop some command options If you just type hadoop you get all possible commands (including undocumented ones hooray)

To Add Another Slave

This adds another data node / job execution site to the pool
Hadoop dynamically uses filesystem underneath it If more space is available on the HDD, HDFS will try to use it when it needs to In centurion064:/localtmp/hadoop/hadoop0.15.3/conf Copy code installation dir to newMachine:/localtmp/hadoop/hadoop-0.15.3 (very small) Restart Hadoop

Modify the slaves file

Configure Hadoop

Can configure in {$installation dir}/conf

hadoop-default.xml for global hadoop-site.xml for site specific (overrides global)

Thats it for Configuration!

Real-time Access

Das könnte Ihnen auch gefallen

Windows Server 2008 For Dummies
Von Everand
Windows Server 2008 For Dummies
Ed Tittel
Noch keine Bewertungen
Cloudera A Complete Guide - 2019 Edition
Von Everand
Cloudera A Complete Guide - 2019 Edition
Gerardus Blokdyk
Noch keine Bewertungen
New Office 365
Dokument14 Seiten
New Office 365
Yusuf Kusuma
Noch keine Bewertungen
Why Nutanix Acropolis Hypervisor
Dokument21 Seiten
Why Nutanix Acropolis Hypervisor
Rishab Sachdeva
Noch keine Bewertungen
Design and Capacity Planning of Next Generation Network
Dokument7 Seiten
Design and Capacity Planning of Next Generation Network
Khoe Pham
Noch keine Bewertungen
Hadoop Ecosystem
Dokument55 Seiten
Hadoop Ecosystem
nehal
Noch keine Bewertungen
Using A SonicWALL NSA As WLAN Controller
Dokument5 Seiten
Using A SonicWALL NSA As WLAN Controller
udkv
Noch keine Bewertungen
Installing Oracle Developer 6i On Ubuntu
Dokument2 Seiten
Installing Oracle Developer 6i On Ubuntu
lamxung123
Noch keine Bewertungen
SonicWALL PRO 4060 Getting Started Guide
Dokument30 Seiten
SonicWALL PRO 4060 Getting Started Guide
ogr209
Noch keine Bewertungen
Panasonic KX-NS3000 System Specification
Dokument6 Seiten
Panasonic KX-NS3000 System Specification
Achmad Baihaki
Noch keine Bewertungen
Bigdata PDF
Dokument76 Seiten
Bigdata PDF
Indra Wijaya
Noch keine Bewertungen
Hadoop Framework
Dokument22 Seiten
Hadoop Framework
Fahad Tariq
Noch keine Bewertungen
HDFS Architecture
Dokument47 Seiten
HDFS Architecture
krishan Goyal
Noch keine Bewertungen
Hadoop Ecosystem
Dokument16 Seiten
Hadoop Ecosystem
poojan thakkar
Noch keine Bewertungen
Hadoop I/O: Jaeyong Choi
Dokument36 Seiten
Hadoop I/O: Jaeyong Choi
Manognya Reddy
Noch keine Bewertungen
AB-INITIO Developer: Learning Made Easy!
Dokument4 Seiten
AB-INITIO Developer: Learning Made Easy!
yerrasudhakar
Noch keine Bewertungen
2 HDFS Commands
Dokument7 Seiten
2 HDFS Commands
VIPUL GUPTA
Noch keine Bewertungen
Bigdata
Dokument12 Seiten
Bigdata
swapnillsai
Noch keine Bewertungen
Rational Rose Manual
Dokument34 Seiten
Rational Rose Manual
Vivy Fon
Noch keine Bewertungen
Nifi Integration
Dokument15 Seiten
Nifi Integration
cutyre
100% (1)
Tutorial Installasi Hadoop PDF
Dokument10 Seiten
Tutorial Installasi Hadoop PDF
Erwin Kurniawan
Noch keine Bewertungen
Hadoop Admin Download Syllabus PDF
Dokument4 Seiten
Hadoop Admin Download Syllabus PDF
shubham phulari
Noch keine Bewertungen
BDE ManagedHadoopDataLakes PAVLIK PDF
Dokument10 Seiten
BDE ManagedHadoopDataLakes PAVLIK PDF
Raj
Noch keine Bewertungen
Ab Initio Tutorials
Dokument1 Seite
Ab Initio Tutorials
j_jeevan_j
Noch keine Bewertungen
Qlik Sense Course Content
Dokument3 Seiten
Qlik Sense Course Content
Akul Kumar Ardhala
Noch keine Bewertungen
Hadoop Admin Interview Question and Answers
Dokument5 Seiten
Hadoop Admin Interview Question and Answers
Vivek Kushwaha
Noch keine Bewertungen
Nutanix Datasheet Standard
Dokument2 Seiten
Nutanix Datasheet Standard
Demodx Demodxz
Noch keine Bewertungen
Ubuntu Desktop Installation: Ubuntu Desktop Edition Brings All The Advantages of Ubuntu To Your Desktop
Dokument14 Seiten
Ubuntu Desktop Installation: Ubuntu Desktop Edition Brings All The Advantages of Ubuntu To Your Desktop
Arun Kumar
Noch keine Bewertungen
LinuxCBT EL-6 Edition Notes PDF
Dokument38 Seiten
LinuxCBT EL-6 Edition Notes PDF
draja123
Noch keine Bewertungen
Apache Kafka Installation: Step 1: Download The Code
Dokument3 Seiten
Apache Kafka Installation: Step 1: Download The Code
surendra yandra
Noch keine Bewertungen
Processes: Process Concept Process Scheduling Operation On Processes Cooperating Processes Interprocess Communication
Dokument27 Seiten
Processes: Process Concept Process Scheduling Operation On Processes Cooperating Processes Interprocess Communication
Maha Ibrahim
Noch keine Bewertungen
Abinitio
Dokument1 Seite
Abinitio
Sandeep Kumar
Noch keine Bewertungen
Introduction To Datastage
Dokument24 Seiten
Introduction To Datastage
Giorgio Jacchini
Noch keine Bewertungen
Informatica Training
Dokument21 Seiten
Informatica Training
Gaurav Goel
Noch keine Bewertungen
Bidirectional Data Import To Hive Using SQOOP
Dokument6 Seiten
Bidirectional Data Import To Hive Using SQOOP
International Journal of Innovative Science and Research Technology
Noch keine Bewertungen
Abinitio Online Training: Chapter - 1 À Ab Initio Introduction
Dokument7 Seiten
Abinitio Online Training: Chapter - 1 À Ab Initio Introduction
onlineitguru
Noch keine Bewertungen
Spark Project Report: Streaming
Dokument22 Seiten
Spark Project Report: Streaming
testyy testt
Noch keine Bewertungen
Hadoop Release 2.0
Dokument54 Seiten
Hadoop Release 2.0
Prashant Sharma
Noch keine Bewertungen
HADOOP Based Recommendation Algorithm For Micro-Video URL
Dokument9 Seiten
HADOOP Based Recommendation Algorithm For Micro-Video URL
dbpublications
Noch keine Bewertungen
Srikanth Hadoop
Dokument4 Seiten
Srikanth Hadoop
Karthick Thoppan
Noch keine Bewertungen
Cloudera Administrator Training For Apache Hadoop PDF
Dokument2 Seiten
Cloudera Administrator Training For Apache Hadoop PDF
Rocky
50% (2)
Edureka Hadoop Admin Assignment For Module 1
Dokument3 Seiten
Edureka Hadoop Admin Assignment For Module 1
madhan
Noch keine Bewertungen
Hadoop Cluster - Architecture, Core Components
Dokument9 Seiten
Hadoop Cluster - Architecture, Core Components
Doubt bro
100% (1)
Nimisha Patel
Dokument7 Seiten
Nimisha Patel
VENKATARAO Y
Noch keine Bewertungen
HBase Interview Questions
Dokument12 Seiten
HBase Interview Questions
pooh06
Noch keine Bewertungen
Oracle To Azure PostgreSQL Migration Cookbook
Dokument13 Seiten
Oracle To Azure PostgreSQL Migration Cookbook
Erik Castro
Noch keine Bewertungen
Gautham 320455 Resume
Dokument2 Seiten
Gautham 320455 Resume
karthik141091
Noch keine Bewertungen
Map Reduce With Hadoop:: Presented by ANIVESHA-126 ARITRA-128 RIA-142 Shashvat - 150 SHEKHAR-151
Dokument9 Seiten
Map Reduce With Hadoop:: Presented by ANIVESHA-126 ARITRA-128 RIA-142 Shashvat - 150 SHEKHAR-151
Aritra Banerjee
100% (1)
Hadoop Vs MongoDB
Dokument11 Seiten
Hadoop Vs MongoDB
Mafrur Rischan
Noch keine Bewertungen
BDA Experiment 14 PDF
Dokument77 Seiten
BDA Experiment 14 PDF
Nikita Ichale
Noch keine Bewertungen
File Formats in Big Data
Dokument13 Seiten
File Formats in Big Data
Meghna Sharma
Noch keine Bewertungen
©2010, Cognizant Technology Solutions Confidential
Dokument31 Seiten
©2010, Cognizant Technology Solutions Confidential
Namrata Mukherjee
Noch keine Bewertungen
My Resume Microsoft Word Format 2020
Dokument4 Seiten
My Resume Microsoft Word Format 2020
manojpanwar
Noch keine Bewertungen
RDBMS Pakages
Dokument6 Seiten
RDBMS Pakages
Dikshita Jain
Noch keine Bewertungen
Nutanix
Dokument8 Seiten
Nutanix
gopihc
Noch keine Bewertungen
Datastage Enterprise Edition: Different Version of Datastage
Dokument5 Seiten
Datastage Enterprise Edition: Different Version of Datastage
Shailesh Chavda
Noch keine Bewertungen
Abinitio Online Training
Dokument6 Seiten
Abinitio Online Training
Agalya sabareeswaran
Noch keine Bewertungen
Terminal: The Basics: General Information
Dokument7 Seiten
Terminal: The Basics: General Information
joannaa_castillo
Noch keine Bewertungen
Data Warehousing AND Data Mining
Dokument169 Seiten
Data Warehousing AND Data Mining
suganya004
Noch keine Bewertungen
IBM BigFix A Complete Guide - 2020 Edition
Von Everand
IBM BigFix A Complete Guide - 2020 Edition
Gerardus Blokdyk
Noch keine Bewertungen
Mixed Up Monsters
Dokument33 Seiten
Mixed Up Monsters
jane
Noch keine Bewertungen
The Homework Song Funny
Dokument5 Seiten
The Homework Song Funny
ers57e8s
100% (1)
OZO Player SDK User Guide 1.2.1
Dokument16 Seiten
OZO Player SDK User Guide 1.2.1
aryan9411
Noch keine Bewertungen
DPSD Project
Dokument30 Seiten
DPSD Project
Sri Nidhi
Noch keine Bewertungen
Computing of Test Statistic On Population Mean
Dokument36 Seiten
Computing of Test Statistic On Population Mean
Kristoffer Rañola
Noch keine Bewertungen
Log Building News - Issue No. 76
Dokument32 Seiten
Log Building News - Issue No. 76
ursind
Noch keine Bewertungen
Principals' Leadership Styles and Student Academic Performance in Secondary Schools in Ekiti State, Nigeria
Dokument12 Seiten
Principals' Leadership Styles and Student Academic Performance in Secondary Schools in Ekiti State, Nigeria
iqra
Noch keine Bewertungen
Arnold Ventures Letter To Congressional Social Determinants of Health Caucus
Dokument7 Seiten
Arnold Ventures Letter To Congressional Social Determinants of Health Caucus
Arnold Ventures
Noch keine Bewertungen
MASONRY
Dokument8 Seiten
MASONRY
Jowelyn Maderal
Noch keine Bewertungen
LTE Networks Engineering Track Syllabus Overview - 23 - 24
Dokument4 Seiten
LTE Networks Engineering Track Syllabus Overview - 23 - 24
Mohamed Sami
Noch keine Bewertungen
SSGC-RSGLEG Draft Study On The Applicability of IAL To Cyber Threats Against Civil Aviation
Dokument41 Seiten
SSGC-RSGLEG Draft Study On The Applicability of IAL To Cyber Threats Against Civil Aviation
Prachita Agrawal
Noch keine Bewertungen
C - Amarjit Singh So Bhura Singh
Dokument5 Seiten
C - Amarjit Singh So Bhura Singh
Rohit Jindal
Noch keine Bewertungen
Test Science
Dokument2 Seiten
Test Science
jam sy
Noch keine Bewertungen
Environmental Economics Pollution Control: Mrinal Kanti Dutta
Dokument253 Seiten
Environmental Economics Pollution Control: Mrinal Kanti Dutta
shubham
Noch keine Bewertungen
Chapter 1 Classnotes
Dokument35 Seiten
Chapter 1 Classnotes
Allison Caso
Noch keine Bewertungen
Functions in C++
Dokument23 Seiten
Functions in C++
Abhishek Modi
Noch keine Bewertungen
Ron Kangas - Ioan
Dokument11 Seiten
Ron Kangas - Ioan
Bogdan Sopterean
Noch keine Bewertungen
Organizational Conflict
Dokument22 Seiten
Organizational Conflict
Tannya Alexandra
Noch keine Bewertungen
.Urp 203 Note 2022 - 1642405559000
Dokument6 Seiten
.Urp 203 Note 2022 - 1642405559000
Farouk Saleh
Noch keine Bewertungen
Assignment#10 Global Strategy and The Multinational Corporation
Dokument1 Seite
Assignment#10 Global Strategy and The Multinational Corporation
Anjaneth A. Villegas
Noch keine Bewertungen
Manual s10 PDF
Dokument402 Seiten
Manual s10 PDF
Libros18
Noch keine Bewertungen
2SB817 - 2SD1047 PDF
Dokument4 Seiten
2SB817 - 2SD1047 PDF
isaiasva
Noch keine Bewertungen
RSA - Brand - Guidelines - 2019 2
Dokument79 Seiten
RSA - Brand - Guidelines - 2019 2
Gigi's Delight
Noch keine Bewertungen
Dalasa Jibat Mijena
Dokument24 Seiten
Dalasa Jibat Mijena
Belex Man
Noch keine Bewertungen
CAT 320D2: Hydraulic Excavator
Dokument5 Seiten
CAT 320D2: Hydraulic Excavator
hydeer 13
Noch keine Bewertungen
Career Essay 1
Dokument2 Seiten
Career Essay 1
api-572592063
Noch keine Bewertungen
MRBR ATR 72 Rev18
Dokument424 Seiten
MRBR ATR 72 Rev18
Juan Forero Ortiz
Noch keine Bewertungen
AlpaGasus: How To Train LLMs With Less Data and More Accuracy
Dokument6 Seiten
AlpaGasus: How To Train LLMs With Less Data and More Accuracy
My Social
Noch keine Bewertungen
Bana Linga
Dokument9 Seiten
Bana Linga
Nimai Pandita Raja Dasa
Noch keine Bewertungen
Study 107 - The Doctrine of Salvation - Part 8
Dokument2 Seiten
Study 107 - The Doctrine of Salvation - Part 8
Jason Myers
Noch keine Bewertungen