Willkommen bei Scribd!

Messengers 3 1

Hochgeladen von

0% fanden dieses Dokument nützlich (0 Abstimmungen)

18 Ansichten13 Seiten

The document discusses using multiple messenger daemon processes on a single host by binding each daemon to a specific CPU. Binding daemons allows studying the effects of data and computation distribution on a finer processor/core level. This enables exploration of multi-level data distribution patterns that assign data to hosts and CPUs differently, like block distribution for hosts but cyclic for CPUs.

Originalbeschreibung:

Copyright

Verfügbare Formate

PPT, PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

Copyright:

Attribution Non-Commercial (BY-NC)

Verfügbare Formate

Als PPT, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

0% fanden dieses Dokument nützlich (0 Abstimmungen)

18 Ansichten13 Seiten

Messengers 3 1

Hochgeladen von

tariqkhan21

Copyright:

Attribution Non-Commercial (BY-NC)

Verfügbare Formate

Als PPT, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 13

Im Dokument suchen

MESSENGERS 3.

1 –
multiple daemon processes
on one host
Physical node
• darwin.ics.uci.edu
• darwin.ics.uci.edu:0
• % messengers –n darwin.ics.uci.edu:0
• Binds the daemon process on CPU 0 on darwin
• Can comment out the code to bind daemon and
multiple daemon processes can still run on one
host
Daemon binding to a CPU ?
• Benefit:
– Extend the data-CPU affinity to the processor/core
level – might speed up the program if accessing local
cache is significantly faster than accessing shared
cache or memory and if the OS is not smart enough in
scheduling (more later)
• Drawback:
– Multiple threads in the same daemon are restricted to
one CPU
• Whether bound or not, can utilize multiple CPUs
Bind daemon
• int bind_daemon(unsigned int cpu_id) // for Solaris
• {
• int ret;

• ret = processor_bind(P_PID, getpid(), cpu_id, NULL)

• return ret;
• }

• int bind_daemon(unsigned int cpu_id) // for Linux

• {
• int ret = 0;
• cpu_set_t mask;
• unsigned int len = sizeof(mask);
•
• CPU_ZERO(&mask);
• CPU_SET(cpu_id, &mask);
• ret = sched_setaffinity(0, len, &mask);
• return ret;
• }
– [ the Linux approach seems to be more flexible ]
Inter-daemon communication on
the same host
• Still uses socket
• Don’t know whether there is optimization
Clusters
• hermod, hayes – one CPU per host
• Solaris 10, Intel – 2 CPUs per host –
always busy
• gamera (Solaris 9, UltraSparc) - 2 CPUs
per host
• NACS gradea – 2 CPUs per host
Performance running Crout on
dual-processor gamera
1 CPU 2 CPU gamera+rodan

• [2000 1 1] 38 30 29
• [3000 1 1] 130 104 101
• [3000 2 10] 131 87 109 ?!
• [2000 2 1] 38 183 !!!???

• [2000 2 1] on non-dedicated rodan 28/29 165

• [2000 2 1] on rodan and gamera – 3.1 228/235/211
• – 3.0.8 213
• – 1.2.04 209
Performance running Crout on
uni-processor uni-core hayes01
(Linux Pentium hyperthreading)
1 CPU 2 CPU hayes01+hayes02
• [3000 1 1] 48 39 38
• [3000 1 10] 48 44 41
• [3000 2 1] 48 447 4154
• [3000 2 10] 49 63 320
• Seems to suggest that given the right data
distribution, the new MESSENGERS can take
advantage of Simultaneous Multi-threading (SMT)
Working on …
• Verifying that logical nodes, physical nodes are
where they should be
• Investigating the details about CPU IDs –
referring to virtual or physical CPUs? How can
one tell which CPU (core) is on the same
socket?
• Rough edges in code: processor_bind(),
IP+CPU_ID, …
• Performance comparison: bound vs unbound
daemons, …
Daemon binding enables
data distribution study
on a finer level
• Computation and data distribution is about
fixing computation and data on a physical
node (during certain period during
program execution)
• If computation hops from one node to
another beyond programmer control,
impossible to study the effect of
computation/data allocation
Daemon binding enables
data distribution study
on a finer level
• Binding a daemon to a processor/core
allows one to study data placement on the
processor/core level
• Effect more pronounced on multi-
processor (i.e. socket) host than on multi-
core host
• [multi-core vs many-core]
Multi-level data distribution
• Just an immature idea of mine
• One data distribution pattern (e.g. block)
on the host level, another (e.g. cyclic) on
the processor/core level
Multi-level data distribution
• Block 1 2 3 4 5 6 7 8 | 9 10 11 12 13 14 15 16
• Cyclic 1 3 5 7 9 11 13 15 | 2 4 6 8 10 12 14 16
• Blk-cyclic(2) 1 2 5 6 9 10 13 14 | 3 4 7 8 11 12 15 16

• Blk on host 1 2 3 4 5 6 7 8 | 9 10 11 12 13 14 15 16
• Cyclic on CPU 1 3 5 7 | 2 4 6 8 | 9 11 13 15 | 10 12 14 16

• Cyc on host 1 3 5 7 9 11 13 15 | 2 4 6 8 10 12 14 16
• Cyc on CPU 1 5 9 13 | 3 7 11 15 | 2 6 10 14 | 4 8 12 16

Das könnte Ihnen auch gefallen

Fire Investigation
Dokument126 Seiten
Fire Investigation
Abcede Iloilo
Noch keine Bewertungen
Embedded Microprocessor Systems: Real World Design
Von Everand
Embedded Microprocessor Systems: Real World Design
Stuart Ball
Noch keine Bewertungen
Electronic Modular Control Panel II Paralleling Emcp II P Systems Operation Troubleshooting Testing and Adjusting Caterpillar
Dokument200 Seiten
Electronic Modular Control Panel II Paralleling Emcp II P Systems Operation Troubleshooting Testing and Adjusting Caterpillar
Abdo Malki
Noch keine Bewertungen
Performance Scenario Sudden Slowdown On Rac
Dokument45 Seiten
Performance Scenario Sudden Slowdown On Rac
behanchod
Noch keine Bewertungen
Ahmad Aljebaly Department of Computer Science Western Michigan University
Dokument42 Seiten
Ahmad Aljebaly Department of Computer Science Western Michigan University
Arushi Mittal
Noch keine Bewertungen
High Performance Computing On Gpu
Dokument37 Seiten
High Performance Computing On Gpu
Sushant Sharma
Noch keine Bewertungen
Introduction To Programming Massively Parallel Graphics Processors
Dokument84 Seiten
Introduction To Programming Massively Parallel Graphics Processors
djrive
Noch keine Bewertungen
CS15-346 Perspectives in Computer Architecture: Single and Multiple Cycle Architectures January 28, 2013
Dokument96 Seiten
CS15-346 Perspectives in Computer Architecture: Single and Multiple Cycle Architectures January 28, 2013
eipu tu
Noch keine Bewertungen
Pankaj
Dokument27 Seiten
Pankaj
sanjeev2838
Noch keine Bewertungen
Bgregganalyzingosxperformanceusemethod 140327181022 Phpapp02
Dokument68 Seiten
Bgregganalyzingosxperformanceusemethod 140327181022 Phpapp02
csy365
Noch keine Bewertungen
002 - Introduction To CUDA Programming - 1
Dokument54 Seiten
002 - Introduction To CUDA Programming - 1
Vinod VM
Noch keine Bewertungen
Lundhild-Understanding RAC Internals
Dokument31 Seiten
Lundhild-Understanding RAC Internals
rajiv272799
Noch keine Bewertungen
TDCI Arch
Dokument77 Seiten
TDCI Arch
Cristian Garcia Alarcòn
Noch keine Bewertungen
Introduction To The Linux Kernel
Dokument51 Seiten
Introduction To The Linux Kernel
bharath_mv7-1
Noch keine Bewertungen
Lec 3
Dokument48 Seiten
Lec 3
zrashad04
Noch keine Bewertungen
Multicore Processor
Dokument15 Seiten
Multicore Processor
Phani Kumar
Noch keine Bewertungen
The Central Processing Unit:: What Goes On Inside The Computer
Dokument42 Seiten
The Central Processing Unit:: What Goes On Inside The Computer
Mag Creation
Noch keine Bewertungen
L23 - Computational Issues: Data Must Be Shared Between Disciplines More Easily Computational Requirements Increase
Dokument5 Seiten
L23 - Computational Issues: Data Must Be Shared Between Disciplines More Easily Computational Requirements Increase
francisco_barboza_1
Noch keine Bewertungen
Scale10x Performance 120806162249 Phpapp02
Dokument86 Seiten
Scale10x Performance 120806162249 Phpapp02
csy365
Noch keine Bewertungen
Threads: Tevfik Koşar
Dokument40 Seiten
Threads: Tevfik Koşar
IjazKhan
Noch keine Bewertungen
Openstack Users Ja Sogabe e
Dokument48 Seiten
Openstack Users Ja Sogabe e
rockerptit
Noch keine Bewertungen
Managing Oracle On Linux
Dokument35 Seiten
Managing Oracle On Linux
obeidat_dba
Noch keine Bewertungen
Parralel Demro 001
Dokument45 Seiten
Parralel Demro 001
demro channel
Noch keine Bewertungen
Windows Server 2012
Dokument56 Seiten
Windows Server 2012
Nguyen Manh Cuong
Noch keine Bewertungen
Os Module 2 21 Scheme Notes
Dokument23 Seiten
Os Module 2 21 Scheme Notes
Mudassir Pasha
Noch keine Bewertungen
GPU Programming: CUDA
Dokument29 Seiten
GPU Programming: CUDA
Milagros Vega
Noch keine Bewertungen
Calculating Prime Numbers Comparing Java, C, and Cuda
Dokument27 Seiten
Calculating Prime Numbers Comparing Java, C, and Cuda
Koukou
Noch keine Bewertungen
CSE2005 ETH Reference Material I Module2 Threads
Dokument39 Seiten
CSE2005 ETH Reference Material I Module2 Threads
Kanishka Malik
Noch keine Bewertungen
GPGPU Programming With CUDA: Leandro Avila - University of Northern Iowa
Dokument29 Seiten
GPGPU Programming With CUDA: Leandro Avila - University of Northern Iowa
Xafran Khan
Noch keine Bewertungen
Gpgpu Final
Dokument124 Seiten
Gpgpu Final
Sibghat Rehman
Noch keine Bewertungen
1 Introduction
Dokument25 Seiten
1 Introduction
Prateek Tiwari
Noch keine Bewertungen
Running in Parallel
Dokument24 Seiten
Running in Parallel
mortezagashti
Noch keine Bewertungen
Multi-Core Processor
Dokument20 Seiten
Multi-Core Processor
ALEXANDRA LONGGANAY
Noch keine Bewertungen
Barnett Haskins
Dokument29 Seiten
Barnett Haskins
Cristi Alexandru Vasile
Noch keine Bewertungen
CPH101L MODULE 03 Microprocessor and Memory
Dokument31 Seiten
CPH101L MODULE 03 Microprocessor and Memory
Angelica Tabaday Panganiban
Noch keine Bewertungen
Understanding PC and Troubleshooting
Dokument8 Seiten
Understanding PC and Troubleshooting
Demon God
100% (1)
Book-Tuning en
Dokument220 Seiten
Book-Tuning en
Daniel Hernando Rubiano Cruz
Noch keine Bewertungen
Differentiated I/O Services in Virtualized Environments: Tyler Harter, Salini SK & Anand Krishnamurthy
Dokument44 Seiten
Differentiated I/O Services in Virtualized Environments: Tyler Harter, Salini SK & Anand Krishnamurthy
Muthuraman Sankaran
Noch keine Bewertungen
A Comprehensive Presentation On 'An Analysis of Linux Scalability To Many Cores'
Dokument49 Seiten
A Comprehensive Presentation On 'An Analysis of Linux Scalability To Many Cores'
RomeoTango
Noch keine Bewertungen
IT Chapter 3
Dokument12 Seiten
IT Chapter 3
Alice Hovsepyan
Noch keine Bewertungen
OS 5.threads
Dokument43 Seiten
OS 5.threads
Afza Fatima
Noch keine Bewertungen
CUDA
Dokument33 Seiten
CUDA
ravish177
Noch keine Bewertungen
Dynamic Tracing For Exploitation and Fuzzing Final
Dokument31 Seiten
Dynamic Tracing For Exploitation and Fuzzing Final
Xdalite
Noch keine Bewertungen
Mcgarr Summit Hackfest 2023 Deck Final
Dokument35 Seiten
Mcgarr Summit Hackfest 2023 Deck Final
Llure Garcia
Noch keine Bewertungen
Brendan Gregg: Container Performance Analysis
Dokument75 Seiten
Brendan Gregg: Container Performance Analysis
csy365
Noch keine Bewertungen
High Performance Networking. Low Latency Devices. 'Network Fabric'
Dokument40 Seiten
High Performance Networking. Low Latency Devices. 'Network Fabric'
Jason Wong
Noch keine Bewertungen
Chapter 1.1
Dokument48 Seiten
Chapter 1.1
roshinikannan0610
Noch keine Bewertungen
Csea - 14200122072 - Samrat Mondal (Co)
Dokument10 Seiten
Csea - 14200122072 - Samrat Mondal (Co)
Samrat Mondal
Noch keine Bewertungen
UNSW COMP1521 - Week 1 Lec 1
Dokument38 Seiten
UNSW COMP1521 - Week 1 Lec 1
ashleylyl520
Noch keine Bewertungen
Arsitektur Sistem Komputer - Week 1-2
Dokument33 Seiten
Arsitektur Sistem Komputer - Week 1-2
Paulus Siahaan
Noch keine Bewertungen
Unit 6 ECE131 - Part 4 - K1
Dokument66 Seiten
Unit 6 ECE131 - Part 4 - K1
abhi shek
Noch keine Bewertungen
Chapter-2 Processes and Threads in DS
Dokument54 Seiten
Chapter-2 Processes and Threads in DS
GUTAMA KUSSE GELEGLO
Noch keine Bewertungen
Deploy Rac BP
Dokument39 Seiten
Deploy Rac BP
Abuzaid Saad ElMahs
Noch keine Bewertungen
Computer Proceessors
Dokument28 Seiten
Computer Proceessors
Rohit Gada
Noch keine Bewertungen
Lesson 3-Processors Berja, Cykee Anne A.
Dokument22 Seiten
Lesson 3-Processors Berja, Cykee Anne A.
CYKEE ANNE BERJA
Noch keine Bewertungen
Unit 5 - Linux System Performance
Dokument27 Seiten
Unit 5 - Linux System Performance
sharmashivi0122
Noch keine Bewertungen
The Hercules S/370, ESA/390, and Z/architecture Systems Emulator
Dokument36 Seiten
The Hercules S/370, ESA/390, and Z/architecture Systems Emulator
Rivo Letto
Noch keine Bewertungen
Direct Kernel Object Manipulation
Dokument45 Seiten
Direct Kernel Object Manipulation
Cameron Dean
Noch keine Bewertungen
Identifying Purposes and Characteristics
Dokument35 Seiten
Identifying Purposes and Characteristics
Mohamed Ali
Noch keine Bewertungen
Operating System 4
Dokument33 Seiten
Operating System 4
Seham123123
Noch keine Bewertungen
Parralel 01
Dokument38 Seiten
Parralel 01
demro channel
Noch keine Bewertungen
PLC: Programmable Logic Controller – Arktika.: EXPERIMENTAL PRODUCT BASED ON CPLD.
Von Everand
PLC: Programmable Logic Controller – Arktika.: EXPERIMENTAL PRODUCT BASED ON CPLD.
MARIO FRANCO
Noch keine Bewertungen
PDF Sesion de Aprendizaje de Comunicacion Leemos y Cantamos Canciones Criollas Lambayecanas - Compress
Dokument6 Seiten
PDF Sesion de Aprendizaje de Comunicacion Leemos y Cantamos Canciones Criollas Lambayecanas - Compress
Julia Navarro Chero
Noch keine Bewertungen
The Mathematical Society of Serbia - 60 Years
Dokument23 Seiten
The Mathematical Society of Serbia - 60 Years
Branko Ma Branko Tadic
Noch keine Bewertungen
CNS - Types of Ciphers
Dokument47 Seiten
CNS - Types of Ciphers
mahesh palem
Noch keine Bewertungen
Devlopment and Analysis of Natural Banana Fiber Composite
Dokument3 Seiten
Devlopment and Analysis of Natural Banana Fiber Composite
Editor IJRITCC
Noch keine Bewertungen
Default
Dokument49 Seiten
Default
maruka33
100% (1)
Upcoming: Advisor Webcast: Oracle Database Resource Manager
Dokument41 Seiten
Upcoming: Advisor Webcast: Oracle Database Resource Manager
Layne Morán
Noch keine Bewertungen
Section 3 Quiz, Database Design ORACLE
Dokument8 Seiten
Section 3 Quiz, Database Design ORACLE
Mostrag
Noch keine Bewertungen
Precima Frenos FDW ATEX Operating Instructions
Dokument6 Seiten
Precima Frenos FDW ATEX Operating Instructions
Toni Renedo
Noch keine Bewertungen
Omega PTFE Needle Valve - FVLT100
Dokument1 Seite
Omega PTFE Needle Valve - FVLT100
Xavier
Noch keine Bewertungen
Configuring Routing by Using Routing and Remote Access
Dokument31 Seiten
Configuring Routing by Using Routing and Remote Access
Lacus Clyne
Noch keine Bewertungen
Nylon Bag Bis
Dokument13 Seiten
Nylon Bag Bis
bsnl.corp.pb
Noch keine Bewertungen
PM-DM/DMR / Pm-2Dm/2Dmr: Digital Multimeters
Dokument2 Seiten
PM-DM/DMR / Pm-2Dm/2Dmr: Digital Multimeters
tonielhage
Noch keine Bewertungen
Fourier Transform: MATHS (Hons), Second YEAR
Dokument120 Seiten
Fourier Transform: MATHS (Hons), Second YEAR
manish chauhan
Noch keine Bewertungen
IP03 Loops-4slides PDF
Dokument10 Seiten
IP03 Loops-4slides PDF
Ramesh G
Noch keine Bewertungen
Critically Reviewing The Literature Class
Dokument32 Seiten
Critically Reviewing The Literature Class
Soman Rajpoot
100% (1)
DigiTech Element Element XP Manual-9
Dokument1 Seite
DigiTech Element Element XP Manual-9
CaPital
100% (1)
QE and Complex Numbers DPP
Dokument9 Seiten
QE and Complex Numbers DPP
satishmhbd
Noch keine Bewertungen
FCE 331 Strength of Materials IIA CAT, January 2022
Dokument2 Seiten
FCE 331 Strength of Materials IIA CAT, January 2022
dev
Noch keine Bewertungen
Falcon 4 CLHS Cameras: True High-Performance: High-Speed Global Shutter CMOS Cameras
Dokument4 Seiten
Falcon 4 CLHS Cameras: True High-Performance: High-Speed Global Shutter CMOS Cameras
Ekpetorson Chinweike
Noch keine Bewertungen
How Microprocessors Work PDF
Dokument2 Seiten
How Microprocessors Work PDF
danielconstantin4
Noch keine Bewertungen
(John F. Moulder) PHI Handbook of XRay Photoelectron Spectros
Dokument192 Seiten
(John F. Moulder) PHI Handbook of XRay Photoelectron Spectros
Camilo Corredor
Noch keine Bewertungen
Temporal Broadening
Dokument10 Seiten
Temporal Broadening
Mohamed Bouhadda
Noch keine Bewertungen
Abbott 2021 ApJL 915 L5
Dokument24 Seiten
Abbott 2021 ApJL 915 L5
Manju Santhakumari
Noch keine Bewertungen
Buenos Aires, Argentina Sabe/Aep Rnpzrwy31: Jeppesen
Dokument1 Seite
Buenos Aires, Argentina Sabe/Aep Rnpzrwy31: Jeppesen
francisco buschiazzo
Noch keine Bewertungen
111
Dokument10 Seiten
111
Phước Ng
50% (2)
EARTH AND LIFE SCIENCE II Answer Key
Dokument4 Seiten
EARTH AND LIFE SCIENCE II Answer Key
jelena jorgeo
Noch keine Bewertungen
Some Observations On The Diophantine Equation Y2xa and Related Results
Dokument12 Seiten
Some Observations On The Diophantine Equation Y2xa and Related Results
Jose Roberto Duarte
Noch keine Bewertungen
Water Level Sensor (Submersible)
Dokument4 Seiten
Water Level Sensor (Submersible)
anon_975837510
Noch keine Bewertungen