Particle-in-Cell Plasma Simulation On Intel Xeon Phi Coprocessors

Hochgeladen von

Yasser Abdella

0% fanden dieses Dokument nützlich (0 Abstimmungen)

11 Ansichten4 Seiten

Originaltitel

SC15_MIC_Tuning_BoF_PICADOR.pdf

Copyright

Verfügbare Formate

PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

Copyright:

Verfügbare Formate

Als PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

0% fanden dieses Dokument nützlich (0 Abstimmungen)

11 Ansichten4 Seiten

Particle-in-Cell Plasma Simulation On Intel Xeon Phi Coprocessors

Hochgeladen von

Yasser Abdella

Copyright:

Verfügbare Formate

Als PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 4

Im Dokument suchen

Particle-in-Cell Plasma Simulation

on Intel Xeon Phi Coprocessors

S. Bastrakov1, D. Durnov3, A. Gonoskov1,2, E. Efimenko1,2,

A. Korzhimanov1,2, I. Meyerov1, I. Surmin1

1Lobachevsky State University of Nizhni Novgorod

2Institute of Applied Physics of the RAS, Nizhni Novgorod

3Intel Corporation

Russia
1
SC15 MIC Tuning BoF
What’s unique about my tuning work
 Application: PICADOR – innovative, extendable and fully parallel software
 Multi-level infrastructure, modular extension interface
 Optimized computational core
 Specialized scripting configuration language and visualization tools
 A wide set of numerical schemes and extensions
 Dynamic load balancing
 Application domain
 3D Particle-in-Cell plasma simulation
 Execution mode
 CPU + Intel Xeon Phi in symmetric mode
 Tools used
 Intel Parallel Studio XE, C++
 Optimization
 Intrinsic functions to improve vectorization effectiveness; memory tuning
2
SC15 MIC Tuning BoF
Performance
 1.5x to 2x speedup on Xeon Phi 5110P vs. Xeon E5-2660

 Speedup due to optimization: Xeon 4.2 x, MIC 7.5x

 Improving memory locality. Speedup: Xeon 3.1x, MIC 3.4x. Inspired by

physical locality of the method. Very generalizable.

 Improving vectorization with #pragma simd and intrinsic functions (baseline

was partially auto-vectorized). Speedup: Xeon 1.3x, MIC 1.8x. Motivated by
Intel VTune Amplifier diagnostics. Generalizable.

 Reducing thread communication by introducing checkerboard cell traversal

order. Speedup: Xeon 1.1x, MIC 1.3x. Motivated by Intel VTune Amplifier
diagnostics. Generalizable, some details specific to the method.

3
SC15 MIC Tuning BoF
Insights
 Learned:
 Memory locality is very important, particularly for vectorization

 Serial code with a negligible share of run time on CPU can become a
performance limiting factor on Xeon Phi
 Recommendation: designing computational schemes and data structures
taking into consideration threading and vectorization potential
 Intel VTune Amplifier provided valuable insight that invoked optimizations
 Biggest surprise: low vectorization efficiency of loops with indirect array access
 Key remaining challenge: improving vectorization efficiency of field
interpolation and current deposition phases involving indirect array access
 Will KNL require a new approach to optimization compared to KNC or minor
tuning?
 We’re thinking of collaborating with HPC application engineers
4
SC15 MIC Tuning BoF

Das könnte Ihnen auch gefallen

Intel Xeon Phi Processor High Performance Programming: Knights Landing Edition
Von Everand
Intel Xeon Phi Processor High Performance Programming: Knights Landing Edition
James Jeffers
Noch keine Bewertungen
Laius: An 8-Bit Fixed-Point CNN Hardware Inference Engine
Dokument8 Seiten
Laius: An 8-Bit Fixed-Point CNN Hardware Inference Engine
REAL Gyan
Noch keine Bewertungen
High Performance Parallelism Pearls Volume One: Multicore and Many-core Programming Approaches
Von Everand
High Performance Parallelism Pearls Volume One: Multicore and Many-core Programming Approaches
James Reinders
Noch keine Bewertungen
SOC Design
Dokument23 Seiten
SOC Design
Aravind Anapalli
Noch keine Bewertungen
MAC
Dokument5 Seiten
MAC
Bilal Khan
Noch keine Bewertungen
Deep Leaarning Workload Performance Auto-Optimezer
Dokument5 Seiten
Deep Leaarning Workload Performance Auto-Optimezer
Raana
Noch keine Bewertungen
Folien Intel NetBurst Architecture
Dokument7 Seiten
Folien Intel NetBurst Architecture
Hawx Gamer
Noch keine Bewertungen
Power and Energy Implications of The Number of Threads Used On The Intel Xeon Phi
Dokument11 Seiten
Power and Energy Implications of The Number of Threads Used On The Intel Xeon Phi
omar.pro.services
Noch keine Bewertungen
IJCER (WWW - Ijceronline.com) International Journal of Computational Engineering Research
Dokument4 Seiten
IJCER (WWW - Ijceronline.com) International Journal of Computational Engineering Research
International Journal of computational Engineering research (IJCER)
Noch keine Bewertungen
PbXhBgZIJUFpInfB PDF
Dokument6 Seiten
PbXhBgZIJUFpInfB PDF
Falen Kayyazqi
Noch keine Bewertungen
An FPGA-Based Reconfigurable CNN Accelerator For YOLO
Dokument5 Seiten
An FPGA-Based Reconfigurable CNN Accelerator For YOLO
聂珣
Noch keine Bewertungen
Pentium 4 Processor
Dokument23 Seiten
Pentium 4 Processor
Mehedi Hasan
100% (7)
Precompression Quality-Control Algorithm For JPEG 2000
Dokument16 Seiten
Precompression Quality-Control Algorithm For JPEG 2000
yt peek
Noch keine Bewertungen
Paper 4
Dokument10 Seiten
Paper 4
royalatlas.stash
Noch keine Bewertungen
Lec01 Verilog Combinational Circuits Design 2022 Spring
Dokument64 Seiten
Lec01 Verilog Combinational Circuits Design 2022 Spring
yanjia8161100
Noch keine Bewertungen
Demidovskij 2021 J. Phys. Conf. Ser. 1828 012012
Dokument9 Seiten
Demidovskij 2021 J. Phys. Conf. Ser. 1828 012012
Rony Teguh
Noch keine Bewertungen
Design and Implementation of Convolutional Neural Network Accelerator Based On RISCV
Dokument6 Seiten
Design and Implementation of Convolutional Neural Network Accelerator Based On RISCV
madupiz@gmail
Noch keine Bewertungen
ECEN 468 Advanced Logic Design: Lectur e 1: Intr Oduction
Dokument16 Seiten
ECEN 468 Advanced Logic Design: Lectur e 1: Intr Oduction
Farah Rasheed
Noch keine Bewertungen
Loi Yolo
Dokument69 Seiten
Loi Yolo
Phạm Hường
Noch keine Bewertungen
Using Deep Machine Learning To Conduct Object-Based Identification and Motion Detection On Safeguards Video Surveillance
Dokument11 Seiten
Using Deep Machine Learning To Conduct Object-Based Identification and Motion Detection On Safeguards Video Surveillance
eipu tu
Noch keine Bewertungen
Fully Convolutional
Dokument4 Seiten
Fully Convolutional
REAL Gyan
Noch keine Bewertungen
SoC Based PR
Dokument13 Seiten
SoC Based PR
Omar Schiaratura
Noch keine Bewertungen
A Gênese (Allan Kardec)
Dokument80 Seiten
A Gênese (Allan Kardec)
Sergio Pereira da Silva
Noch keine Bewertungen
Simple, Efficient and Effective Encodings of Local Deep Features For Video Action Recognition
Dokument8 Seiten
Simple, Efficient and Effective Encodings of Local Deep Features For Video Action Recognition
Anonymous ntIcRwM55R
Noch keine Bewertungen
Code Optimization For Cell/B.E. - Opportunities For ABINIT - A Software Package For Physicists
Dokument1 Seite
Code Optimization For Cell/B.E. - Opportunities For ABINIT - A Software Package For Physicists
Heiko Joerg Schick
Noch keine Bewertungen
XDP Hardware Offload: Current Work, Debugging and Edge Cases
Dokument5 Seiten
XDP Hardware Offload: Current Work, Debugging and Edge Cases
HIPPO LD
Noch keine Bewertungen
Low-Latency BCH-CRC Decoder For 3D CT NAND Flash Memory Applications
Dokument2 Seiten
Low-Latency BCH-CRC Decoder For 3D CT NAND Flash Memory Applications
Mihir Saha
Noch keine Bewertungen
Gttse 07
Dokument68 Seiten
Gttse 07
Anonymous Anonymous
Noch keine Bewertungen
Intel Nehalem Core Architecture
Dokument123 Seiten
Intel Nehalem Core Architecture
complexsplit
Noch keine Bewertungen
CH 05
Dokument46 Seiten
CH 05
chandu m
Noch keine Bewertungen
Xeon Ansys Mechanical Faster Simulations Paper
Dokument6 Seiten
Xeon Ansys Mechanical Faster Simulations Paper
Ali Javed
Noch keine Bewertungen
Att Cpu Impact On Packet Processing Perfomance Paper
Dokument24 Seiten
Att Cpu Impact On Packet Processing Perfomance Paper
Samuel Eitel Ngoula
Noch keine Bewertungen
Psoc Handbook Manual Official
Dokument78 Seiten
Psoc Handbook Manual Official
santosh_babar_26
Noch keine Bewertungen
FPGA Based
Dokument7 Seiten
FPGA Based
Pushpa Latha
Noch keine Bewertungen
Modelling and Designing of CNN For Feature Abstraction.: Presented By:-Krusha Sandip Joshi
Dokument13 Seiten
Modelling and Designing of CNN For Feature Abstraction.: Presented By:-Krusha Sandip Joshi
Krusha Joshi
Noch keine Bewertungen
Structured Enquiry Template
Dokument19 Seiten
Structured Enquiry Template
Priyanka pawar
Noch keine Bewertungen
CNP: An FPGA-based Processor For Convolutional Networks
Dokument2 Seiten
CNP: An FPGA-based Processor For Convolutional Networks
mageshprabhu
Noch keine Bewertungen
Cse-Viii-Advanced Computer Architectures (06CS81) - Question Paper
Dokument5 Seiten
Cse-Viii-Advanced Computer Architectures (06CS81) - Question Paper
Deepak Ravi Shankar
Noch keine Bewertungen
Intel® Compiler Suite Professional Edition 11.1: For Windows
Dokument3 Seiten
Intel® Compiler Suite Professional Edition 11.1: For Windows
Kumar Crazzy
Noch keine Bewertungen
Accelerated Deep Learning Inference From Constrained Embedded Devices
Dokument5 Seiten
Accelerated Deep Learning Inference From Constrained Embedded Devices
Bhargav Bhat
Noch keine Bewertungen
A FPGA-based Soft Multiprocessor System For JPEG Compression
Dokument8 Seiten
A FPGA-based Soft Multiprocessor System For JPEG Compression
smkjadoon
Noch keine Bewertungen
Hyper-Threading Technology Speeds Clusters: Lecture Notes in Computer Science September 2003
Dokument8 Seiten
Hyper-Threading Technology Speeds Clusters: Lecture Notes in Computer Science September 2003
Subash Saravanan
Noch keine Bewertungen
Performance Analysis of Dual Core, Core 2 Duo and Core I3 Intel Processor
Dokument7 Seiten
Performance Analysis of Dual Core, Core 2 Duo and Core I3 Intel Processor
PRAFULKUMAR PARMAR
Noch keine Bewertungen
FPGA Implementations of Feed Forward Neural Network by Using Floating Point Hardware Accelerators
Dokument10 Seiten
FPGA Implementations of Feed Forward Neural Network by Using Floating Point Hardware Accelerators
Carlos Torres Casas
Noch keine Bewertungen
ASC Code
Dokument6 Seiten
ASC Code
romi hendrix
Noch keine Bewertungen
A Field Programmable Gate Array Implementation
Dokument5 Seiten
A Field Programmable Gate Array Implementation
Himanshu Gupta
Noch keine Bewertungen
Xeon 7000 Family Brief PDF
Dokument8 Seiten
Xeon 7000 Family Brief PDF
Zakir Hossen
Noch keine Bewertungen
2004 10934v1 PDF
Dokument17 Seiten
2004 10934v1 PDF
KSHITIJ SONI 19PE10041
Noch keine Bewertungen
Multiple Clock Domain Bridging: Categories and Subject Descriptors General Terms Keywords
Dokument12 Seiten
Multiple Clock Domain Bridging: Categories and Subject Descriptors General Terms Keywords
Srinivasan Sreedharan
Noch keine Bewertungen
2-Introduction To Pentium Processor
Dokument15 Seiten
2-Introduction To Pentium Processor
afzal_a
92% (13)
Genus Synthesis Solution Ds
Dokument3 Seiten
Genus Synthesis Solution Ds
HistPro Web
Noch keine Bewertungen
Genus Synthesis Solution Ds
Dokument3 Seiten
Genus Synthesis Solution Ds
Jagruth Gowda
Noch keine Bewertungen
Hardware Accleration For ML
Dokument26 Seiten
Hardware Accleration For ML
Sai Sumanth
Noch keine Bewertungen
Introduction To: System-on-Chip
Dokument34 Seiten
Introduction To: System-on-Chip
N. Akhila Goud
Noch keine Bewertungen
Assignment 2 Template
Dokument23 Seiten
Assignment 2 Template
VortexProYeo
Noch keine Bewertungen
A Tool For Soc Test Network Design Automation: Aram, Khzarjyan
Dokument4 Seiten
A Tool For Soc Test Network Design Automation: Aram, Khzarjyan
Lusine Martirosyan
Noch keine Bewertungen
Computer Organization and Architecturedebdeep Mukhopadhyay, Cse, Iit Kharagpur
Dokument11 Seiten
Computer Organization and Architecturedebdeep Mukhopadhyay, Cse, Iit Kharagpur
Reeverse Mastermindd
Noch keine Bewertungen
Improving Memory Utilization in Convolutional Neural Network Accelerators
Dokument4 Seiten
Improving Memory Utilization in Convolutional Neural Network Accelerators
dave
Noch keine Bewertungen
Tcas-I Haco Final
Dokument14 Seiten
Tcas-I Haco Final
dali mohamed
Noch keine Bewertungen
DVCon Europe 2015 TP2 2 Paper
Dokument8 Seiten
DVCon Europe 2015 TP2 2 Paper
Jon DC
Noch keine Bewertungen
Oracle® Smart Update: Applying Patches To Oracle Weblogic Server Release 3.3.0
Dokument112 Seiten
Oracle® Smart Update: Applying Patches To Oracle Weblogic Server Release 3.3.0
Yasser Abdella
Noch keine Bewertungen
PDF
Dokument29 Seiten
PDF
Yasser Abdella
Noch keine Bewertungen
Crime and Punishement
Dokument1 Seite
Crime and Punishement
Yasser Abdella
Noch keine Bewertungen
Example Shop3
Dokument1 Seite
Example Shop3
Yasser Abdella
Noch keine Bewertungen
F21455
Dokument24 Seiten
F21455
Yasser Abdella
Noch keine Bewertungen
Movies
Dokument2 Seiten
Movies
Yasser Abdella
Noch keine Bewertungen
Zen of Python
Dokument1 Seite
Zen of Python
abaskm
Noch keine Bewertungen
PDE Solver
Dokument50 Seiten
PDE Solver
Yasser Abdella
Noch keine Bewertungen
Lecture 16
Dokument14 Seiten
Lecture 16
Yasser Abdella
Noch keine Bewertungen
Phase Transition in Dust Clusters With Different Charging Processes
Dokument10 Seiten
Phase Transition in Dust Clusters With Different Charging Processes
Yasser Abdella
Noch keine Bewertungen
Ooad With Uml: Object Oriented Analysis and Design Using The UML
Dokument62 Seiten
Ooad With Uml: Object Oriented Analysis and Design Using The UML
srikanth0010
Noch keine Bewertungen
Object Oriented Concepts
Dokument232 Seiten
Object Oriented Concepts
jaykrishna
100% (1)
Self-Similar Expansion of A Warm Dense Plasma: Physics of Plasmas July 2013
Dokument7 Seiten
Self-Similar Expansion of A Warm Dense Plasma: Physics of Plasmas July 2013
Yasser Abdella
Noch keine Bewertungen
The Finite-Difference Time-Domain Method (FDTD)
Dokument12 Seiten
The Finite-Difference Time-Domain Method (FDTD)
Ali Mhd
Noch keine Bewertungen
Modeling of Laser Induced Plasma Expansion in The Presence of Non-Maxwellian Electrons
Dokument5 Seiten
Modeling of Laser Induced Plasma Expansion in The Presence of Non-Maxwellian Electrons
Yasser Abdella
Noch keine Bewertungen
Effect of Transverse Magnetic Field On Laser Produced Plasma Expansion Into Vacuum
Dokument5 Seiten
Effect of Transverse Magnetic Field On Laser Produced Plasma Expansion Into Vacuum
Yasser Abdella
Noch keine Bewertungen
10 1 1 42 6331 PDF
Dokument23 Seiten
10 1 1 42 6331 PDF
Yasser Abdella
Noch keine Bewertungen
Modeling of Laser Induced Plasma Expansion in The Presence of Non-Maxwellian Electrons
Dokument5 Seiten
Modeling of Laser Induced Plasma Expansion in The Presence of Non-Maxwellian Electrons
Yasser Abdella
Noch keine Bewertungen
10.1007 - s10509 013 1602 3
Dokument9 Seiten
10.1007 - s10509 013 1602 3
Yasser Abdella
Noch keine Bewertungen
08 PDF
Dokument8 Seiten
08 PDF
Yasser Abdella
Noch keine Bewertungen
S Rep 142391
Dokument8 Seiten
S Rep 142391
Yasser Abdella
Noch keine Bewertungen
Sc15 Mic Tuning Bof Picador
Dokument6 Seiten
Sc15 Mic Tuning Bof Picador
Yasser Abdella
Noch keine Bewertungen
Sc15 Mic Tuning Bof Picador
Dokument4 Seiten
Sc15 Mic Tuning Bof Picador
Yasser Abdella
Noch keine Bewertungen
04 Algorithm PDF
Dokument25 Seiten
04 Algorithm PDF
Yasser Abdella
Noch keine Bewertungen
Intro Plasma
Dokument77 Seiten
Intro Plasma
Yasser Abdella
Noch keine Bewertungen
Computer Based Numerical and Statistical Techniques
Dokument5 Seiten
Computer Based Numerical and Statistical Techniques
Yasser Abdella
Noch keine Bewertungen
Leapfrog
Dokument108 Seiten
Leapfrog
Yasser Abdella
Noch keine Bewertungen
Leapfrog PDF
Dokument15 Seiten
Leapfrog PDF
James Hernandez
Noch keine Bewertungen
Excel Sheet For CGPA Calculator BE CSE R2013 Anna University Affiliated Colleges
Dokument18 Seiten
Excel Sheet For CGPA Calculator BE CSE R2013 Anna University Affiliated Colleges
karthick103
Noch keine Bewertungen
Msp430 Conf Feb019
Dokument5 Seiten
Msp430 Conf Feb019
Adeeb Husnain
Noch keine Bewertungen
Home Automation System
Dokument18 Seiten
Home Automation System
Chandrika Dalakoti
77% (13)
Convert Your Blog Into A PDF: Export
Dokument4 Seiten
Convert Your Blog Into A PDF: Export
Jm Medina
Noch keine Bewertungen
Netronics NetStream Product Family Overview
Dokument47 Seiten
Netronics NetStream Product Family Overview
binesh9
Noch keine Bewertungen
Oracle 1z0-1072 v2020-05-22 q61
Dokument23 Seiten
Oracle 1z0-1072 v2020-05-22 q61
Rysiek Zdzisiek
100% (1)
PowerFlex 753 and 755 Drive - AOP For Non-CIP Drive
Dokument2 Seiten
PowerFlex 753 and 755 Drive - AOP For Non-CIP Drive
diegos109
Noch keine Bewertungen
SME PPT TCU02 Technical Description
Dokument23 Seiten
SME PPT TCU02 Technical Description
abhinav
Noch keine Bewertungen
FusionApplication Troubleshooting Guide
Dokument294 Seiten
FusionApplication Troubleshooting Guide
rdinesh16
100% (1)
Modbus Map Omron
Dokument6 Seiten
Modbus Map Omron
hellboyloving
Noch keine Bewertungen
RFC 2196
Dokument76 Seiten
RFC 2196
jcangarita
Noch keine Bewertungen
Immunity Debugger
Dokument10 Seiten
Immunity Debugger
Julio Kafir
Noch keine Bewertungen
Virtual Mouse Control Using A Web Camera
Dokument14 Seiten
Virtual Mouse Control Using A Web Camera
Thennarasu Ramachandran
100% (1)
Manual Testing Interview Questions
Dokument23 Seiten
Manual Testing Interview Questions
Rabindra P.Singh
Noch keine Bewertungen
Msi Gx623 User Manual 84c2fd3
Dokument86 Seiten
Msi Gx623 User Manual 84c2fd3
cris_43
Noch keine Bewertungen
Interop Testing
Dokument17 Seiten
Interop Testing
made_pmj
Noch keine Bewertungen
CSC 413: Introduction To Interactive Multimedia Universiti Teknologi Mara (Melaka)
Dokument2 Seiten
CSC 413: Introduction To Interactive Multimedia Universiti Teknologi Mara (Melaka)
nur izzati
Noch keine Bewertungen
FT 3700 Series PDF
Dokument7 Seiten
FT 3700 Series PDF
Ingeniero Soporteea
Noch keine Bewertungen
1 Dbms - Overview PDF
Dokument2 Seiten
1 Dbms - Overview PDF
প্রমিত সরকার
Noch keine Bewertungen
Code Generation and Instruction Selection Unit-8
Dokument6 Seiten
Code Generation and Instruction Selection Unit-8
Sridhar Vangapally V
Noch keine Bewertungen
Questionario - What Is A Computer
Dokument4 Seiten
Questionario - What Is A Computer
ricardosobral
Noch keine Bewertungen
Cots Sample
Dokument13 Seiten
Cots Sample
SHRIYA
Noch keine Bewertungen
How To Ubuntu: Official PRTG - Download
Dokument8 Seiten
How To Ubuntu: Official PRTG - Download
danuelle carlo calata
Noch keine Bewertungen
Audio Checker
Dokument2 Seiten
Audio Checker
Khristos Zulu
Noch keine Bewertungen
Vmware Architecting Tenant Networking With NSX in VCD
Dokument52 Seiten
Vmware Architecting Tenant Networking With NSX in VCD
sirtaj123
Noch keine Bewertungen
A Project Report On: Digital Gates Emulator Using 8051 Microcontroller
Dokument16 Seiten
A Project Report On: Digital Gates Emulator Using 8051 Microcontroller
Manoj Kumar
Noch keine Bewertungen
Cloudera Administrator Training
Dokument6 Seiten
Cloudera Administrator Training
turbina155
Noch keine Bewertungen
Tutorial2 TCL Script
Dokument9 Seiten
Tutorial2 TCL Script
Miraj Tadhani
Noch keine Bewertungen
Cmts
Dokument722 Seiten
Cmts
Brian Carroll
Noch keine Bewertungen
EC 19 GATE PSUs PDF
Dokument2 Seiten
EC 19 GATE PSUs PDF
Christopher Lee
Noch keine Bewertungen