Sie sind auf Seite 1von 34

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 1

Gliederung des Vortrages

Einleitung & Begriffe

Reliability & Availability

Performance

Strategien

Turbo Linux Cluster

Oracle 8i R2

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 2

Single Points of Failure (SPOF)


Ein Single Point of Failure bewirkt den
Ausfall des Gesamten Systems
- Ein einfaches Netzteil
- Ein einfaches Netzwerk oder Netzwerkkarte

- Ein einfacher SCSI-Adapter oder Kabel


- Eine ungespiegelte Festplatte
- Ein einfacher Computer-Raum
- Ein einzelnes Gebude
Quelle:Linux HA Vortrag German Unix User Group
1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 3

Der Weg ...


zu hoch verfgbaren Systemen:
- Alle Single Points of Failure aufspren
- Wo ntig redundante Komponenten einsetzen
- Automatische Fehlererkennung (Umschaltung)

- Software-Updates mssen zur Laufzeit eingespielt


werden
- Administration darf das System nicht (ganz)
unterbrechen
Quelle:Linux HA Vortrag German Unix User Group
1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 4

High Availiability/Fault Tolerance


Hoch verfgbare Systeme knnen teilweise
ausfallen, sind aber so aufgebaut, da sie in
krzester Zeit wieder komplett laufen.
- Typische Ausfallzeiten liegen unter 5 Minuten
- Es treten keine Datenfehler auf
- Transaktionsorientierte Software verliert keine Daten

Fehlertolerante Systeme sollten berhaupt


nicht ausfallen, sind aber sehr teuer
- Spezielle Hardware wird bentigt
- Alles mu redundant ausgelegt werden
- Computer-Rume und Gebude sind trotzdem SPOFs
Quelle:Linux HA Vortrag German Unix User Group
1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 5

Anwendung von HAC / HPC


High Performance Clustering (HPC)
- Grand Challenge Applications
- Hohe Geschwindigkeit
- Anwendung
High Availiability Clustering (HAC)
- For Mission Critical Applications
- Hohe Verfgbarkeit
- Anwendung

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 6

Kosten bei System-Ausfall


$10.000.000

$6.500.000
$2.600.000
$1.150.000

$1.000.000
$113.000

$100.000

Financial Brokerage
Operations
Financial Credit Card
Sales
Media Pay-per-View
Retail Home Shopping
(TV)
Retail Catalog Sales
Transportation Airline
Reservations

$10.000
Average Cost per Hour of
Downtime
Quelle:Compaq Architecting and Deploying High-Availability Solutions

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 7

Gliederung des Vortrages

Einleitung & Begriffe

Reliability & Availability

Performance

Strategien

Turbo Linux Cluster

Oracle 8i R2

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 8

Avaliability
Relevanter
Bereich
Internet/Intranet
Company Alpha

Router

HUB

HDD

Netzwerk
Service Server

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 9

Beispiel zur Berechnung der Reliability


Gert
Netzwerk
Server
HDD

MTBF
100.000
50.000
100.000

Gesamt:

24.955
??

Reliability %p.a.
91,6
83,9
91,6
70,3

MTBF= Mean Time Between Failure

R(t) = e-at

a=1/MTBF

Auf ein Jahr bezogen: 24 Stunden * 365 Tage= 8760 Stunden


R(8760) = e - 0,00001*8760 = 91,6 %
Quelle: Distributed Information Systems , Erroly Simon
1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 10

Avaliability
Relevanter
Bereich
Internet/Intranet
Company Beta
Server A

Router

Backup A

HUB
HDD
(gespiegelt)
Standby Interface
1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

Netzwerk
Service Interface
15.12.1999

Seite : 11

Berechnung der Reliability


Reliability
Netzwerk
Server
HDD

no backup
91,6 %
83,9 %
91,6 %

with backup
99,29 %
97,40 %
99,29 %

Gesamt:

70,3 %

99,88 %

Rbackup = 1-(1 - Rno backup)2


Rbackup = 1- (1 - Netzwerk )2 = 1- ( 1- 0,916)2 = 0,9929

Roverall = 1-(1 - R1) (1 - R2)*...*(1 - Rn)


Roverall = 1- (1 - Netzwerk ) (1 - Server ) (1 - HDD) =
1 - (1 - 0,916)(1 - 0,839)(1 - 0.916) = 0.9988
Quelle: Distributed Information Systems , Erroly Simon
1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 12

Berechnung der Availability


A = MTBF / MTBF + MTTR
A(t) = (b / a+b) + (a /a+b)* e - (a+b)t

MTTR=
Mean Time
to Repair

Aoverall = 1-(1-A1)(1-A2)*...*(1-An)
System Alpha
(No Backup)
System Beta
(with Backup)

MTBF
24.955

MTTR
2

Availability
99,9919862 %

7.295.619 !!

99,9999726 %

bei Alpha: 99,9919 % >>> bei 100.000 Anfragen ist


das System 81 mal unavailable
bei Beta: 99,9999 % >>> bei 100.000 Anfragen
ist das System nur 1 mal unavailable
Quelle: Distributed Information Systems , Erroly Simon
1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 13

Gliederung des Vortrages

Einleitung & Begriffe

Reliability & Availability

Performance

Strategien

Turbo Linux Cluster

Oracle 8i R2

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 14

Main Bottleneck (Flaschenhals)


Annahmen:

- 1 Client request/second = 6 packets per/


second network traffic
- 2 disk I/O per second on a server/client

Estimated maximum throughput = 25 client requests/second


Estimated main bottleneck = Server disk I/O

Quelle: Distributed Information Systems , Erroly Simon


1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 15

RAID
Redundand Array of Inexpensive Disks
Techniken:

Daten

-striping
-mirroring

-parity

Disk A

Disk B

Disk C

Daten

Disk A

Disk B

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 16

RAID Level 0

Striped
Used
for:Disk Array without Fault Tolerance
min. 2Production
Harddisks and Editing
Video
high I/O
performance
Image
Editing
very simple
design
Pre-Press
Applications
not a
"True" RAID
because
it is NOT fault-tolerant
Any
application
requiring
high
the failure of just one drive will result in all data in an
bandwidth
array being lost
Should never be used in mission critical environments

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 17

RAID Level 1

100%
Mirroring
Usedredundancy
for:and Duplexing
of data means no rebuild of data is necessary
inFor
Accounting
case
Highest
of disk
performance,
failure, just athe
copy
controller
to the replacement
must be abledisk
to
Simplest
perform
Payroll two
RAID
concurrent
storage subsystem
separate Reads
designper mirrored pair
or
Financial
two duplicate
Highest
Writes
Any application
per
ECC
mirrored
(Error
requiring
Checking/Correction)
pair. very high availability
disk overhead
of
min.
all RAID
2 Harddisks
types (100%) inefficient
Hardware implementation recommendend

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 18

RAID Level 5

min
3 Harddisks
Used
for:
Independent
Data
disks with distributed parity blocks
highest
data
transaction
File andRead
Application
servers rate
Each entire
data
is written
medium
Write
data block
transaction
rateon a data disk;
Database
servers
parity
for
blocks(Parity)
in the same to
rank is generated on Writes,
low
ratioE-mail,
of ECC
WWW,
and Newsdisks
serversdata disks means high efficiency
recorded in a distributed location and checked on Reads.
Intranet servers
most
Most complex
versatile controller
RAID leveldesign
difficult to rebuild in the event of a disk failure
(as compared to RAID level 1)
1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 19

Gliederung des Vortrages

Einleitung & Begriffe

Reliability & Availability

Performance

Strategien

Turbo Linux Cluster

Oracle 8i R2

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 20

Strategien

Internet/Intranet
Company Beta
Server A

Router

Backup A

HUB
HDD
(gespiegelt)

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

Netzwerk

15.12.1999

Seite : 21

Idle Standby

Quelle:Linux HA Vortrag German Unix User Group


1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 22

Mutual Takeover

Quelle:Linux HA Vortrag German Unix User Group


1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 23

Software Komponenten
Heartbeat

Watchdog

Event Scripts

Cluster
Manager
Daemon
Configuration Tool

Syslog Hooks
Quelle:Linux HA Vortrag German Unix User Group
1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 24

Gliederung des Vortrages

Einleitung & Begriffe

Reliability & Availability

Performance

Strategien

Turbo Linux Cluster

Oracle 8i R2

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 25

Der Turbo-Linux Cluster

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 26

TurboCluster Architecture

Service Cluster

Advanced Traffic Manager


1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 27

Der Turbo-Linux Cluster

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 28

Gliederung des Vortrages

Einleitung & Begriffe

Reliability & Availability

Performance

Strategien

Turbo Linux Cluster

Oracle 8i R2

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 29

Oracle 8i R2 Cluster Solution

Quelle:Oracle
1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 30

Oracle 8i Cache Strategie

Quelle:Oracle
1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 31

Oracle 8i Load Balancing

Quelle:Oracle
1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 32

Oracle Failover Feature

Quelle:Oracle
1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 33

ENDE

1999 Christian Breuker Projektgruppe SAP R/3 auf Linux Cluster

15.12.1999

Seite : 34