Sie sind auf Seite 1von 10

Quiz 1

Hierbei handelt es sich um zentralisierte Datencontainer in einem speziell dafür eingerichteten Bereich, der
Business Intelligence und Reporting unterstützt, aber robuste Analysen einschränkt.
0 Data Marts
(Data Warehouses
r Analytische Sandbox
0 Keine der oben genannten
Welche der folgenden Probleme treten bei der traditionellen Datenarchitektur auf?
r Hochwertige Daten sind schwer zu erreichen und zu nutzen, und prädiktive Analysen und Data Mining-
Aktivitäten stehen an letzter Stelle für Daten.
r Datenwissenschaftler sind auf die Durchführung von In-Memory-Analysen beschränkt, die die Größe der
Datensätze einschränken, die sie verwenden können.
0 Data Science-Projekte bleiben isoliert und ad hoc, anstatt zentral verwaltet zu werden.
6 Alle oben genannten Punkte

Welche der folgenden Aussagen TRIFFT immer auf Big Data zu?
I. Aufgrund seiner Größe oder Struktur kann Big Data nicht nur mit herkömmlichen Datenbanken oder
Methoden effizient analysiert werden.
II. Obwohl die Vielfalt von Big Data tendenziell die meiste Aufmerksamkeit auf sich zieht, bieten im
Allgemeinen das Volumen und die Geschwindigkeit der Daten eine passendere Definition von Big Data.
( I nur

r Nur II

r beide I und II

r weder Inoch
II

Welche der folgenden AUSSAGEN zu den Unterschieden zwischen Business Intelligence (BI) und Data
Science trifft zu?
I. Während Data-Science-Probleme in der Regel stark strukturierte Daten erfordern, die in Zeilen und
Spalten organisiert sind, um genaue Berichte zu erstellen, verwenden BI-Projekte in der Regel viele Arten von
Datenquellen, einschließlich großer oder unkonventioneller Datensätze.
II. Data Science ist tendenziell explorativer Natur und kann Szenarienoptimierung verwenden, um mit
offeneren Fragen umzugehen.
r I only

( Nur II

r sowohl I als auch II

r weder ich noch


II

Zu den Geschäftstreibern, die Unternehmen dazu bringen, analytischer und datengesteuerter zu werden,
gehören Kundenabwanderung, Betrug und Zahlungsausfälle
0 Optimierung des Geschäftsbetriebs
(Geschäftsrisiko identifizieren
r Neue Geschäftsmöglichkeiten vorhersagen
0 Behördliche Auflagen einhalten
Welche der folgenden Aussagen trifft auf die aktuelle analytische Architektur zu?
I. Datenquellen werden zuerst in das Data Warehouse geladen, wo die Daten gut verstanden, strukturiert und
mit den entsprechenden Datentypdefinitionen normalisiert werden müssen. Diese Art der Zentralisierung
ermöglicht Sicherheit, Backup und Failover von hochkritischen Daten.
II. Sobald sie sich im Data Warehouse befinden, werden die Daten von zusätzlichen Anwendungen im
gesamten Unternehmen für BI- und Berichtszwecke gelesen. Dies sind betriebliche Prozesse mit hoher
Priorität, die kritische Datenfeeds aus den Data Warehouses und Repositories erhalten.
r I only

r Nur II

c sowohl I als auch II

r weder ich noch


II

Welche dieser Attribute zeichnen sich durch die Definition von Big Data-Eigenschaften aus?
r Riesiges Datenvolumen
r Komplexität von Datentypen und Strukturen
0 Geschwindigkeit der neuen Datenerstellung und des Wachstums
0 Alle oben genannten Punkte
Diese Art von Daten hat keine inhärente Struktur, zu der Textdokumente, PDFs, Bilder und Videos gehören
können. r Quasi-strukturierte Daten
(Unstrukturierte Daten
c Semistrukturierte Daten
r Strukturierte Daten

Quiz 2
Beispiele, die in diese Gruppe fallen, sind Finanzanalysten, Marktforschungsanalysten, Biowissenschaftler,
Betriebsleiter sowie Geschäfts- und Funktionsmanager.
(Data Savvy Professionals
r Tiefgründiges analytisches Talent
r Technologie und Data Enabler
r Keine der oben genannten
Welche der folgenden Aussagen beschreibt das Jahrzehnt nach 2010 in Bezug auf Big Data?
I. In dieser Ära hinterlässt jeder und alles einen digitalen Fußabdruck.
II. Das Datenvolumen in diesem Jahrzehnt wird in Petabyte gemessen.
( I nur

r Nur II

r sowohl ich als auch II

r weder Inoch
II

Im Folgenden finden Sie wiederkehrende Aktivitäten, die Data Scientist durchführt, MIT AUSNAHME von
Reframe Business Challenges als analytische Herausforderungen.
r Entwerfen, implementieren und implementieren Sie statistische Modelle und Data-Mining-Techniken für Big
Data.
(Bereitstellung von technischem Fachwissen zur Unterstützung analytischer Projekte wie Bereitstellung und
Verwaltung analytischer Sandkästen.
r Entwickeln von Erkenntnissen, die zu umsetzbaren Empfehlungen führen.
Welche der folgenden Gruppen von Akteuren in der Datenwertschöpfungskette macht Sinn für die von
verschiedenen Unternehmen gesammelten Daten?
r Datengeräte
r Datensammler
( Datenaggregatoren
r Datennutzer und Käufer
Die Daten sollen nun aus vielen Quellen stammen, darunter r Fotos und Videomaterial, die ins World Wide Web
hochgeladen wurden
0 Nicht traditionelle IT-Geräte, einschließlich der Verwendung von RFID-Lesern (Radio Frequency
Identification), GPS-Navigationssystemen und seismischer Verarbeitung
0 Medizinische Informationen, wie genomische Sequenzierung und diagnostische Bildgebung
c Alle oben genannten Punkte

Welche der folgenden Schlüsselrollen im neuen Big-Data-Ökosystem haben Mitglieder, die über eine
Kombination von Fähigkeiten verfügen, um mit rohen, unstrukturierten Daten umzugehen und komplexe
Analysetechniken in großem Maßstab anzuwenden?
0 Data Savvy Professionals
( Tief analytisch Talent
r Technologie- und Data Enabler
r Keine der Oben

Im Folgenden sind die Fähigkeiten und Verhaltensmerkmale aufgeführt, die ein Datenwissenschaftler besitzen
muss, AUSSER Qualitative Kompetenz
r Neugierig und kreativ
r Skeptische Denkweise und kritisches Denken (] Kommunikativ und kollaborativ

Quiz 3

Dies bezieht sich auf den Prozess der Bereinigung von Daten, der Normalisierung von Datensätzen und der
Durchführung von Transformationen an den Daten.
0 Daten Vorbereitung
c Daten Transformation
(• Daten Konditionierung
0 Daten Visualisieren
In dieser Phase des Lebenszyklus der Datenanalyse bewertet das Team die verfügbaren Ressourcen zur
Unterstützung des Projekts in Bezug auf Menschen, Technologie, Zeit und Daten.
( Entdeckung
r Datenaufbereitung
r Modellbau
r Modellplanung
Die folgenden Aktivitäten sind Teil der Entdeckungsphase, AUSSER
0 Das Team bestimmt, wie viel Geschäfts- oder Domänenwissen der Data Scientist benötigt, um Modelle zu
entwickeln.
N t Das Team katalogisiert die Datenquellen, auf die das Team Zugriff hat, und identifiziert zusätzliche Daten
(• Quellen, die das Team nutzen kann.
0 Das Team identifiziert die Hauptziele des Projekts, identifiziert, was geschäftlich erreicht werden muss, und
identifiziert, was getan werden muss, um die Bedürfnisse zu erfüllen.
r Das Team identifiziert die wichtigsten Stakeholder und ihre Interessen am Projekt.
Welche der folgenden Aussagen beschreiben die Schlüsselrolle des Dateningenieurs?
r bietet Zugriff auf wichtige Datenbanken oder Tabellen und stellt sicher, dass die entsprechenden
Sicherheitsstufen in Bezug auf die Datenrepositorien vorhanden sind.
(führt die eigentlichen Datenextraktionen durch und führt erhebliche Datenmanipulationen durch, um die
Analyse zu erleichtern.
0 bietet Fachwissen für Analysetechniken, Datenmodellierung und die Anwendung gültiger Analysetechniken
auf bestimmte Geschäftsprobleme.
r vermittelt Business-Domain-Expertise basierend auf einem tiefen Verständnis der Daten, Key Performance
Indicators (KPIs), Key Metrics und Business Intelligence aus Reporting-Perspektive.
Welche der folgenden Aktivitäten ist NICHT an der Identifizierung potenzieller Datenquellen beteiligt?
0 Erfassen Sie aggregierte Datenquellen
r Auswertung der benötigten Datenstrukturen und Tools
(”Auszug durchführen, transformieren, Prozesse in Daten laden
0 Erfassen Sie die Art der benötigten Dateninfrastruktur
In dieser Phase des Datenanalyse-Lebenszyklus liefert das Team Abschlussberichte, Briefings, Code und
technische Dokumente.
r Modellbau

r Modellplanung

0 Ergebnisse kommunizieren

( Operationalisieren

Welche der folgenden Aussagen TRIFFT auf den Lebenszyklus der Datenanalyse zu?
I. Ein häufiger Fehler, der in Data-Science-Projekten gemacht wird, besteht darin, in die Datenerfassung und
-analyse zu stürzen, was verhindert, dass genügend Zeit darauf verwendet wird, den damit verbundenen
Arbeitsaufwand zu planen und zu erfassen, Anforderungen zu verstehen oder sogar das Geschäftsproblem
richtig zu gestalten.
II. Ein guter Datenanalyseprozess gewährleistet eine umfassende und wiederholbare Methode zur
Durchführung von Analysen und hilft, Zeit und Energie zu konzentrieren.

r I only

r Nur II

c sowohl I als auch II

r weder ich noch


II

Das Folgende ist Teil der Datenaufbereitungsphase, MIT AUSNAHME der Durchführung von ETLT
r Vermessung und Visualisierung
(Entwicklung der Ausgangshypothese
r Vorbereitung der Analytic Sandbox
Welche der folgenden Schlüsselfragen sind während der Entdeckungsphase hilfreich, wenn Sie den
Projektsponsor interviewen?
C Was ist das gewünschte Ergebnis des Projekts? Welche Datenquellen stehen zur Verfügung?
r Welche Datenquellen stehen zur Verfügung?
0 Welche Branchenprobleme können sich auf die Analyse auswirken?
(* Alle der oben genannten
Welche der folgenden Personen stellt die Finanzierung bereit und misst den Wertgrad anhand der endgültigen
Ergebnisse des Arbeitsteams in einem Datenanalyseprojekt?
r Projektmanager
( Projektsponsor
r Business Intelligence Analyst

r Geschäftsbenutzer

Quiz 4

Welche der folgenden Aussagen TRIFFT auf den Modellbau zu?


I. Die Phasen der Modellplanung und des Modellbaus können sich ziemlich stark überschneiden, und in der
Praxis kann man zwischen den beiden Phasen eine Weile hin und her iterieren, bevor man sich auf ein
endgültiges Modell einlässt.
II. Obwohl die Modellierungstechniken und die Logik, die für die Entwicklung von Modellen erforderlich sind,
sehr komplex sein können, kann die tatsächliche Dauer dieser Phase im Vergleich zu der Zeit, die für die
Vorbereitung der Daten und die Definition der Ansätze aufgewendet wird, kurz sein.
r I only

r Nur II

c sowohl I als auch II

r weder ich noch


II

Welche der folgenden sind kostenlose oder Open-Source-Tools für Datenanalyse-Praktiker? r SAS Enterprise
Miner
r SPSS-Modeler
0 Oktave
n Alpine Miner
Welche der folgenden Leistungen werden in der Operationalisierungsphase erbracht?
r Präsentation für Projektsponsoren
r Präsentation für Analysten
r Technische Spezifikationen zur Implementierung des Codes
(* Alle der oben genannten
Die folgenden Aktivitäten sind im Rahmen der Modellplanungsphase beteiligt, MIT AUSNAHME der Bewertung
der Struktur der Datensätze.
r Stellen Sie sicher, dass die Analysetechniken es dem Team ermöglichen, die Geschäftsziele zu erreichen und
die Arbeitshypothesen zu akzeptieren oder abzulehnen.
0 Bewerten Sie, ob ähnliche, bestehende Ansätze verfügbar sind oder ob das Team etwas Neues schaffen
muss.
(Bewerten Sie die Gültigkeit des Modells und seiner Ergebnisse.
Welche der folgenden Aussagen TRIFFT auf die Modellplanung zu?
I. In dieser Phase entwickelt das Team Datensätze für Schulungs-, Test- und Produktionszwecke.
II. Datenexploration, Variablen- und Modellauswahl charakterisieren diese Phase.
r I only

(II nur
r sowohl I als auch II

r weder ich noch


II

Welche der folgenden Aussagen TRIFFT auf die letzte Phase des Lebenszyklus der Datenanalyse zu?
I. In der letzten Phase kommuniziert das Team die Vorteile des Projekts breiter und richtet ein Pilotprojekt
ein, um die Arbeit kontrolliert einzusetzen, bevor die Arbeit auf ein vollständiges Unternehmen oder Ökosystem
von Benutzern ausgeweitet wird.
II. In dieser Phase reflektiert das Team das Projekt und überlegt, welche Hindernisse im Projekt bestanden
und was in Zukunft verbessert werden kann, und gibt Empfehlungen für zukünftige Arbeiten oder
Verbesserungen bestehender Prozesse.
( I nur

r Nur II

r sowohl ich als auch II

r weder Inoch
II

Bei der Erstellung robuster Modelle müssen die folgenden Fragen berücksichtigt werden, AUSSER r Vermeidet
das Modell unerträgliche Fehler?
(Wie konsistent sind die Inhalte und Dateien?
r Muss einer der Eingänge transformiert oder eliminiert werden?
r Unterstützt das gewählte Modell die Laufzeitanforderungen?
Welche der folgenden Aktivitäten werden in Phase 5 des Datenanalyse-Lebenszyklus durchgeführt?
r Das Team stellt fest, ob es seine Ziele erreicht oder verfehlt hat.
r Das Team reflektiert die Auswirkungen dieser Ergebnisse und misst den Geschäftswert.
0 Das Team zeichnet alle Ergebnisse auf und wählt dann die drei wichtigsten aus, die mit den Stakeholdern
geteilt werden können.
<• Alle der oben genannten

Quiz 5

Vor jeder Regressionsmodellierung sollten die Daten immer auf Folgendes überprüft werden, AUSSER r Daten
– Eingabefehler
(Erwartetes Muster
r Ausreißer
r Fehlende Werte

Welche der folgenden Aussagen ist/sind IMMER WAHR?


I. Die Inferenzstatistik besteht aus Schätzungs- und Hypothesentests
II. Der Zusammenhang zwischen Inferenz- und deskriptiver Statistik ist nur die Wahrscheinlichkeit r I

q II only

«sowohl I als auch II

c weder ich noch


II

Bei der Prognose der Umsatzerlöse anhand der Ausgaben für Zeitungsanzeigen haben wir die folgenden
Regressionsergebnisse

Schätzen Sie den prognostizierten Umsatz, wenn die Ausgaben für Zeitungsanzeigen 60 Einheiten
betragen.

(• 15.
6

q 17.
4

q 19.
2

c 20.
8

Das Folgende charakterisiert Inferenzstatistiken AUSSER r Schlussfolgerungen für eine größere Gruppe/Daten
ziehen
(Beziehungen bestimmen
(Gegenwärtige Daten

r Vorhersage treffen
Welche der folgenden Aussagen zur einfachen Regression TRIFFT IMMER zu?
I. Einfacher Regressionsversuch, die abhängige Variable mit mehr als einer unabhängigen Variablen
vorherzusagen.
II. Die einfache Regression besteht aus einem Regressionskoeffizienten für jede erklärende Variable.
r I only

r II only

r sowohl I als auch II

(weder ich noch


II

Welche der folgenden Aussagen zur Regressionsanalyse TRIFFT IMMER zu?


I. Es ist die am häufigsten verwendete Technik, um die Beziehung zwischen zwei oder mehr Variablen zu
analysieren.
II. Prädiktorvariablen können entweder diskret oder kontinuierlich sein.
( I nur

r Nur II

r sowohl ich als auch II

r weder Inoch
II

Bei der Vorhersage von Umsatzerlösen mithilfe von TV- und Radio-Werbeausgaben haben wir die
folgenden Regressionsergebnisse

Schätzen Sie den prognostizierten Umsatz, wenn die Ausgaben für Fernseh- und Radiowerbung 200 bzw. 50
betragen.
r 19.
3

o 21.

r 23.
7

r 25.
9
Quiz 6
Basierend auf den folgenden Ergebnissen der logistischen Regression, welche der folgenden Aussagen ist/sind
WAHR?
I. Für jede 1 Einheit, die im Alter erhöht wird, erhöht sich der Wert der logistischen Funktion um 0,16.
II. Der Regressionskoeffizient für die Variable Verheiratet ist nicht signifikant.

Koeffi zienten
Schätzung Std. Fehler z-Wert PrO>|z|)
(Intercept) 3.415201 0.163734 20.858 <2e-16 ***
Alter -0,156643 0.004088 -38.320 <2e-16 ***
März 0.066432 0.068302 0.973 a.331
CUST_years 0,017857 0.030497 0,586 0,558
Chu rn ed_CONT Acts 0.382324 0.027313 13.998 <2e-16 ***
Vorzeichencodes: 0 * ***‘0,001 * **‘ 0,01 **‘0,05 ".‘0,1 ‘’ 1

r I only

(II nur

r sowohl I als auch II

r weder ich noch


II

Basierend auf den folgenden Ergebnissen der logistischen Regression, wie hoch ist die Wahrscheinlichkeit von
Churning, wenn Alter = 40 und Churned_Contacts = 5? (Hinweis: Rundenkoeffizienten bis zu 2
Nachkommastellen)
Koeffizienten:
Schätzung Std. Fehler z-Wert Pr(>|z|)
Quiz 2...............................................................................................................................................2
Quiz 6...............................................................................................................................................9

signif. codes: 0 '***’ 0,001 *2%’ 0,01 0.05 0.1 1 '1

(Dispersionsparameter für die Binomialfamilie beträgt 1} r 0,714


q 0.62 3

r 0,35

(* 0.26
9

Welche der folgenden Aussagen TRIFFT auf die Logistikfunktion zu?


I. Mit steigendem Wert von y steigt auch die Wahrscheinlichkeit des Ereignisses f(y).
II. Die Werte von y werden nicht direkt beobachtet, sondern nur der Wert von f(y) in Bezug auf Erfolg oder
Misserfolg.
r I nur

r Nur II

c beide I
und II
r weder ich
nor II

Welche der folgenden Aussagen TRIFFT auf die logistische Regression zu?
I. Wenn die Ergebnisvariable kategorial ist, kann die logistische Regression verwendet werden, um die
Wahrscheinlichkeit eines Ergebnisses auf der Grundlage der Eingangsvariablen vorherzusagen.
II. Die logistische Regression kann nur auf eine Ergebnisvariable mit zwei Werten wie wahr/falsch,
bestanden/nicht bestanden oder ja/nein angewendet werden.
( I nur

r Nur II

r beide I und II

r weder Inoch
II

Im Folgenden finden Sie Beispiele für Anwendungen für die logistische Regression, AUSSER
r Ein Modell über das erfolgreiche Ansprechen des Patienten auf eine bestimmte medizinische Behandlung mit
Variablen wie Alter, Gewicht, Blutdruck und Cholesterinspiegel.
r Ein Abwanderungsmodell für einen Kunden, der in ein neues Netzwerk wechselt, unter Berücksichtigung des
Alters und der Anzahl der Kontakte, die abgewandert sind.
(Ein Modell zur Bestimmung des Verhältnisses der Höhe des Einkommens in Bezug auf Alter, Bildung, Anzahl
der Arbeitsjahre und Geschlecht.
r Ein Modell zur Bestimmung der Wahrscheinlichkeit, dass eine Person ein neues Auto kauft, unter
Berücksichtigung von Alter, Einkommen und Geschlecht.

Das könnte Ihnen auch gefallen