Housing Market

Seminararbeit
Empirical Social Research
0207 Methods of Empirical Social Research

WS 2019/20
Melbourne Housing Market Analysis
Johannes Norbert Fend (11712655)

Lukas Stark (11712403)
Dragan Miskic (01637058)
Univ.Prof. Dr. Thomas Plümper, Maciej Filipek, BSc

Wien, 25.02.2020
Welthandelsplatz 1, A-1020, Wien

Telefon: +43/1/313 36/4622 ● Telefax: +43/1/313 36/717
Web: www.wu.ac.at/retail
Copyright-Klausel
Bitte sorgfältig lesen und vor der Abgabe der Arbeit unterschreiben!
Wir versichern durch unsere Unterschriften,

• dass wir die vorliegende Arbeit selbständig verfasst, andere als die
angegebenen Quellen und Hilfsmittel nicht benutzt und wir uns auch sonst
keiner unerlaubten Hilfe bedient haben.
• dass wir die vorliegende Arbeit bisher weder im Inland noch im Ausland
einer/m Beurteiler/in zur Begutachtung in irgendeiner Form als Prüfungsarbeit
vorgelegt haben.
Uns ist bewusst, dass ein Zuwiderhandeln sowohl studienrechtliche wie auch
strafrechtliche Konsequenzen nach sich zieht. Unmittelbar hat eine Copyright-
Verletzung einen negativen Ausschluss von der gegenständlichen Lehrveranstaltung
sowie eine umgehende Meldung beim Studiendekanat der Wirtschaftsuniversität Wien
sowie bei den vom Plagiat betreffenden Autor/innen zur Folge.
Johannes Norbert Fend Lukas Stark

(11712655)
(11712403)
Dragan Miskic
(01637058)
1 Danksagungen
Da wir nicht allwissend sind und uns doch irgendwo informieren als auch Wissen
aneignen müssen, möchten wir uns bei folgenden Institutionen bedanken:
Inhaltsverzeichnis
1 Danksagungen ........................................................................................... 3
Inhaltsverzeichnis ............................................................................................. I
Abbildungsverzeichnis....................................................................................... II
2 Abstract .................................................................................................... 1
3 Einleitung .................................................................................................. 2
3.1 Problemstellung und Forschungsfrage ..................................................... 3
4 Empirische Untersuchung ............................................................................ 4
4.1 Methodischer Steckbrief ........................................................................ 4
4.1.1 Pandas: ....................................................................................... 4
4.1.2 Numpy: ....................................................................................... 4
4.1.3 Sklearn: ...................................................................................... 5
4.1.4 Minitab ........................................................................................ 5
4.2 Angewandte Statistische Instrumente ..................................................... 5
4.2.1 Hypothesentest ............................................................................ 5
4.2.2 Boxplot ........................................................................................ 6
4.2.3 Regression ................................................................................... 6
4.3 Vorgehen bei der empirischen Auswertung .............................................. 7
4.3.1 Deskriptive Ergebnisse .................................................................. 7
4.3.2 Explorative Statistik ..................................................................... 11
4.3.3 Hypothesenprüfung ...................................................................... 12
5 Conclusio .................................................................................................. 14
5.1 Limitierungen der Arbeit und Implikationen für Forschung und Praxis ........ 14
5.1.1 Geplanter Zeitablauf..................................................................... 15
5.1.2 Tatsächlicher Zeitablauf ................................................................ 15
Literaturverzeichnis .......................................................................................... A
Anhang ........................................................................................................... B
I
Abbildungsverzeichnis
Abbildung 2: Fehlende Werte in % ..................................................................... 8
Abbildung 1: Fehlende Werte der jeweiligen Kategorien ........................................ 8
Abbildung 3: Preisverteilung Kategorien ............................................................. 8
Abbildung 4: Preisverteilung Balkendiagramm ..................................................... 8
Abbildung 5: Preisverlauf Wohnmöglichkeiten...................................................... 9
Abbildung 6: Preisverlauf wichtigster Viertel Melbournes ...................................... 10
Abbildung 7: Korrelation Preis/Distanz ............................................................... 11
Abbildung 8: Ergebnis des Hypothesentest ......................................................... 12
Abbildung 9: Hypothesentest ............................................................................ 12
Abbildung 10: Lageunterschied Wohmöglichkeiten/Preis ...................................... 12
Abbildung 11:Hypothesentest ........................................................................... 13
Abbildung 12: Lageunterschied Bezirk Abbotsford ............................................... 13
Abbildung 14: Lageunterschied Bezirk Brunswick ................................................ 13
Abbildung 13: Lageunterschied Bezirk Malvern ................................................... 13
Abbildung 15: Geplanter Zeitablauf ................................................................... 15
Abbildung 16: Tatsächlicher Zeitablauf .............................................................. 15
II
2 Abstract
Hat man den Immobilienmarkt die letzten Jahre beobachtet so scheint es als würden
die Preise stetig weiter in die Höhe steigen. Davon sind teils auch Objekte in
schlechtem Zustand nicht ausgenommen. Doch wie sieht es eigentlich ganz woanders
aus, beispielsweise in Melbourne, Australien.
In unserer Seminararbeit haben wir uns genau damit befasst und dabei den
Immobilienmarkt der letzten drei Jahre von Melbourne analysiert und ausgewertet.
Unser Ziel war es die Gründe der unterschiedlichen Preise herauszufinden und mit der
Hilfe von Diagrammen darzulegen. Zur Verfügung stand uns ein Datensatz mit über
35.000 Objekten welche nach verschiedenen Kriterien wie zum Beispiel der
Zimmeranzahl, der Größe der Immobilie oder auch der Suburb sortierbar war.
Bewerkstelligt haben wir unsere Analyse mit der Hilfe von Python und verschiedenen
Bibliotheken wie Pandas und Numpy. Hierfür haben wir zuerst den Datensatz bereinigt
damit Immobilien ohne jegliche Informationen nicht berücksichtigt wurden. Dies
minimierte unsere Datenliste um ungefähr 10.000 Häuser beziehungsweise
Apartments. Im Nachhinein erweiterten wir unseren Code und spielten die benötigten
Bibliotheken ein. Mit ihrer Hilfe war es uns möglich statistische Instrumente
anzuwenden und die vorhandenen Daten mit ihren Zusammenhängen auszuwerten.
Zu guter letzt haben wir die ausgewerteten Daten mit einem Tool namens Pyplot
visualisiert und mit Plots dargestellt.
1
3 Einleitung
Wer träumt nicht vom Leben als Aussteiger? Den grauen Alltag hinter sich zu lassen
und ins feine Klima auszuwandern. Australien ist da meist einer der ersten Gedanken.
Die Leute sind freundlich und aufgeschlossen, Sandstrände soweit das Auge reicht und
meist weit vom jetzigen Umfeld entfernt.
Als wir in der Lehrveranstaltung Empirische Sozialforschung also aufgefordert wurden

uns ein Thema auszusuchen für unser Projekt, stach Australien direkt heraus. Somit
fanden sich auch Lukas Stark, Dragan Miskic und Johannes Fend relativ schnell. Auch
wir träumen von Sonne, Strand und perfekten Wellen.
Schnell fanden wir uns darauf hin zusammen und beschlossen eine Gruppe zu bilden.
Also befassten wir uns damit, den Wohnungsmarkt in Melbourne zu analysieren. Das
war auch für uns das erste Mal, dass wir uns mit so großen Datensätzen befassen
mussten. Jedoch hatte keiner Erfahrung mit Datenanalyseinstrumenten,
dementsprechend entschlossen wir uns kurzerhand unsere Analyse mit Python
voranzutreiben.
Im Folgenden Dokument werden unsere Gedanken, Grundlagen als auch unsere

Ergebnisse und sämtliche Ausschlüsse aufbereitet dargestellt.
Weiteres erläutern wir unsere Annahmen und Methoden auf Theoretischen Basen
verschiedener Literarischen Artikel und Arbeiten.
2
3.1 Problemstellung und Forschungsfrage
Am Anfang unserer Analyse mussten wir einige Forschungsfragen und Themen

festlegen, die Basis für unsere Arbeit sein könnten. Schnell wurde uns klar das der
Hauptfaktor für Wohnräumlichkeiten der Preis, die Lage und die Größe sind. Deshalb
haben wir uns dazu entschieden, unsere Forschungsfrage auf diese Themen zu
fokussieren und unsere Analyse in Anbetracht darauf zu konkretisieren.
Daneben ist der Faktor Geld bei uns, wie bei vielen anderen Menschen einer der
Hauptentscheidungsfaktoren und nach unseren Überlegungen haben wir uns
entschieden, Wir haben folgende Forschungsfragen formuliert, allerdings haben wir
auch andere Zusammenhänge untersucht:
• Wie haben sich die Preise über die Jahre verändert?
• Wie ist das Verhältnis zwischen Preis und Entfernung zum Stadtzentrum?
• In welchem Maße unterscheiden sich die Preise zwischen den einzelnen
Immobilientypen?
3
4 Empirische Untersuchung
4.1 Methodischer Steckbrief

Zur Auswertung und weiteren Analyse der Daten haben wir uns für Python
entschieden.
Dieser Entschluss fasten wir, durch die Erkenntnis, dass wir keine Erfahrungen mit
etwaigen Programmen zur Datenanalyse hatten. Da Python jedoch nur eine Plattform
bietet, jedoch an sich keine Werkzeuge zur Auswertung und Analyse mitbringt
verwendeten wir die Bibliotheken, Pandas, Sklearn und Numpy.
4.1.1 Pandas:
Pandas ist eine Software-Bibliothek, die für Python geschrieben wurde. Sie wird
hauptsächlich für Daten-Manipulation und -Analyse verwendet. Sie stellt spezielle
Funktionen und Datenstrukturen zur Verfügung für die Manipulation von numerischen
Tabellen. Pandas ist eine Free-to-use Software und somit ohne Kosten verwendbar.
Oft gibt es Verwirrung darüber, ob Pandas nicht eine Alternative zu Numpy, Scipy und
Matplotlib sei. Die Wahrheit ist aber, dass Pandas auf Numpy aufbaut. Das bedeutet
auch, dass Numpy für Pandas Voraussetzung ist.
Auch wenn oft vermutet wird, dass Pandas eine Alternative zu Numpy, Matlotlib und
etc. sei, so ist dem nicht so. Pandas baut auf Numpy auf! Im Folgeschluss ist Numpy
auch Vorrausetzung.
4.1.2 Numpy:
Numpy leitet sich ab aus Numerisches Python. Numpy ist dabei nicht in Python
implementiert, sondern größtenteils in C. Dies stellt sicher, dass die
Ausführungsgeschwindigkeit so hoch wie möglich gehalten wird.
Es wird dabei hauptsächlich verwendet, um das Rechnen mit großen Matrizen und
Arrays zu handhaben und bietet dabei eine große Auswahl mathematische Funktionen,
um die das Arbeiten mit jenen erleichtern.
4
4.1.3 Sklearn:
Sklearn ist die Abkürzung für Scikit-learn und beschreibt eine weitere Software
Bibliothek, welche das maschinelle Lernen in Python ermöglicht. Diese Bibliothek stellt
verschiedene Algorithmen zum Clustering-, Regressions- oder
Klassifizierungsalgorithmen zur Verfügung.
Auch diese Software Bibliothek arbeitet mit Numpy zusammen. Es bietet somit
hervorragende Qualitäten und einfache Tools für Data Mining als auch Datenanalysen.
4.1.4 Minitab
Minitab ist eine gratis Software, die es unter anderem ermöglicht Varianzanalysen
durchzuführen aber auch andere statistische Instrumente zur Verfügung stellt.
4.2 Angewandte Statistische Instrumente
4.2.1 Hypothesentest
Hypothesentests sind einer der wichtigsten Themen in der empirischen Forschung.
Wir haben dieses Instrument für unsere Analyse auch gewählt und in diesem
Vorgehen muss man über einen Sachverhalt eine Vermutung anstellen, die
sogenannte Hypothese. Für weitere Analyse muss man Daten sammeln und
analysieren und anschließend mit Hypothesentests die Vermutung bestätigen oder
ausschließen.
Hypothesenbereich kann man in Nullhypothese und Alternativhypothese einteilen.
Nullhypothese können wir mit H0 beschriften und diese Hypothese wollen wir
falsifizieren, Alternativhypothese beschriftet man mit H1 und diese Hypothese ist
meistens unsere eigentliche Forschungshypothese. Erster Schritt bei einem
Hypothesentest ist Null und Alternativhypothese zu formulieren und danach müssen
wir einen Test wählen. Es gibt verschiedene Arten von Tests und diese unterscheiden
sich vor allem durch den Parameter, der getestet werden soll, durch die Verteilung
des Merkmals in der Grundgesamtheit und den Stichprobenumfang. Hypothesentests
sind auch eng mit den Konfidenzintervallen verwandt. Bekannteste Tests sind Chi-
Quadrat Anpassungstest, einstichproben t-Test, gepaarter t-Test, Wilcoxon-
Vorzeichen-Rang-Test, Fisher-Test und weitere. [1]
Danach muss man Signifikanzniveau festlegen. Signifikanzniveau bezeichnet die

Wahrscheinlichkeit, mit der im Rahmen eines Hypothesentests die Nullhypothese
fälschlicherweise verworfen werden kann, obwohl sie eigentlich richtig ist und es wird
auch als Irrtumswahrscheinlichkeit bezeichnet. Danach kann man die Daten
sammeln, Prüfgröße berechnen und die Verteilung der Prüfgröße bestimmen. Die
Prüfgröße ist eine Rechenvorschrift, die die Daten einer Stichprobe zu einem Wert
5
zusammenfasst, der geeignet ist, eine Entscheidung über die Gültigkeit bzw. Nicht
Gültigkeit der Nullhypothese eines statistischen Tests zu treffen.“ (Einführung in die
medizinische Statistik Hilgers, Bauer). Am Ende muss man noch Kritischen Bereich
oder p-Wert berechnen und Testentscheidung treffen. Der P Wert eines
Signifikanztests macht eine Aussage darüber, wie hoch die Wahrscheinlichkeit ist,
dass die untersuchten Unterschiede alleine auf Zufall beruhen. Nach dem Vergleich
aller Daten und Berechnungen kann man eine Testentscheidung treffen. [2]
4.2.2 Boxplot
Ein Boxplot ist eine einfache grafische Methode zur Visualisierung der Lage und
Streuung eines Datensatzes und eignet sich daher besonders zum optischen
Vergleich mehrerer Datensätze. Die Lage- und Streuungsmaße, die im Boxplot
Verwendung finden, können unterschiedlich gewählt werden. Ein Boxplot besteht aus
einem Kasten („box“) und zwei Linien („whiskers“), die links und rechts von diesem
Kasten wegführen. Eine Achse gibt an, welche Skalierung der Daten vorliegt. Bei der
Basisvariante des Box-Plots werden der linke Rand des Kastens durch das untere
Quartil, der rechte Rand durch das obere Quartil festgelegt. Der Abstand zwischen
dem linken und rechten Rand des Kastens ist somit gleich dem Quartilsabstand Q.
Im Innern des Kastens wird der Median der Beobachtungswerte markiert. Der linke
Whisker endet normalerweise beim Minimum des Datensatzes, der rechte beim
Maximum und der Abstand zwischen den beiden äußeren Enden der Linien ist daher
durch die Spannweite gegeben.[3]
4.2.3 Regression
Die Regressionsanalyse ist eines der flexibelsten und am häufigsten eingesetzten
statistischen Analyseverfahren. Sie dient der Analyse von Beziehungen zwischen
einer abhängigen Variablen und einer oder mehreren unabhängigen Variablen und
sie wird insbesondere eingesetzt um Zusammenhänge quantitativ zu beschreiben
und zu erklären und Werte der abhängigen Variablen zu schätzen bzw. zu
prognostizieren. Der primäre Anwendungsbereich der Regressionsanalyse ist die
Untersuchung von Kausalbeziehungen (Ursache-Wirkungs-Beziehungen), die wir
auch als Je-Desto Beziehungen bezeichnen können. Es soll betont werden, dass sich
weder mittels Regressionsanalyse noch sonstiger statistischer Verfahren Kausalitäten
zweifelsfrei nachweisen lassen. Vielmehr vermag die Regressionsanalyse nur
Korrelationen zwischen Variablen nachzuweisen. Dies ist zwar eine notwendige, aber
noch keine hinreichende Bedingung für Kausalität. Im Gegensatz zu einer einfachen
Korrelationsanalyse kann die Regressionsanalyse viel mehr leisten. [4]
Der große Vorteil der Regressionsanalyse ist, dass sie den Einfluss eines einzelnen
Merkmals auf eine abhängige Variable unter konstant Haltung der anderen
Einflussgrößen schätzt. Bei der linearen Regression werden nur lineare bzw.
linearisierbare Einflussbeziehungen auf metrisch abhängige Variablen erfasst. Das
Merkmal, welches jeweils erklärt werden soll, wird auch als abhängige Variable
bezeichnet. Die erklärenden Merkmale werden dementsprechend als unabhängige
Variablen oder als Prädiktoren bezeichnet. Allen regressionsanalytischen Verfahren
6
ist gemeinsam, dass mit ihnen überprüft werden kann, inwieweit ein interessierendes
Merkmal auf andere Merkmale zurückgeführt werden kann.[5]
4.3 Vorgehen bei der empirischen Auswertung
Durch die enorme Menge an Informationen, welche wir durch jener Datensätze zur
Verfügung hatten überlegten wir uns natürlich zuerst welche Zusammenhänge
interessant wären darzustellen und zudem auch noch signifikante Unterschiede
zeigen.
Da keiner unserer Gruppe aus Wien oder der Umgebung kommt haben wir uns
dieselben Fragen gestellt wie damals bei unserer Wohnungssuche. So war von
vornherein klar, dass eine entsprechende Lage samt Umfeld ihren gewissen Preis mit
sich bringt. Eine 1 Zimmerwohnung mit guter Infrastruktur und exzellenter Lage kann
auch mal kostspieliger sein als ein Haus mit mehreren Zimmern, schlechter
Verkehrsanbindungen und Nachbarschaft.
Nichtsdestotrotz haben sich die meisten Annahmen bestätigt. Die Nähe zum zentrum
sowie auch größe des Types (House, Townhouse, Condo) sind meist die
ausschlaggebenden Faktoren, wenn es um die Höhe des Preises geht.
Mit was wir nicht gerechnet hatten ist beispielsweise der Rückgang der Preise im
letzten Jahr. Bedenkt man die immer steigenden Bevölkerungszahlen und den Trend
der immer größer werdenden Städte so kann man dies sicherlich als Überraschung
sehen.
4.3.1 Deskriptive Ergebnisse

Aus der ganzen Analyse kommen nun gebündelt die wichtigsten Informationen, die
aus dem Datensatz hervorgehen.
Erstmals zur Konsistenz der Daten, wie schon erhoben war unser Datensatz leider sehr
unvollständig.
Wie sie hier sehen können mussten wir leider von den einst 36.000 Datensätzen durch
ihre Inkonsistenz 9.000 Datensätze streichen. Dabei fiel auf, dass die meisten leeren
Datenzellen in den Kategorien Regionname, Propertycount und CouncilArea fehlten.
7
Aber auch die auch die Fehlwerte der Kategorien Buildingarea YearBuilt fließen in diese
Rechnung der fehlenden Werte signifikant ein.
Abbildung 1: Fehlende
Werte in %
Abbildung 2: Fehlende Werte der jeweiligen Kategorien
Als wir diese nicht vorhandenen Daten aus dem Datensatz entfernt hatten, konnten
wir nun endlich beginnen. Um einen groben Überblick zu erhalten, haben wir erstmals
eine Preisverteilung der Wohnmöglichkeiten in und um Melbourne abgefragt, welche
folgendermaßen ausschaut:
Abbildung 3:
Preisverteilung
Abbildung 4: Preisverteilung Balkendiagramm
Kategorien
Hierzu haben wir mit Hilfe von pyplot ein Histogramm erstellt, welches die die
Verteilung der Häufigkeit der anzutreffenden Preis-Reichweiten dargestellt. Man
8
erkennt, dass die Verteilung mehr oder weniger normalverteilt ist, jedoch mit einer
leichten rechtsschiefe. Der Median beträgt dabei 870.000 AUD und der
Durchschnittswert 1.050.870 AUD.
In der rechten Grafik ist noch eine Aufschlüsselung der Verteilung der Werte. Hierbei
sieht man deutlich, dass sowohl sehr viele Wohnräume im Preissegment zwischen
100.000 und 1M aber auch 1M bis 3 M liegen.
Preisanstiege über die Jahre der unterschiedlichen Stadtviertel als auch verschiedener
Räumlichkeiten.
In der ersten Grafik sieht man den Preisverlauf der einzelnen
Wohnungsmöglichkeiten.
Allgemein ist der Preis von Häusern von 2016 gefallen. Anders ist es bei den
Wohnungen und Stadthäusern. Stadthäuser sind von 2016 auf 2017 preislich
gestiegen und von 2017 auf 2018 wieder gefallen. Wohnung sind als einzige über die
Jahre hinweg mehr oder weniger konstant gestiegen.
Abbildung 5: Preisverlauf Wohnmöglichkeiten
Im nächsten Plot werden die Preisverläufe der einzelnen Viertel samt

Wohnmöglichkeiten genauer beleuchtet. Wenn wir beispielsweise die Regionen
Northern Victoria und South Metropolitan vergleichen, können wir feststellen, dass
beispielsweise sich in NV die Preise zwischen den unterschiedlichen Immobilientypen
kaum unterscheiden.
9
Wohingegen in SM die unterschiedlichen Wohnmöglichkeiten sehr weit auf spreizen.

Die Blauen Linien bezeichnen hierbei Häuser, die Orangen Stadthäuser und die grünen
Wohnungen
Abbildung 6: Preisverlauf wichtigster Viertel Melbournes
Der letzte Zusammenhang, den wir in unserer Analyse festgestellt haben, ist die
Korrelation zwischen dem allgemeinen Preisniveau aller Wohnmöglichkeiten und der
Distanz zum Stadtzentrums Melbournes.
10
4.3.2 Explorative Statistik
Einer der wichtigsten Zusammenhänge ist natürlich die Lage im Gegensatz zum Preis.
Hierbei ist ganz klar zu erkennen, dass der Preis geringer wird je weiter man vom
Zentrum entfernt wohnt. Zu sehen ist dabei auch, dass ab einer Distanz von etwa 4
km die Preise wieder steigen, dies ist darauf zurückzuführen, dass ab diesem Radius
die noblen Außenbezirke von Melbourne beginnen und die Grundstückpreise
dementsprechend wieder zu steigen beginnen.
Abbildung 7: Korrelation Preis/Distanz
11
4.3.3 Hypothesenprüfung
Da der Preis einer Immobilie von vielen verschiedenen Faktoren abhängt, ist es etwas
schwieriger einen Hypothesentest zu finden welcher auch aussagekräftig ist. Speziell
die vielen Ausreißer die sich durch den gesamten Datensatz ziehen führen
logischerweise zu einem P-Value welcher nahezu bei 0 liegt. Dies belegen auch die
untenstehenden Auswertungen sowie das Boxplot Diagramm. Hier wurden sämtliche
Immobilientypen von ganz Melbourne verglichen.
Abbildung 9: Hypothesentest Abbildung 8: Ergebnis des Hypothesentest
Abbildung 10: Lageunterschied Wohmöglichkeiten/Preis
Aufgrund dessen waren wir gezwungen unsere Stichproben etwas weiter

einzuschränken, um eine Varianzanalyse durchführen zu können. Dabei haben wir uns
auf verschiedene Viertel der Stadt beschränkt da wir der Meinung waren dadurch etwa
ähnlichere Preise vorzufinden.
Die Hypothesentests führten wir mit der Hilfe von Minitab, einer Statistik Software,
durch und überprüften dabei inwieweit sich die Mittelwerte der drei Immobilientypen
12
(h = House, t = Townhouse, u = Unit) in bestimmten Suburbs unterscheiden (ɑ =

0,1).
Abbildung 11:Hypothesentest
Abbildung 12: Lageunterschied Bezirk Abbotsford
Abbildung 14: Lageunterschied Bezirk Malvern
Abbildung 13: Lageunterschied Bezirk Brunswick
13
Wie man sehen kann unterscheidet es sich von Suburb zu Suburb wie nahe die
Preise für die jeweiligen Immobilientypen zusammenliegen. Während sich die Preise,
egal ob Haus, Stadthaus oder Wohnung, in Abbotsford nicht signifikant
unterscheiden (P-Value = 0,643), sieht es in Brunswick wiederum anders aus. Dort
wird die 5% Grenze ziemlich deutlich überschritten was zu einer Verwerfung der
Nullhypothese führt und sich somit die Preise deutlich unterscheiden.
5 Conclusio
5.1 Limitierungen der Arbeit und Implikationen für

Forschung und Praxis
Da dies unsere erste Wissenschaftliche Studie im Feld der Datenanalyse war hatten
wir einige große Hürden zu überwinden. Die erste, gleich zu Beginn zu tragen
kommende, war die richtige Statistische Software zu verwenden, welche mit unserem
Wissenstand beherrschbar und auch steuerbar war. Da das einzige uns vertraute
Programm Python war entschieden wir uns für diesen Weg. Doch um aus Python eine
Maschine zu erstellen die im Stande dazu war, Daten auch sinnvoll zu verarbeiten
mussten wiederum neue Bibliotheken eingebunden werden (Pyplot, Sklearn, Matplotlib
etc.). Wiederholt standen wir vor einer uns unbekannten Software, die alle
verschiedene Wege bat, diese zu implementieren. Doch nach aufwendiger Recherche,
Teamwork und viel Trial-and-Error kamen wir doch noch zu den uns verhofften
Lösungen.
Ein weiterer wichtiger Faktor zur Fertigstellung solcher Projekte und
Wissenschaftlichen Studien ist Teamwork. Dieses kann sich jedoch auch für Studenten
schwierig gestalten, denn die meisten Studenten belegen nicht die gleichen Kurse noch
sind zur selben Zeit an der Universität.
Kommen wir nun zur letzten und womit größten Hürde für Studenten. Prokrastination.
Wie man sehr schön erkennen kann, hat mir Semesterbeginn alles nach Plan geklappt.
Umso weiter die Zeit und das Semester jedoch fortschritten, desto weiter zögerte man
gewisse Arbeitsschritte hinaus. Dies führt sogleich zum zweiten Diagramm wo Sie
visuell erkennen können, welche Arbeiten aufgeschoben wurden.
14
5.1.1 Geplanter Zeitablauf
Abbildung 15: Geplanter Zeitablauf
5.1.2 Tatsächlicher Zeitablauf
Abbildung 16: Tatsächlicher Zeitablauf
15
Literaturverzeichnis
[1] Daten und Statistik- Gabriele Hornsteiner, Beschreibende Statistik pp 181-234
[2] Einführung in die medizinische Statistik pp 1999
[3] Beschreibende Statistik, Grundlegende Methoden der Datenanalyse; Burkschat,
Cramer, Kamps; pp 105-106
[4] Multivariate Analysenmethoden, Backhaus K., Erichson B. Plinke W; Weiber R.; pp 58-
62
[5] Handbuch der sozialwissenschaftlichen Datenanalyse, Christoph Wolf, Henning Best;
pp 607-608

Housing Market

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Housing Market

Hochgeladen von

Copyright:

Verfügbare Formate

Seminararbeit

Empirical Social Research

0207 Methods of Empirical Social Research

Melbourne Housing Market Analysis

Johannes Norbert Fend (11712655)

Univ.Prof. Dr. Thomas Plümper, Maciej Filipek, BSc

Welthandelsplatz 1, A-1020, Wien

Wir versichern durch unsere Unterschriften,

Johannes Norbert Fend Lukas Stark

Als wir in der Lehrveranstaltung Empirische Sozialforschung also aufgefordert wurden

Im Folgenden Dokument werden unsere Gedanken, Grundlagen als auch unsere

3.1 Problemstellung und Forschungsfrage

Am Anfang unserer Analyse mussten wir einige Forschungsfragen und Themen

4.1 Methodischer Steckbrief

4.2 Angewandte Statistische Instrumente

Danach muss man Signifikanzniveau festlegen. Signifikanzniveau bezeichnet die

4.3 Vorgehen bei der empirischen Auswertung

4.3.1 Deskriptive Ergebnisse

Abbildung 2: Fehlende Werte der jeweiligen Kategorien

Abbildung 5: Preisverlauf Wohnmöglichkeiten

Im nächsten Plot werden die Preisverläufe der einzelnen Viertel samt

Wohingegen in SM die unterschiedlichen Wohnmöglichkeiten sehr weit auf spreizen.

Abbildung 6: Preisverlauf wichtigster Viertel Melbournes

4.3.2 Explorative Statistik

Abbildung 7: Korrelation Preis/Distanz

Abbildung 9: Hypothesentest Abbildung 8: Ergebnis des Hypothesentest

Abbildung 10: Lageunterschied Wohmöglichkeiten/Preis

Aufgrund dessen waren wir gezwungen unsere Stichproben etwas weiter

(h = House, t = Townhouse, u = Unit) in bestimmten Suburbs unterscheiden (ɑ =

Abbildung 12: Lageunterschied Bezirk Abbotsford

Abbildung 14: Lageunterschied Bezirk Malvern

Abbildung 13: Lageunterschied Bezirk Brunswick

5.1 Limitierungen der Arbeit und Implikationen für

5.1.1 Geplanter Zeitablauf

Abbildung 15: Geplanter Zeitablauf

5.1.2 Tatsächlicher Zeitablauf

Abbildung 16: Tatsächlicher Zeitablauf

Das könnte Ihnen auch gefallen