Willkommen bei Scribd!

Predict AirBnb Listing Prices with Machine Learning

Hochgeladen von

0% fanden dieses Dokument nützlich (0 Abstimmungen)

33 Ansichten1 Seite

You have been provided with a Seattle Airbnb dataset and asked to predict listing prices in the test set using a model of your choice. You are to perform exploratory data analysis to understand relationships between variables, conduct any needed data engineering, test several models and select a final model to make predictions. Your submission should include a Jupyter notebook documenting your process and a CSV file with predictions for the test set.

Originalbeschreibung:

Originaltitel

Problem Statement

Copyright

Verfügbare Formate

DOCX, PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

Copyright:

Verfügbare Formate

Als DOCX, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

0% fanden dieses Dokument nützlich (0 Abstimmungen)

33 Ansichten1 Seite

Predict AirBnb Listing Prices with Machine Learning

Hochgeladen von

suryansh

Copyright:

Verfügbare Formate

Als DOCX, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 1

Im Dokument suchen

You have been provided with the Seattle AirBnb dataset of listings data.

You will need to predict

the prices of listings shared in the test dataset. A natural use case for this would be in helping
people price their listings. In your assignment, feel free to use either Python or R, with any
libraries of your choice. You will be evaluated on being able to justify your solution during the
interview, explain the underlying mathematics and statistical phenomena, and make accurate
predictions.

Task Description

1. Download a sample of the Seattle AirBnb listings dataset linked here (original data can be
found here).

2. The goal of the assignment is to predict the prices of AirBnb listings from the test set, using a
model carefully selected by you, trained, tested, and explained.

3. Conduct some exploratory data analysis and understand the relationships between potential
predictors. Document your EDA in a notebook.

4. Note that this is not a particularly large dataset. You will be partially scored based on your
ability to perform ETL on the dataset. Describe what you have done for ETL in 3-4 sentences.

5. Try out a few different models (use your judgement after doing the EDA), and note down why
you have tried each one (2-3 sentences describing the “why” is enough).

6. Pick your final model, and explain why this model is better than the others. Train it, test it, and
list out your analyses (4-5 sentences, or more if required). Finally, run your predictions on the
real test set provided above. Submission Your final submission should be have two files, as
follows

: 1. Notebook with the following components and partial scores for each component: a. EDA-
documented in the notebook, with graphs describing correlations between variables, potential
predictors, initial analyses on the data, and feature engineering (if any)

b. Data Engineering - documented in the notebook, in a few sentences describing the ETL
process and any data engineering that was performed

c. Initial Modelling - a few models run on smaller folds of the dataset, with explanations for why
each model was experimented with

d. Model Selection - analyses around output from each of the models initially selected, and
justification for selecting one model over the others you had initially contemplated 2. CSV file of
listing prices for the test set: a. Final Predictions - each listing from the data set and the model-
predicted price (2 columns: id, price)

Das könnte Ihnen auch gefallen

ETL Testing Strategies for Data Completeness and Transformation
Dokument12 Seiten
ETL Testing Strategies for Data Completeness and Transformation
Bijjam Mohanreddy
Noch keine Bewertungen
Vijaya ML
Dokument26 Seiten
Vijaya ML
Vijayalakshmi Palaniappan
83% (6)
Cmps 396X Advanceddata Science: Fatima K. Abu Salem Exploratory Analysis Driving Visual Analysis With Automobile Data
Dokument113 Seiten
Cmps 396X Advanceddata Science: Fatima K. Abu Salem Exploratory Analysis Driving Visual Analysis With Automobile Data
Hussein ElGhoul
100% (1)
Introduction To Logic and Critical Thinking: Phi 1 Reference: Bachhuber SJ, Andrew
Dokument43 Seiten
Introduction To Logic and Critical Thinking: Phi 1 Reference: Bachhuber SJ, Andrew
John Paul Vitug
Noch keine Bewertungen
Advanced Analytics with Transact-SQL: Exploring Hidden Patterns and Rules in Your Data
Von Everand
Advanced Analytics with Transact-SQL: Exploring Hidden Patterns and Rules in Your Data
Dejan Sarka
Noch keine Bewertungen
DATA MINING AND MACHINE LEARNING. PREDICTIVE TECHNIQUES: REGRESSION, GENERALIZED LINEAR MODELS, SUPPORT VECTOR MACHINE AND NEURAL NETWORKS
Von Everand
DATA MINING AND MACHINE LEARNING. PREDICTIVE TECHNIQUES: REGRESSION, GENERALIZED LINEAR MODELS, SUPPORT VECTOR MACHINE AND NEURAL NETWORKS
César Pérez López
Noch keine Bewertungen
Data Scientist Test Task V2
Dokument1 Seite
Data Scientist Test Task V2
suryansh
Noch keine Bewertungen
Ass3 v1
Dokument4 Seiten
Ass3 v1
Reeya Prakash
Noch keine Bewertungen
It 4004 2019
Dokument6 Seiten
It 4004 2019
Malith Jayasinghe
Noch keine Bewertungen
Lab-11 Random Forest
Dokument2 Seiten
Lab-11 Random Forest
KamranKhan
Noch keine Bewertungen
MidTerm2!00!11 08 Solutions
Dokument7 Seiten
MidTerm2!00!11 08 Solutions
shimz1
0% (2)
Project - Machine Learning-Business Report: By: K Ravi Kumar PGP-Data Science and Business Analytics (PGPDSBA.O.MAR23.A)
Dokument38 Seiten
Project - Machine Learning-Business Report: By: K Ravi Kumar PGP-Data Science and Business Analytics (PGPDSBA.O.MAR23.A)
Ravi Kotharu
Noch keine Bewertungen
Important Questions
Dokument4 Seiten
Important Questions
Adilrabia rsl
Noch keine Bewertungen
CS3201 Assignment 4: Extended Prototype Due Date and Submission Requirements
Dokument10 Seiten
CS3201 Assignment 4: Extended Prototype Due Date and Submission Requirements
NicholasLum
Noch keine Bewertungen
Instructions:: CS593: Data Structure and Database Lab Take Home Assignment - 5 (10 Questions, 100 Points)
Dokument3 Seiten
Instructions:: CS593: Data Structure and Database Lab Take Home Assignment - 5 (10 Questions, 100 Points)
Lafoot Babu
Noch keine Bewertungen
Hackathon Best Practices
Dokument2 Seiten
Hackathon Best Practices
Daniel Wee
Noch keine Bewertungen
MLchallenge2022 Block4
Dokument9 Seiten
MLchallenge2022 Block4
fede
Noch keine Bewertungen
Individual Assignment 2
Dokument4 Seiten
Individual Assignment 2
jemal yahyaa
Noch keine Bewertungen
Machine Learning Assignment: Iris Dataset, Parameter Settings, Experiments
Dokument1 Seite
Machine Learning Assignment: Iris Dataset, Parameter Settings, Experiments
creatively_1
Noch keine Bewertungen
Index On The Search Key, and Heap Files With An Unclusted Hash Index. Briefly Discuss The
Dokument5 Seiten
Index On The Search Key, and Heap Files With An Unclusted Hash Index. Briefly Discuss The
Faizan Bashir Sidhu
Noch keine Bewertungen
Database Design and Development Assignment Breakdown
Dokument7 Seiten
Database Design and Development Assignment Breakdown
janitha werallagama
Noch keine Bewertungen
E4 DS203 2023 Sem2
Dokument2 Seiten
E4 DS203 2023 Sem2
sparee1256
Noch keine Bewertungen
Data Science & Big Data - Practical
Dokument7 Seiten
Data Science & Big Data - Practical
RAKESH G
Noch keine Bewertungen
HW 1
Dokument3 Seiten
HW 1
postscript
Noch keine Bewertungen
Mini Project 4
Dokument2 Seiten
Mini Project 4
m2000.h1379
Noch keine Bewertungen
hw1 Problem Set
Dokument8 Seiten
hw1 Problem Set
Billy bob
Noch keine Bewertungen
Sgjksgshgvxjhav
Dokument2 Seiten
Sgjksgshgvxjhav
Mahtab Ahmad
Noch keine Bewertungen
SCS16L
Dokument3 Seiten
SCS16L
sanjay mehra
Noch keine Bewertungen
2021 ITS665 - ISP565 - GROUP PROJECT-revMac21
Dokument6 Seiten
2021 ITS665 - ISP565 - GROUP PROJECT-revMac21
Umairah Ibrahim
Noch keine Bewertungen
Lab 3
Dokument3 Seiten
Lab 3
bc040400330737
Noch keine Bewertungen
Data Mining Assignment Predicts Car Prices
Dokument2 Seiten
Data Mining Assignment Predicts Car Prices
Tummala KC
0% (1)
ENV11114 Modelling Wildlife Populations Assessment - Instruction Sheet Paul Ward (P.ward@napier - Ac.uk)
Dokument1 Seite
ENV11114 Modelling Wildlife Populations Assessment - Instruction Sheet Paul Ward (P.ward@napier - Ac.uk)
ΣΤΩΙΚΟΣ
Noch keine Bewertungen
MIE1624 - Assignment 3
Dokument6 Seiten
MIE1624 - Assignment 3
josengi158
Noch keine Bewertungen
File 482621234 482621234 - Assignment 2 - 7378831553794248
Dokument5 Seiten
File 482621234 482621234 - Assignment 2 - 7378831553794248
Bob Philip
Noch keine Bewertungen
Assignment 3: Named Entity Recognition: Training Dataset
Dokument4 Seiten
Assignment 3: Named Entity Recognition: Training Dataset
ryder the ryder
Noch keine Bewertungen
Table of Contents:: Predictnow - Ai Lets You Apply Machine Learning Predictions To Your Data Without Any Programming
Dokument15 Seiten
Table of Contents:: Predictnow - Ai Lets You Apply Machine Learning Predictions To Your Data Without Any Programming
sg
Noch keine Bewertungen
Comparing Methods Assignment
Dokument2 Seiten
Comparing Methods Assignment
Ali Nasar
Noch keine Bewertungen
Assignment Instructions For The Data Analytics Report
Dokument5 Seiten
Assignment Instructions For The Data Analytics Report
robert jnr Martin
Noch keine Bewertungen
AWS Certified Machine Learning Specialty Exam Guide
Dokument11 Seiten
AWS Certified Machine Learning Specialty Exam Guide
pgp20.skand
Noch keine Bewertungen
Task Sheet Emp Formula
Dokument2 Seiten
Task Sheet Emp Formula
25lli
Noch keine Bewertungen
Instructions and Guidelines
Dokument2 Seiten
Instructions and Guidelines
Dishan Otieno
Noch keine Bewertungen
Project Questions
Dokument4 Seiten
Project Questions
vansh gupta
Noch keine Bewertungen
New Microsoft Word Document2
Dokument2 Seiten
New Microsoft Word Document2
sree
Noch keine Bewertungen
Project On Data Mining: Prepared by Ashish Pavan Kumar K PGP-DSBA at Great Learning
Dokument50 Seiten
Project On Data Mining: Prepared by Ashish Pavan Kumar K PGP-DSBA at Great Learning
Ashish Pavan Kumar K
Noch keine Bewertungen
Designing Optimal Item Pools for CAT
Dokument18 Seiten
Designing Optimal Item Pools for CAT
sadyia carmel
Noch keine Bewertungen
Programming Project
Dokument2 Seiten
Programming Project
Rashibul Islam Xidan
Noch keine Bewertungen
Data Mining With Weka Heart Disease Dataset: 1 Problem Description
Dokument4 Seiten
Data Mining With Weka Heart Disease Dataset: 1 Problem Description
Sindhuja Vigneshwaran
Noch keine Bewertungen
1 - BDA Summative Assessment Brief
Dokument21 Seiten
1 - BDA Summative Assessment Brief
peterthiongo150
Noch keine Bewertungen
Lab (I)
Dokument3 Seiten
Lab (I)
anand_sesham
Noch keine Bewertungen
DS MachineLearningEngineerTechnicalChallenge3.1
Dokument1 Seite
DS MachineLearningEngineerTechnicalChallenge3.1
fercho120
Noch keine Bewertungen
Design Project
Dokument5 Seiten
Design Project
roshan
Noch keine Bewertungen
Black-Box Testing: Requirements
Dokument17 Seiten
Black-Box Testing: Requirements
ans_h2003
Noch keine Bewertungen
Daatabase Assignment
Dokument4 Seiten
Daatabase Assignment
Ishani Puvimannasinghe
Noch keine Bewertungen
Daatabase Assignment
Dokument4 Seiten
Daatabase Assignment
Ishani Puvimannasinghe
100% (1)
Team Alacrity - Amazon ML Challenge 2023 - Text File
Dokument8 Seiten
Team Alacrity - Amazon ML Challenge 2023 - Text File
omkar sameer chaubal
Noch keine Bewertungen
Matlab
Dokument7 Seiten
Matlab
shylaja_p
Noch keine Bewertungen
Data Structure Manual For BE Students
Dokument100 Seiten
Data Structure Manual For BE Students
raghu07_k
100% (1)
CSCE 120: Learning To Code: Organizing Data I Hacktivity 12.1
Dokument3 Seiten
CSCE 120: Learning To Code: Organizing Data I Hacktivity 12.1
s_gamal15
Noch keine Bewertungen
CS-7830 Assignment-2 Questions 2022
Dokument4 Seiten
CS-7830 Assignment-2 Questions 2022
manish kardas
Noch keine Bewertungen
Smai A1 PDF
Dokument3 Seiten
Smai A1 PDF
Zubair Ahmed
Noch keine Bewertungen
Assignment1 COMP723 2019
Dokument4 Seiten
Assignment1 COMP723 2019
imran5705074
Noch keine Bewertungen
CamScanner Scanned Document Pages
Dokument25 Seiten
CamScanner Scanned Document Pages
suryansh
Noch keine Bewertungen
Aptitude Test: Answer: Option A
Dokument5 Seiten
Aptitude Test: Answer: Option A
Amit
Noch keine Bewertungen
Ec2 Satellite s3 Etc
Dokument4 Seiten
Ec2 Satellite s3 Etc
suryansh
Noch keine Bewertungen
Arduno Mega Click Shield Manual v100
Dokument3 Seiten
Arduno Mega Click Shield Manual v100
suryansh
Noch keine Bewertungen
Streaming 1
Dokument2 Seiten
Streaming 1
suryansh
Noch keine Bewertungen
Cloud Computing Sess1
Dokument14 Seiten
Cloud Computing Sess1
suryansh
Noch keine Bewertungen
Cclast 20181105180810
Dokument7 Seiten
Cclast 20181105180810
suryansh
Noch keine Bewertungen
New Doc 2018-11-05 18.06.52
Dokument7 Seiten
New Doc 2018-11-05 18.06.52
suryansh
Noch keine Bewertungen
14 - 8 - 2018 - 16 - 23 - 19 - 578 - Unit-I Part B
Dokument25 Seiten
14 - 8 - 2018 - 16 - 23 - 19 - 578 - Unit-I Part B
suryansh
Noch keine Bewertungen
Bahut Saara
Dokument9 Seiten
Bahut Saara
suryansh
Noch keine Bewertungen
Longman Decide
Dokument20 Seiten
Longman Decide
suryansh
Noch keine Bewertungen
Alberta
Dokument23 Seiten
Alberta
suryansh
Noch keine Bewertungen
14 - 8 - 2018 - 16 - 22 - 55 - 449 - UNIT I (Part A)
Dokument29 Seiten
14 - 8 - 2018 - 16 - 22 - 55 - 449 - UNIT I (Part A)
suryansh
Noch keine Bewertungen
Chapter-3: Statistical Analysis
Dokument56 Seiten
Chapter-3: Statistical Analysis
suryansh
Noch keine Bewertungen
Scanned With Camscanner
Dokument7 Seiten
Scanned With Camscanner
suryansh
Noch keine Bewertungen
SDT Sample PDF
Dokument18 Seiten
SDT Sample PDF
Muhammad Talha Butt
Noch keine Bewertungen
Function: ## Way To Create Object in Java
Dokument3 Seiten
Function: ## Way To Create Object in Java
suryansh
Noch keine Bewertungen
New Doc 2018-11-05 18.06.52
Dokument7 Seiten
New Doc 2018-11-05 18.06.52
suryansh
Noch keine Bewertungen
Shift Reduce Parsing
Dokument21 Seiten
Shift Reduce Parsing
suryansh
Noch keine Bewertungen
Chapter 1
Dokument51 Seiten
Chapter 1
suryansh
Noch keine Bewertungen
Chapter 1
Dokument51 Seiten
Chapter 1
suryansh
Noch keine Bewertungen
SQL Interview Questions: Learn Tech Skills From Scratch at Scaler Edge
Dokument36 Seiten
SQL Interview Questions: Learn Tech Skills From Scratch at Scaler Edge
suryansh
Noch keine Bewertungen
DSA Day4
Dokument3 Seiten
DSA Day4
suryansh
Noch keine Bewertungen
Check Semantics - Error Reporting - Disambiguate - Type Coercion - Static Checking
Dokument108 Seiten
Check Semantics - Error Reporting - Disambiguate - Type Coercion - Static Checking
suryansh
Noch keine Bewertungen
Competitive Coding: Array Rotations in O(n
Dokument1 Seite
Competitive Coding: Array Rotations in O(n
suryansh
Noch keine Bewertungen
41 Essential SQL Interview Questions and Answers
Dokument39 Seiten
41 Essential SQL Interview Questions and Answers
suryansh
Noch keine Bewertungen
Accenture Risk Analytics Network Credit Risk Analytics
Dokument16 Seiten
Accenture Risk Analytics Network Credit Risk Analytics
suryansh
Noch keine Bewertungen
Social Biases in NLP Models As Barriers For Persons With Disabilities
Dokument11 Seiten
Social Biases in NLP Models As Barriers For Persons With Disabilities
suryansh
Noch keine Bewertungen
Yas Island Phase 2, Zone K - Garden Crescent - Part 1 - Technical Proposal - 2010.04.19
Dokument92 Seiten
Yas Island Phase 2, Zone K - Garden Crescent - Part 1 - Technical Proposal - 2010.04.19
arunava sarkar
Noch keine Bewertungen
Travel Chapter 1
Dokument12 Seiten
Travel Chapter 1
jas
Noch keine Bewertungen
Standard Reference Material 1082 Cigarette Ignition Strength Standard
Dokument5 Seiten
Standard Reference Material 1082 Cigarette Ignition Strength Standard
selowest
Noch keine Bewertungen
Culler's Insights Into Critical Theory
Dokument3 Seiten
Culler's Insights Into Critical Theory
sayem
Noch keine Bewertungen
Group Assignment Unit 3
Dokument3 Seiten
Group Assignment Unit 3
Vishabh Trehan
Noch keine Bewertungen
Makingsenseofmusic
Dokument14 Seiten
Makingsenseofmusic
NATALIA ALBALADEJO MARTÍNEZ
Noch keine Bewertungen
Introduction To Theories of Personality
Dokument8 Seiten
Introduction To Theories of Personality
Jean Esmedina
Noch keine Bewertungen
Effective Reading Instruction Phases
Dokument4 Seiten
Effective Reading Instruction Phases
hawa ahmed
Noch keine Bewertungen
Answering With The Number of The Question Otherwise, A High Percentage of Similarity May Occur For Your Paper
Dokument3 Seiten
Answering With The Number of The Question Otherwise, A High Percentage of Similarity May Occur For Your Paper
Melisa Ceyhan
Noch keine Bewertungen
Ayu Diah Lestari - 3421014
Dokument12 Seiten
Ayu Diah Lestari - 3421014
Rm Ot
Noch keine Bewertungen
Quantum Inspired Meta-Heuristics For Image Anlys PDF
Dokument367 Seiten
Quantum Inspired Meta-Heuristics For Image Anlys PDF
recrut
Noch keine Bewertungen
FS1 - Learning Episode 1 The School Environment - Learner Diversity
Dokument31 Seiten
FS1 - Learning Episode 1 The School Environment - Learner Diversity
Bautista, Shiela May A.
Noch keine Bewertungen
Development of Affective Assessment Tools
Dokument24 Seiten
Development of Affective Assessment Tools
Patricia May Vicente
Noch keine Bewertungen
Experimental Research Gesigns
Dokument29 Seiten
Experimental Research Gesigns
Afzala Yaseen
Noch keine Bewertungen
Social Stratification and Alliance Systems Through History
Dokument4 Seiten
Social Stratification and Alliance Systems Through History
Joseph Malabanan
Noch keine Bewertungen
Seeing The Forest For The Trees, and The Forests Beyond: The Future of AI
Dokument32 Seiten
Seeing The Forest For The Trees, and The Forests Beyond: The Future of AI
Hoàng Nguyễn
Noch keine Bewertungen
Prof Ed 8 TTL 1 Syllabus
Dokument16 Seiten
Prof Ed 8 TTL 1 Syllabus
Mhel Ryan Flores
Noch keine Bewertungen
Research Paper Causes and Level of Truancy Among Primary School Pupils A Case Study of Adjena United Basic School Akosombo Ghana
Dokument7 Seiten
Research Paper Causes and Level of Truancy Among Primary School Pupils A Case Study of Adjena United Basic School Akosombo Ghana
Emmanuel Mensah
Noch keine Bewertungen
Industrial Safety Engineering
Dokument10 Seiten
Industrial Safety Engineering
Vilayil jestin
Noch keine Bewertungen
Chpter 3 6 1 2
Dokument8 Seiten
Chpter 3 6 1 2
Katherine Alice
Noch keine Bewertungen
8 Q1-PerDev
Dokument28 Seiten
8 Q1-PerDev
RANYAH GANDARUZA
Noch keine Bewertungen
Ethics Midterm Reviewer
Dokument3 Seiten
Ethics Midterm Reviewer
Hannieee
Noch keine Bewertungen
Computational Thinking Skills of Gifted and Talented Students in 2021
Dokument17 Seiten
Computational Thinking Skills of Gifted and Talented Students in 2021
Ingrid Díaz
Noch keine Bewertungen
Chapter 3 Questions
Dokument4 Seiten
Chapter 3 Questions
Hema Tiwari
Noch keine Bewertungen
Mathematics: Textbook For Class VIII
Dokument12 Seiten
Mathematics: Textbook For Class VIII
Siji Joy
Noch keine Bewertungen
English Department - Mid Year Assessment Template
Dokument62 Seiten
English Department - Mid Year Assessment Template
Mary Jelyn Kate Gatlabayan
Noch keine Bewertungen
Statement of Purpose Msinus
Dokument5 Seiten
Statement of Purpose Msinus
Bhavana Dornala
Noch keine Bewertungen
Principles of System Safety Engineering and Risk Management
Dokument161 Seiten
Principles of System Safety Engineering and Risk Management
ZulSal Sal
Noch keine Bewertungen
Module 1
Dokument63 Seiten
Module 1
Meenaakshi Kishore
Noch keine Bewertungen