Machine Learning Tips

Hochgeladen von

sudhir

0% fanden dieses Dokument nützlich (0 Abstimmungen)

15 Ansichten2 Seiten

Originaltitel

Machine_Learning_Tips.doc

Copyright

Verfügbare Formate

DOC, PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

Copyright:

Verfügbare Formate

Als DOC, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

0% fanden dieses Dokument nützlich (0 Abstimmungen)

15 Ansichten2 Seiten

Machine Learning Tips

Hochgeladen von

sudhir

Copyright:

Verfügbare Formate

Als DOC, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 2

Im Dokument suchen

Data Science | Steps to approach a Machine Learning Problem

Following are the steps followed to create a good machine learning solution.

1. Data collection
2. Data preprocessing
1) Data cleaning
2) Feature creation and feature selection
3) feature scaling and Normalization
4) Divide data into training and testing sets(You can create cross
validation set also)
3. Build a model on training data.
4. Evaluate the model on the test data.
5. If the performance is satisfying, deploy to the real system.
6. If performance is not good, check for over fitting and under fitting
7. Regularize you algorithm, go to step 3

This process is iterative and you can add more steps in between, depending
on situation. Let’s understand each step:

1. Data Collection:
At this stage we collect data from available sources. for analyzing user click
behavior, you will like to collect web logs data. for predicting, if a mail is
spam or not, you will collect emails. for predicting sentiment of twitter
messages you may like to collect data from twitter.

2. Data Preprocessing:
The data that you receive from any source may not be in readily usable
form. You may like to pre-process it, so that your algorithm can make best
use of collected information
Following are the this you may like to do as part of it.

1)Data Cleaning : You may end up collecting data which have wrong or null
values for some of the records. The wrong or missing values may be very
obvious

2)Viewing data : You may like to make some plots of data to see which
parameters affect the output of your record. It will also give you some
picture if your data is of skewed nature or it has normal distribution. Viewing
data in form of plots and histograms may completely surprise you. If you
have data of users who use facebook. you may make a plot to see if male
users have more friends or female users have more friends. If you make a
plot for age of person and number of people with that age, It will give you
very clear picture that which age group is more active on facebook.
3) Data Transformation: Depending on what data you have, you may like
to convert some of features to other form. for example if you have age as
one of feature of your data. You may want that i want to have only 4 groups.
minor(0-18), young(19-45), old(46-65),senior citizen(66- __). you may like
to transform age feature to categorical variable. In some complex scenarios
you may like to convert low dimensional data to high dimensions also(eg
SVM algorithm using Kernals- we will discuss these things later in a separate
post) or high dimension to low dimension(eg PCA- for dimensionality
reduction)

In general we work with both numerical and categorical data.

Numerical data consists of actual numbers, while categorical data have a
few discrete values. Examples of categorical data include marriage status,
month of birth, employment type or gender. The Categorical variable can
be a number but there is no meaning to adding two vales of actegorical
variable eg Zip code. There may or may not be an order to categorical data.

Das könnte Ihnen auch gefallen

Machine Learning with Clustering: A Visual Guide for Beginners with Examples in Python
Von Everand
Machine Learning with Clustering: A Visual Guide for Beginners with Examples in Python
Artem Kovera
Noch keine Bewertungen
(Excerpts From) Investigating Performance: Design and Outcomes With Xapi
Von Everand
(Excerpts From) Investigating Performance: Design and Outcomes With Xapi
Janet Laane Effron
Noch keine Bewertungen
Introduction To Data Science: Dataset
Dokument13 Seiten
Introduction To Data Science: Dataset
yogesh
Noch keine Bewertungen
Workflow of A Machine Learning Project
Dokument12 Seiten
Workflow of A Machine Learning Project
ashish
Noch keine Bewertungen
Life Cycle of Data Science - Complete Step-By-step Guide
Dokument3 Seiten
Life Cycle of Data Science - Complete Step-By-step Guide
MTSSEducation
Noch keine Bewertungen
Flow Diagram of Machine Learning or Life Cycle of Machine Learning
Dokument91 Seiten
Flow Diagram of Machine Learning or Life Cycle of Machine Learning
Jay Mangukiya
Noch keine Bewertungen
Dawit House
Dokument49 Seiten
Dawit House
dawitbelete1992
Noch keine Bewertungen
Analysing Data Using Spss
Dokument94 Seiten
Analysing Data Using Spss
Sandeep Bhatt
100% (1)
Machine Learning Unit 1
Dokument72 Seiten
Machine Learning Unit 1
Manshi Jain
Noch keine Bewertungen
Data Mining Assignment
Dokument8 Seiten
Data Mining Assignment
Amanat Construction
Noch keine Bewertungen
Types of ML
Dokument4 Seiten
Types of ML
chandana kiran
Noch keine Bewertungen
Machine Learnin-WPS Office PDF
Dokument11 Seiten
Machine Learnin-WPS Office PDF
Soham Chatterjee
Noch keine Bewertungen
40 Interview Questions On Machine Learning - AnalyticsVidhya
Dokument21 Seiten
40 Interview Questions On Machine Learning - AnalyticsVidhya
Kaleab Tekle
100% (1)
Document
Dokument9 Seiten
Document
Ayush Patel
Noch keine Bewertungen
Machine Learning Notes
Dokument19 Seiten
Machine Learning Notes
Abir Baidya
Noch keine Bewertungen
Advanced Data Analytics Assignment
Dokument6 Seiten
Advanced Data Analytics Assignment
Olwethu N Mahlathini (Lethu)
Noch keine Bewertungen
Data Mining - Prashant
Dokument10 Seiten
Data Mining - Prashant
Kunal Kubal
Noch keine Bewertungen
UNIT 1 - Introduction (Types of Machine Learning)
Dokument21 Seiten
UNIT 1 - Introduction (Types of Machine Learning)
2023aa05902
Noch keine Bewertungen
Machine Learning Life Cycle
Dokument4 Seiten
Machine Learning Life Cycle
aarohic2027
Noch keine Bewertungen
ML Life Cycle
Dokument4 Seiten
ML Life Cycle
Naashit Hashmi
Noch keine Bewertungen
Basic Interview Q's On ML PDF
Dokument243 Seiten
Basic Interview Q's On ML PDF
sourajit roy chowdhury
100% (2)
ML 2022
Dokument10 Seiten
ML 2022
Courtney Kudra Dzere
Noch keine Bewertungen
Develop A Program To Implement Data Preprocessing Using
Dokument19 Seiten
Develop A Program To Implement Data Preprocessing Using
Fucker Jamun
Noch keine Bewertungen
Statistics For Data Science - 1
Dokument38 Seiten
Statistics For Data Science - 1
Akash Srivastava
100% (1)
Interview Questions On Machine Learning
Dokument22 Seiten
Interview Questions On Machine Learning
Praveen
100% (4)
Exercises 5
Dokument5 Seiten
Exercises 5
Bhuvana Eswari
Noch keine Bewertungen
Common Analytics Interview Questions
Dokument4 Seiten
Common Analytics Interview Questions
PKDB
Noch keine Bewertungen
Unit 1
Dokument32 Seiten
Unit 1
vamsi kiran
Noch keine Bewertungen
Chapter 2
Dokument4 Seiten
Chapter 2
anudadhwal07
Noch keine Bewertungen
Process: 1. Data Mining (The Analysis Step of The "Knowledge Discovery in Databases" Process, or KDD)
Dokument4 Seiten
Process: 1. Data Mining (The Analysis Step of The "Knowledge Discovery in Databases" Process, or KDD)
Ajit Kumar
Noch keine Bewertungen
MZU-MBA-DATA ANALYTICS - Data Science and Business Analysis - Unit 3
Dokument39 Seiten
MZU-MBA-DATA ANALYTICS - Data Science and Business Analysis - Unit 3
Aamir Reza
Noch keine Bewertungen
Designing Machine Learning Systems With Python - Sample Chapter
Dokument31 Seiten
Designing Machine Learning Systems With Python - Sample Chapter
Packt Publishing
100% (1)
Introduction To Machine Learning Top-Down Approach - Towards Data Science
Dokument6 Seiten
Introduction To Machine Learning Top-Down Approach - Towards Data Science
Kashaf Bakali
Noch keine Bewertungen
Deep Learning Ram
Dokument21 Seiten
Deep Learning Ram
Ram Bhardwaj
Noch keine Bewertungen
Main Dock Pin
Dokument31 Seiten
Main Dock Pin
Paul Walker
Noch keine Bewertungen
What Is Data Preparation
Dokument26 Seiten
What Is Data Preparation
Ruhi Kapoor
Noch keine Bewertungen
MachineLearning (All Module)
Dokument33 Seiten
MachineLearning (All Module)
Khateeb Ahmad
Noch keine Bewertungen
Data Preprocessing in Machine Learning
Dokument5 Seiten
Data Preprocessing in Machine Learning
Musto
Noch keine Bewertungen
24 Ultimate Data Science Projects To Boost Your Knowledge and Skills
Dokument13 Seiten
24 Ultimate Data Science Projects To Boost Your Knowledge and Skills
Moiz khan
Noch keine Bewertungen
Data Mining Using Rapidminer by William Murakami-Brundage Mar. 15, 2012
Dokument44 Seiten
Data Mining Using Rapidminer by William Murakami-Brundage Mar. 15, 2012
dvdmx
Noch keine Bewertungen
Vragen Case Studies - 3
Dokument26 Seiten
Vragen Case Studies - 3
ur fb
Noch keine Bewertungen
Data Science Methodology
Dokument4 Seiten
Data Science Methodology
emrannaser953
Noch keine Bewertungen
The Framework Flow
Dokument1 Seite
The Framework Flow
naimkimi2000
Noch keine Bewertungen
Architecture of Data Science Projects: Components
Dokument4 Seiten
Architecture of Data Science Projects: Components
Dina Hassan
Noch keine Bewertungen
R For Data Science Sample Chapter
Dokument39 Seiten
R For Data Science Sample Chapter
Packt Publishing
100% (1)
NSE Project
Dokument11 Seiten
NSE Project
Shahana Fathima
Noch keine Bewertungen
User Manual (Mental Health Issue Among University Student
Dokument19 Seiten
User Manual (Mental Health Issue Among University Student
ANIS NABIHAH BINTI MOHD JAIS
Noch keine Bewertungen
November 2010)
Dokument6 Seiten
November 2010)
zhangzhongshi91
Noch keine Bewertungen
Exploratory Data Analysis-1
Dokument10 Seiten
Exploratory Data Analysis-1
Sunil Arava
Noch keine Bewertungen
Data Preparation
Dokument17 Seiten
Data Preparation
Joyce Choy
Noch keine Bewertungen
Underfitting and Overfitting
Dokument4 Seiten
Underfitting and Overfitting
hokijic810
Noch keine Bewertungen
7B-Data - Handling - and - BI - 21 Part 2
Dokument12 Seiten
7B-Data - Handling - and - BI - 21 Part 2
catalina doogaru
Noch keine Bewertungen
Datawarehousing
Dokument10 Seiten
Datawarehousing
Harshit Jain
Noch keine Bewertungen
DM Notes (6th Nov)
Dokument6 Seiten
DM Notes (6th Nov)
Nithyan Nithya
Noch keine Bewertungen
Machine Learning
Dokument11 Seiten
Machine Learning
Tonpai Dolnapa
Noch keine Bewertungen
Fashion Intelligent System Using Machine Learning
Dokument9 Seiten
Fashion Intelligent System Using Machine Learning
ADVENTURE CSE
Noch keine Bewertungen
Data Mining Notes
Dokument75 Seiten
Data Mining Notes
Aravind Rossi
Noch keine Bewertungen
Ai 4
Dokument12 Seiten
Ai 4
Knal
Noch keine Bewertungen
PYTHON DATA SCIENCE: A Practical Guide to Mastering Python for Data Science and Artificial Intelligence (2023 Beginner Crash Course)
Von Everand
PYTHON DATA SCIENCE: A Practical Guide to Mastering Python for Data Science and Artificial Intelligence (2023 Beginner Crash Course)
Calvert Long
Noch keine Bewertungen
Simulating Data with SAS
Von Everand
Simulating Data with SAS
Rick Wicklin
Noch keine Bewertungen
Smart System For Potholes Detection Using Computer Vision With Transfer Learning
Dokument9 Seiten
Smart System For Potholes Detection Using Computer Vision With Transfer Learning
International Journal of Innovative Science and Research Technology
Noch keine Bewertungen
CS464 Ch1 Intro Fall2020
Dokument83 Seiten
CS464 Ch1 Intro Fall2020
Mathias Bueno
Noch keine Bewertungen
Predicting NBA Games Using Neural Networks
Dokument18 Seiten
Predicting NBA Games Using Neural Networks
Jordan Goldmeier
100% (4)
Machine Learning With The Arduino Air Quality Pred
Dokument10 Seiten
Machine Learning With The Arduino Air Quality Pred
Girmit Girmit
Noch keine Bewertungen
Abhishek Thakur - Approaching (Almost) Any Machine Learning Problem-Abhishek Thakur (2020) PDF
Dokument301 Seiten
Abhishek Thakur - Approaching (Almost) Any Machine Learning Problem-Abhishek Thakur (2020) PDF
Harsh Gupta
100% (3)
DWDM Unit 4 PDF
Dokument18 Seiten
DWDM Unit 4 PDF
indira
Noch keine Bewertungen
Comparing CNN and Imaging Processing Seismic Fault Detection Methods, Qi, Et Al, 2020
Dokument4 Seiten
Comparing CNN and Imaging Processing Seismic Fault Detection Methods, Qi, Et Al, 2020
Andrés Manuel
Noch keine Bewertungen
Introduction To Machine Learning Top-Down Approach - Towards Data Science
Dokument6 Seiten
Introduction To Machine Learning Top-Down Approach - Towards Data Science
Kashaf Bakali
Noch keine Bewertungen
Machine Learning With ML - Net and C# - VB - Net - CodeProject
Dokument17 Seiten
Machine Learning With ML - Net and C# - VB - Net - CodeProject
Gabriel Gomes
Noch keine Bewertungen
Explainable Prediction of Medical Codes From Clinical Text
Dokument11 Seiten
Explainable Prediction of Medical Codes From Clinical Text
dashjkasd
Noch keine Bewertungen
The Virtual Flute: An Advanced Fingering Guide Generated Via Machine Intelligence
Dokument14 Seiten
The Virtual Flute: An Advanced Fingering Guide Generated Via Machine Intelligence
Zach
Noch keine Bewertungen
Bidirectional Long Short-Term Memory For Automatic English To Kannada Back-Transliteration
Dokument11 Seiten
Bidirectional Long Short-Term Memory For Automatic English To Kannada Back-Transliteration
Big Daddy
Noch keine Bewertungen
2017 Machine Learning Summary v4 PDF
Dokument41 Seiten
2017 Machine Learning Summary v4 PDF
Paula Gitu
Noch keine Bewertungen
Ibrnet: Learning Multi-View Image-Based Rendering
Dokument15 Seiten
Ibrnet: Learning Multi-View Image-Based Rendering
Anuvesh Kumar
Noch keine Bewertungen
Assignment 1
Dokument2 Seiten
Assignment 1
Aashirwad Kumar
Noch keine Bewertungen
Training of Neural Networks: Q.J. Zhang, Carleton University
Dokument44 Seiten
Training of Neural Networks: Q.J. Zhang, Carleton University
Aditi Biswas
Noch keine Bewertungen
Linear Algebra For Machine Learning
Dokument115 Seiten
Linear Algebra For Machine Learning
Husain Nasikwala
Noch keine Bewertungen
East West Institute of Technology: An Improved Approach For Fire Detection Using Deep Learning Models
Dokument21 Seiten
East West Institute of Technology: An Improved Approach For Fire Detection Using Deep Learning Models
Deepu
Noch keine Bewertungen
Study Notes - Lesson 1 - 7 PDF
Dokument25 Seiten
Study Notes - Lesson 1 - 7 PDF
nandex777
Noch keine Bewertungen
Final Project
Dokument40 Seiten
Final Project
Rono Robert
Noch keine Bewertungen
Scopeof Artificial Intelligencein Law
Dokument10 Seiten
Scopeof Artificial Intelligencein Law
Cesar Ong
Noch keine Bewertungen
Orange3 Data Mining Library Using Python
Dokument102 Seiten
Orange3 Data Mining Library Using Python
Mighty Singh
0% (1)
Basepaper (Water Fraud)
Dokument7 Seiten
Basepaper (Water Fraud)
Devi Chowdary Karumanchi
Noch keine Bewertungen
Updated ML LAB Manual-2020-21
Dokument57 Seiten
Updated ML LAB Manual-2020-21
Sneha
Noch keine Bewertungen
Skin Lesion Analysis Towards Melanoma Detection Via End-To-End Deep Learning of Convolutional Neural Networks
Dokument5 Seiten
Skin Lesion Analysis Towards Melanoma Detection Via End-To-End Deep Learning of Convolutional Neural Networks
Hassan Shafique
Noch keine Bewertungen
How To Create A Simple Neural Network in Python
Dokument4 Seiten
How To Create A Simple Neural Network in Python
khala geela
Noch keine Bewertungen
Improving Neural Networks For Time-Series Forecasting Using Data Augmentation and Automl
Dokument8 Seiten
Improving Neural Networks For Time-Series Forecasting Using Data Augmentation and Automl
Pritam Changkakoti
Noch keine Bewertungen
HDPM: An Effective Heart Disease Prediction Model For A Clinical Decision Support System
Dokument17 Seiten
HDPM: An Effective Heart Disease Prediction Model For A Clinical Decision Support System
cse b
Noch keine Bewertungen
AWID For IntrusionCISS2019
Dokument6 Seiten
AWID For IntrusionCISS2019
Quý Tùng
Noch keine Bewertungen
Malicious URL Detection Using Machine Learning: A Survey: Doyen Sahoo, Chenghao Liu, Steven C.H. Hoi
Dokument37 Seiten
Malicious URL Detection Using Machine Learning: A Survey: Doyen Sahoo, Chenghao Liu, Steven C.H. Hoi
Nguyễn Hà Phương
Noch keine Bewertungen