School of Mathematics Αριστοτελειο Πανεπιστημιο Aristotle...

Post on 24-Jul-2020

1 views 0 download

Transcript of School of Mathematics Αριστοτελειο Πανεπιστημιο Aristotle...

R-Statistics Εισαγωγή

Iωαννης Αντωνιου Χαραλαμπος Μπρατσας iantonio@math.auth.gr cbratsas@math.auth.gr

Μοντέλα Παλινδρόμησης και Επεξεργασία Γνώσης

ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ

Regression Models and Knowledge Processing WINTER SEMESTER

Τμημα Μαθηματικων Αριστοτελειο Πανεπιστημιο

Θεσσαλονικης

School of Mathematics Aristotle University of Thessaloniki

Τι είναι η R

R είναι μια γλώσσα προγραμματισμού για γνωσιακή επεξεργασία μέσω στατιστικής Μια σύγκριση: SPSS βασίζεται σε μενού, R βασίζεται εντολές SPSS είναι ακριβό, η R είναι δωρεάν SPSS είναι κεντρικά σχεδιασμένη, R έχει ένα μικρό

«πυρήνα» και χιλιάδες πακέτα (packages- έτοιμα προγράμματα) υποστήριξης. SPSS είναι συνήθως «μονόδρομος» για μια ανάλυση, R

συνήθως υπάρχουν πολοί τρόποι για να κάνεις την ίδια ανάλυση SPSS έχει σχεδιαστεί ώστε να είναι εύκολο "φιλικό", R απαιτεί επίπεδο γνώση στατιστικής και προγραμματισμού

Γιατί να μάθω την R

Συζητιέται πολύ

http://r4stats.com/articles/popularity/

Γραφούν πολλοί

http://r4stats.com/articles/popularity/

Την παρακολουθούν πολλοί

http://r4stats.com/articles/popularity/

Ο αριθμός των θέσεων εργασίας - πιο δημοφιλές λογισμικό (U.S. analytics 2/2014).

Αριθμός των διαθέσιμων θέσεων εργασίας για R και SPSS (analytics February 19, 2014)

http://r4stats.com/articles/popularity/

R Windows

Rstudio

Rstudio download link: http://www.rstudio.com/ide/download/desktop

To περιβάλλον του Rstudio

Βασικά Σύμβολα στην R

Περιγραφή R σύμβολο Παράδειγμα

Σχόλια # # αυτό είναι σχόλιο Απόδοση τιμής <- x<-sin(pi/2) Τελεστής παράθεσης c c(1,3.5,2.8) Στοιχείο επί στοιχείο

πολλαπλασιασμός * a*b Ύψωση σε δύναμη ^ a^b Υπόλοιπο διαίρεσης ακεραίων x/y %% 17%%5 Πηλίκο διαίρεσης ακεραίων x/y %/% 17%/%5 Ακολουθία αριθμών από a έως b

ανά h seq seq(0,20,2) Ακολουθία αριθμών ανά 1 : 0:20

Απόδοση τιμής - Ονομασία Αντικειμένων Ονόματα Κεφαλαία και πεζά λατινικά γράμματα, με τα ψηφία 0-9 σε οποιαδήποτε μη αρχική θέση και την τελεία ".", εκτός από περιπτώσεις όπως .49, 12.3, όπου θεωρείται ως υποδιαστολή δεκαδικού αριθμού

Διαχωριστικό των λέξεων:

. ή _

Ορισμένα ονόματα δεν τα χρησιμοποιούμε γιατί είναι εντολές

Σύνηθες Συναρτήσεις στην R Περιγραφή R σύμβολο Παράδειγμα ημίτονο, συνημίτονο, εφαπτομένη sin,cos,tan sin(pi/3) (=0.866..)

τόξο ημιτόνου, συνημιτόνου, εφαπτομένης αsin,αcos,αtan atan(seq(0,1,.25))/pi τετραγωνική ρίζα Sqrt sqrt(x) ακέραιο μέρος x, x floor(x), ceiling(x) φυσικός λογάριθμος Log log(x) Εκθετική συνάρτηση ex ex exp(x) παραγοντικό n! factorial(n) τυχαίοι αριθμοί στο (0,1) runif runif(100) τυχαίοι κανονικοί αριθμοί rnorm u=rnorm(100000,2,4) κανονική κατανομή pnorm, dnorm pnorm(1,2,4)

βαθμίδες, διάταξη rank, sort z=floor(10*runif(10));z; rank(z);sort(z)

διασπορά, συνδιασπορά var, cov var(u), cov(x,y) τυπ. απόκλιση, συντ. συσχέτισης sd, cor sd(u), cor(x,y)

ΑΝΤΙΚΕΙΜΕΝΑ ΣΤΗ ΓΛΩΣΣΑ R • Διανύσματα - Πίνακες

– Τα στοιχεία των διανυσμάτων μπορεί να είναι αριθμητικές ή λογικές τιμές ή και συμβολοσειρές (strings), δεν μπορούν όμως να αναμειγνύονται

– Πίνακες mxn διάστασης με στοιχεία ίδια με τα διανύσματα

• Λίστες – Πλαίσια (Frames) – Η λίστα είναι μία συλλογή ανόμοιων πληροφοριών που

αφορούν το ίδιο άτομο ή κατάσταση. – Ένα πλαίσιο δεδομένων είναι μία λίστα μεταβλητών

ίδιου μήκους αλλά ενδεχομένως διαφορετικού τύπου

Παραδείγματα στην R