Entradas

Mostrando entradas de 2019

Diagrama de caja - Construction of BoxPlot and Basic Stats with Python - Pandas

Imagen
# # Construction of BoxPlot and Basic Stats with Python Bienvenidos nuevamente! Adjunto a ustedes el código de explicación de funciones básicas en Python (Pandas, Numpy) utilizando el Jupyter Notebook. Aquí encontrarán uso de media, moda, mediana y rango intercuartílico así como gráficos importantes en la exploración de los datos como ser Diagrama de cajas (BoxPlot) e histogramas. Igualmente, les adjunto de manera insertada el vídeo de dicha explicación. --------------------------------------------------------------------------------------- import pandas as pd from pandas import read_csv from scipy import stats datosNB = pd.read_csv('Documents/Canal Yout/Stats with Python/birth2011.csv',sep=',') datosNB = datosNB.sample(n=500) datosNB.head() DOB_MM DOB_WK OCNTY MAGER MRCNTY FAGECOMB DWGT DMETH_REC APGAR5 SEX COMBGEST DBWT 0 1 7 127 24 999 25.0 160 1 9 M 38 3090 1 1 7 25 19 25 21.0 143 1 9 F 39 3062 2 1 1 999 25 999 45.0 172 1 10 F 39 3062 3 1 ...

Random Forest in R - Bosque Aleatorio en R / Rstudio - Ejemplo con Data Iris

Imagen
# -------  Bienvenido------- # Raul Valerio - Statistics Hola Nuevamente!! Quiero agradecerles el placer de su lectura.  En este documento encontrarán el código utilizado para correr un programa con Random Forest y una explicación en vídeo con la completa explicación de que significa y cuando ulitizar el algoritmo. --------------------------------------------------------------------------------------- # Carga el paquete específico del método Random Forest library(randomForest) # Porque random forest? # ----->>> bootstrap aggregation ( Bagging )        N,  m samples # ----->>> random subset of the features. 10 features --> #For classification, the default value for m is sqrt(p) and the minimum #node size is one. #For regression, the default value for m is p/3 and the minimum #node size is five. # cuando usar random forest?   clasificacion supervisada solamente?   # -> majority vote ...

Modelos lineales en R - Regresion lineal multiple

Imagen
Hola y Bienvenido!! Les comparto a ustedes el código escrito en R / Rstudio para el ejemplo del vídeo que adjunto. Estos ejemplos tratan sobre la regresión lineal múltiple, donde se crea un modelo lineal y haremos uso de pruebas de normalidad, igualdad de varianza, stepAIC  y ANOVA para obtener el mejor modelo posible. Sigue aquí  el código utilizado: #  mtcars is dataset ready to use in R         # mpg: miles per gallon    # disp: displacement    # hp: horse power    # wt: weight of the car   input <- mtcars[,c("mpg","disp","hp","wt")] print(head(input))             # Create the relationship model.   #  mpg = a + b1*disp + b2*hp + b3*wt + e   #  e ~ N(0,s^2)      , test these assumptions mymodel <- lm(mpg~disp+hp+wt, data = input)  # Show the model. summary(mymodel) confint(mymodel) coef(mymodel)   ...