Skip to content

Puedes correr un ambiente standalone de spark en local

License

Notifications You must be signed in to change notification settings

HubertRonald/SparkWork

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Apache Spark Jupyter Python Docker GitHub last commit MIT

SparkWork

Puedes correr un ambiente standalone de spark en local

Inicio

Una vez se clone el proyecto

git clone https://github.com/HubertRonald/SparkWork.git

Luego habilita los siguientes scripts de bash para que puedan ser ejecutados:

chmod +x start.sh stop.sh

Después asegurase de tener docker encendido

Se puede iniciar rápidamente desde la terminal con (desde la carpeta SparkWork):

./start.sh

Copia el siguiente enlace

Si en caso no apareciera en los logs, intentar los siguiente:

docker-compose logs

Asimismo asegurarse de no tener abierto alguna sesión previa. Caso contratio cerrar esa pestaña del navegador y ejecutar nuevamente el script ./start.sh en la terminal.

Hecho lo anterior en la parte izquierda, se verá el notebook Spark_DataFrames_Ejemplo.ipynb

Datos Zip Code

El archivo zipcodesUSDummy es una pequeña muestra tomada de US-Zip-Codes-JSON. Creditos a Brandom Miller

Enlaces

.gitignore

Fue generado en gitignore.io con los filtros python, macos, windows y consumido mediante su API como archivo crudo desde la terminal:

curl -L https://www.toptal.com/developers/gitignore/api/python,macos,windows > .gitignore

Autores


Ve también la lista de contribuyentes que participaron en este proyecto.

Licencia


Este proyecto está bajo licencia MIT - ver la LICENCIA archivo (en inglés) con más detalles

About

Puedes correr un ambiente standalone de spark en local

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published