Data Science es un área muy amplia y comprende desde aprender a usar de forma más profesional las populares planillas electrónicas, organizar y limpiar bases de datos, aprender a hacer análisis exploratorio y estadístico para obtener información con inteligencia empresarial y por último también poder predecir comportamientos con aprendizaje automático e inteligencia artificial. En Alura vas a aprender a manipular datos y sacar provecho de ellos con diferentes cursos:
Ciencia de datos: es responsable de aportar ideas. Dado un conjunto de datos, como la geolocalización de ciertos negocios en un determinado barrio o localidad, ¿Qué podemos concluir sobre la ubicación de los restaurantes que tienen más años de funcionamiento? Podríamos realizar análisis de cuáles variables son las que inciden en la durabilidad y estabilidad de un negocio a largo plazo y si la geolocalización es un ítem a considerar. Esto se puede hacer con datos en una macro de Excel y VBA, pero lo ideal es trabajar con lenguaje Python, con muchas bibliotecas disponibles para este tipo de trabajo.
Análisis exploratorio de datos: son métodos utilizados para visualizar nuestros datos y poder comenzar a hacer preguntas, levantar hipótesis y así direccionar mejor nuestros análisis.
Machine Learning: también se lo conoce como aprendizaje automático o automatizado, consiste en crear modelos entrenados para predecir alguna acción, hacer una predicción. Después de conocer bien un conjunto de datos, estos modelos nacen para poder ayudarnos en la toma de decisiones. Un ejemplo: ya sabemos dónde están los restaurantes con más años de funcionamiento en nuestro barrio, ¿Podríamos tener un modelo capaz de predecir la esperanza de vida de un nuevo restaurante en un nuevo punto?.
En nuestra jornada de Científico de Datos es importante entender los conceptos básicos de estadística para luego estudiar algoritmos de aprendizaje de máquina como ser: aprendizaje supervisado y no supervisado, redes neuronales y regresiones lineales.