Data science en ecosistema SAP

Abro este tema porque soy científico de datos, sin embargo no es claro aun para mi como se podrían conectar mis conocimientos en R, python, sql, c#, y las librerías que se usan para ciencia de datos y visualización con las posibilidades que ofrece SAP. Me gustaría recibir comentarios de los más expertos en el tema, y si tienen conocimiento de aquellas herramientas del ecosistema SAP que sería necesario aprender para poder entrar fuertes en la materia.

Gracias. Los leo…

1 me gusta

Interesante tema.

En 2017 (Hace más de 6 años) escribí sobre SAP LEONARDO, deberías darle una lectura:

Es un sistema que compila TODO lo que sea datos, y mucho más! Es el MONSTRUO de SAP en tiempo real, jajaja habría que ver cómo funciona semejante animal !

Interesante articulo. Gracias por compartir. Parece que se trata de todo un modelo de negocio para acopiar información usando IoT, y luego conectarla con procesos empresariales. Lo veo muy asociado a aplicaciones en logística. Aunque esto puede eventualmente conectarse con labores de ciencia de datos, veo necesario acotar un poco más mi inquietud:

Cuál es el IDE, o entorno de desarrollo donde se hacen labores de ciencia de datos en SAP, siempre que exista, y si no existe, qué lenguajes, frameworks o herramientas debería dominar para hacer cosas de este estilo aprovechando la potencia de SAP como un ERP. Puedo conectar python y demás lenguajes de programación con esto, o implica iniciar desde 0 aprendiendo herramientas específicas de SAP?

Como saben la ciencia de datos está siendo cada vez más usada, y es un hecho que SAP no se pudo haber quedado atrás en estos temas.

De nuevo mil gracias por compartir, si te enteras de algo te estaré super agradecido. Saludos.

Todo eso lo tenes aca:
h_tps://www.sap.com/latinamerica/insights/what-is-big-data.html

Y te sumergis en cómo SAP procesa los datos:
h_tps://www.sap.com/latinamerica/products/database-data-management.html

2020, pero te servirá:
h_tps://blogs.sap.com/2020/05/19/an-effective-approach-to-learn-data-science/

En cuanto a desarrollo, te recomiendo sumergirte en el GitHub de SAP (oficial), tienen código abierto; algunas apps:

Apache Hadoop es una solución de software de procesamiento distribuido de código abierto. Se usa para acelerar y facilitar la gestión de Big Data conectando varias computadoras y permitiéndoles procesar Big Data en paralelo.

Apache Spark es una solución de software de procesamiento distribuido de código abierto. Se usa para acelerar y facilitar la gestión de Big Data conectando varias computadoras y permitiéndoles procesar Big Data en paralelo. Su predecesor Hadoop es mucho más usado, pero Spark está ganando popularidad debido a su uso de machine learning y otras tecnologías, que aumentan su velocidad y eficiencia.

1 me gusta

Gracias de nuevo. Una pregunta, conoces más miembros de acá del foro que estén interesados en estos temas?. Me encantaría hacer networking, y conocer un poco de la perspectiva que tienen de estos temas. De seguro la información que me enviaste me servirá mucho. Prometo leer a profundidad y por acá estaré publicando mis conclusiones. Saludos.

Hola @HectorM
Lo siguiente te puede ser util
ht_ps://open.sap.com/courses?category=Data%20Scientist

Andres Ramirez Jaramillo :colombia:

Muy buen recurso Andrés, muchas gracias