#6 - Chat with Mário André de Deus
(English version at the bottom)
Tive o prazer de bater um papo com Mário André de Deus, engenheiro mecanico que possui uma pós-gradua??o em Indústria 4.0 (I4.0), além de uma especializa??o em ciência de dados. Conversamos sobre sua trajetória profissional e, em particular, seu trabalho atual em que aplica conceitos de I4.0 para a presta??o de servi?os.
A jornada profissional do Mário iniciou em uma multinacional alem?, a qual é uma grande fabricante de pe?as automobilísticas. Trabalhando quinze anos nessa empresa, ele adquiriu experiência em vários departamentos tais como engenharia de processos, produ??o, qualidade e pesquisas. Após um período como empreendedor, ele decidiu investir no pilar da I4.0 ligado à ciência de dados. Completando cursos online e presenciais, Mario se inseriu neste novo mercado de trabalho com sucesso, há seis anos.
Para Mário, existem muitas diferen?as entre indústria 3.0 e 4.0. Os avan?os da última s?o ligados principalmente a um aumento exponencial da conectividade entre dispositivos e a um sistema que evolui de forma dinamica, capaz de transformar dados em informa??o, e esta, em conhecimento, orientando as tomadas de decis?es. Nesse cenário, sem dúvidas novos desafios aparecem, particularmente para o nosso país. Para citar alguns exemplos: a infraestrutura de transportes e telecomunica??es, que ainda é deficitária em muitas regi?es, a burocracia excessiva que torna os processos mais lentos e o risco maior de ataques cibernéticos. Embora hajam desafios, a I4.0 está se tornando uma realidade e pode trazer muitas oportunidades. Mário tem vivido isso em primeira pessoa, trabalhando na interse??o entre tecnologia de vanguarda aplicada à melhoria dos servi?os aos clientes.
Seu trabalho atual em uma concessionária de veículos comerciais de uma conceituada montadora alem?, incluindo caminh?es e vans usadas por alguns sistemas de saúde, se divide em duas vertentes. Uma vertente ligada à ciência de dados onde ele realiza modelos analíticos utilizando técnicas de machine learning para otimizar a predi??o da demanda do estoque de pe?as para sua frota de centenas de veículos. A segunda vertente é relacionada ao pilar de qualidade e de melhorias de processos, aplicando técnicas de lean office e robotic process automation (RPA). O ponto em comum entre elas é o trabalho analítico e o foco em resultados.
Os modelos de machine learning desenvolvidos pelo Mário s?o programados principalmente na linguagem Python, com uso extensivo das bibliotecas Numpy, Matplotlib, Seaborn, Scikit-learn, entre outras. Os dados que alimentam seus modelos s?o coletados em uma plataforma Enterprise Ressource Planning (ERP) da empresa, e apesar de estarem estruturados, n?o dispensam a necessidade de uma minuciosa limpeza e explora??o.
Uma das aplica??es práticas que Mário desenvolve é para a previs?o de demanda de estoque. Neste caso, os modelos s?o divididos em duas etapas. Na primeira, é feita uma análise de classifica??o para identificar quais dos aproximadamente cinquenta mil itens, stock keeping units (SKUs), possuem maior probabilidade de venda. Na segunda, é realizada uma regress?o considerando apenas os SKUs selecionados na etapa anterior, para definir a quantidade de cada SKU a ser providenciada. Esta divis?o se faz necessária principalmente em fun??o do forte desbalanceamento da variável alvo que visa maximizar o número de vendas. Dos aproximadamente cinquenta mil SKUs existentes no cadastro, menos de cinco mil ser?o vendidos cada mês.?
Mário destaca que neste exemplo de previs?o existe um forte trade-off entre abastecer o estoque com o máximo de pe?as com potencial de venda, sem deixá-lo superdimensionado, evitando criar estoque desnecessário. Tecnicamente, é importante buscar o equilíbrio entre duas métricas de classifica??o: Recall e Precision. A grosso modo, o Recall responde a seguinte pergunta: “de tudo do que de fato vendeu, quanto o modelo acertou?”. Já o Precision, responde à pergunta: “de tudo o que o modelou previu que iria vender, quanto de fato vendeu?”. Mário alerta que é importante manter um pragmatismo ao trabalhar com dados e saber que um modelo jamais irá confirmar com certeza uma hipótese.
Nosso bate-papo se concluiu com uma breve reflex?o sobre o futuro do mercado de trabalho. Imaginamos um cenário possível de médio e longo prazo, quando uma parte da ciência de dados poderá se tornar mais acessível e automatizada. Neste caso, a ciência de dados poderá se consolidar como uma importante ferramenta para especialistas de vários segmentos. A dica de ouro que o Mário gostaria de deixar aos profissionais de dados é que se mantenham atualizados e saibam usar as diversas técnicas para resolver problemas e agregar valor.
领英推荐
-----
I had the pleasure of having a chat with Mário André de Deus, a mechanical engineer who has a postgraduate degree in Industry 4.0, as well as a specialization in data science. Our conversation covered some episodes of his trajectory and, in particular, his current work in which he applies I4.0 concepts to service delivery.
Mario's professional journey began at a German multinational company, which is a large manufacturer of automotive parts. Working fifteen years in this company, he gained experience in various departments such as process engineering, production, quality, and research. After a period as an entrepreneur, he decided to invest in the pillar of I4.0 linked to data science. Completing online and in-person courses, Mario successfully entered this new job market six years ago.
For Mário, there are many differences between Industry 3.0 and 4.0. The advances in the latter are mainly linked to an exponential increase in connectivity between devices and a system that evolves dynamically, capable of transforming data into information, and the latter into knowledge, guiding decision-making. In this scenario, no doubt new challenges appear, particularly for Brazil. To cite some examples: the transport and telecommunications infrastructure, which is still deficient in many regions, the excessive bureaucracy that slows down processes and the increased risk of cyberattacks. Although there are challenges, I4.0 is becoming a reality and can bring many opportunities. Mario has experienced this first-hand, working at the intersection of cutting-edge technology applied to improving customer service.
His current work at a commercial vehicle dealership of a reputable German carmaker, including trucks and vans used by some healthcare systems, is twofold. One strand linked to data science, where he runs analytical models using machine learning techniques to optimize parts inventory demand prediction for their fleet of hundreds of vehicles. The second strand is related to the quality and process improvement pillar, applying lean office and robotic process automation (RPA) techniques. The point in common between them is the analytical work and the focus on results.
The machine learning models developed by Mario are programmed mainly in Python language, with extensive use of the libraries Numpy, Matplotlib, Seaborn, Scikit-learn, among others. The data that feeds his models is collected from a company's Enterprise Resource Planning (ERP) platform, and despite being structured, it does not dispense with the need for thorough cleaning and exploration.
One of the practical applications he develops is for stock demand forecasting. In this case, the models are divided into two stages. In the first, a classification analysis is performed to identify which of the approximately fifty thousand items, stock keeping units (SKUs), have the highest probability of being sold. In the second, a regression is performed considering only the SKUs selected in the previous step, to define the quantity of each SKU to be provided. This division becomes necessary mainly due to the strong unbalancing of the target variable that seeks to maximize the number of sales. Of the approximately fifty thousand SKUs in the register, less than five thousand will be sold each month.
Mário highlights that in this example of forecasting there is a strong trade-off between supplying stock with a maximum of parts with sales potential, without leaving it oversized, avoiding creating unnecessary stock. Technically, it is important to seek a balance between two classification metrics: Recall and Precision. Roughly speaking, Recall answers the following question: “of everything that actually sold, how much did the model get right?”. Precision, on the other hand, answers the question: “of everything that the model predicted it would sell, how much did it actually sell?”. Mário alerts that it is essential to maintain a pragmatism when working with data and to know that a model will never confirm with absolute certainty a hypothesis.
Our chat concluded with a brief reflection on the future of the job market. We imagined a possible scenario in the medium and long term, when part of data science may become more accessible and automated. In this case, data science may consolidate itself as an essential tool for specialists from various segments. The golden tip that Mario would like to leave to data professionals is to keep up to date and know how to use the various techniques to solve problems and add value.