
Se, como afirmou o escritor de ficção científica Arthur C. Clarke, "qualquer tecnologia suficientemente avançada é indistinguível da magia", então, por vezes, parece que a ciência dos dados é vista como uma forma de tirar coelhos da cartola. Esta narrativa é, evidentemente, incorrecta. É a perceção daquilo a que chamo "magia dos dados", em que as pessoas acreditam que os dados podem ser injectados numa extremidade da "máquina da ciência dos dados" e que o widget perfeito (a solução para os problemas de todos) surgirá do outro lado.
Em grande medida, isto deve-se ao facto de a grande maioria das pessoas não compreender o funcionamento da ciência dos dados e, quando se entra nas áreas mais avançadas, como a aprendizagem profunda, até mesmo muitos cientistas de dados reconhecem que não compreendem os muitos níveis de complexidade. Mas se for um cientista de dados, sabe (na maior parte das vezes) o suficiente para saber quando não está a perceber o que está a fazer. No entanto, fora da comunidade da ciência de dados, nem sempre é esse o caso. E isso é compreensível.
Em parte, a culpa é nossa. É um clube duro; historicamente, é difícil para os "forasteiros" penetrarem e muito menos compreenderem. As linguagens da ciência dos dados têm sido guardadas a sete chaves. Tal como a Igreja Católica Romana selecionou o latim eclesiástico como a principal língua de comunicação para controlar as mensagens, particularmente durante a Idade Média e no início do período moderno, nós, cientistas de dados, podemos ser acusados de acções semelhantes - embora obviamente não na mesma escala nem com um impacto tão direto em populações inteiras. Mas, tal como as Reformas do século XVI levaram à libertação da linguagem, tornando os princípios das várias igrejas cristãs mais acessíveis às massas, a ciência dos dados tem agora de alargar ainda mais o seu vernáculo.
Uma linguagem partilhada permitir-nos-ia deixar de acreditar que os cientistas de dados têm capacidades místicas para resolver qualquer problema, passando os dados por um ambiente de IA para produzir os resultados desejados, como que por magia. Ajudaria as pessoas a compreender que a ciência dos dados não é uma panaceia mágica.
De facto, se pretende realmente ter uma ciência de dados avançada, uma das piores coisas a fazer é atribuir a um cientista de dados a resolução de problemas isolados ou ad hoc, uma vez que isso irá criar silos de comunicação, mantendo a ciência de dados na sala das traseiras.
Em vez disso, a melhor forma de proliferar a ciência dos dados é expor os problemas a nível empresarial, compreendendo que, se bem feita, a ciência dos dados é um desporto de equipa. A existência de equipas multidisciplinares dedicadas a produtos ou clientes produz resultados comerciais superiores e desenvolve uma compreensão multifuncional. Um grupo que inclua um associado comercial, um gestor de produto, um engenheiro, um cientista de dados e representantes de outras organizações funcionais importantes deve ser fechado numa sala sem interrupções para uma reunião de ideias centrada nas maiores necessidades e oportunidades. É aqui que a verdadeira magia acontece.
No entanto, um viajante nesta jornada deve estar ciente dos sinais de alerta. Se, ao trabalhar com clientes ou outros terceiros num espírito de colaboração, começar a procurar soluções explicáveis a toda a gente, faça uma pausa. Tal como um mágico não limita o seu desempenho a truques elementares, o público compreende que os cientistas de dados não devem optar por soluções facilmente explicáveis. Diluir deliberadamente o processo pode ter o efeito colateral de fornecer uma solução menos que óptima para o problema. É um equilíbrio.
Esse equilíbrio assenta no facto de as empresas confiarem nas capacidades dos seus cientistas de dados. Confiar que os cientistas de dados partilharão a nossa linguagem tanto quanto possível, mas não diluirão as soluções quando as coisas se tornarem demasiado técnicas, e que nos manteremos sempre fiéis à nossa disciplina Este é o tipo de confiança e de equilíbrio que permite às empresas tecnologicamente avançadas chegarem aos seus respectivos conjuntos de verdade.
Este artigo foi originalmente publicado no Médio.