Ciência de Dados: verdades e mentiras sobre esta prática científica

1
5962

Muitas perguntas que me fazem sobre Ciência de Dados revelam confusões de conceito e a força de algumas falácias, difundidas como verdades, sobre a prática científica da Ciência de Dados. Neste post vamos desmascarar algumas delas.

A primeira grande falácia é pensar que só os PHD’s ou gênios podem entender a matemática / programação por trás da ciência dos dados. Isso é absolutamente falso. Qualquer pessoa com um mínimo de dedicação pode perfeitamente dominar os conceitos e produzir em alto nível dentro da Ciência de Dados. Além disso, você não precisa ser bom em tudo. É perfeitamente possível (desejável até!) escolher uma das áreas de domínio da Ciência de Dados, e ser altamente produtivo dentro dela… O “Diagrama Venn” (que eu publico abaixo) ilustra muito bem as diversas áreas onde você pode atuar dentro do ecossistema da Ciência de Dados.

Assim, não se intimide quando se deparar com pessoas narrando histórias fantásticas de grandes feitos de cientistas de dados gênios da matemática e da programação… Na maioria das vezes essas histórias não passam de belas Estórias…

Outra confusão muito comum é sobre o conjunto de práticas (e o relacionamento entre elas) que dão suporte ao ecossistema da Ciência de Dados. São muitas as terminologias dúbias e conceitos conflitantes e até mesmo contraditórios.

Para facilitar a visualização e o entendimento das práticas/técnicas e dos relacionamentos entre elas, eu reproduzo um gráfico muito legal que mostra o estado da arte (até agora…) da Ciência de Dados (devidamente depurado de alguns modismos e de conceitos equivocados e/ou já ultrapassados!).

Para concluir, é importante ter claro que ao falarmos em Ciência de Dados estamos falando de uma narrativa que mal começou a ser escrita. Uma história ainda em seu prefácio…

Portanto, se você deseja se aventurar neste novo domínio, dois conselhos: mantenha a mente constantemente aberta para o novo e tenha muito cuidado com conclusões precipitadas, pois ainda temos muitos capítulos para escrever e reescrever na grande narrativa chamada Ciência de Dados…

Hélio Teixeira - Cientista-chefe do Centro de Estudos e Pesquisa em Ciência de Dados e Inteligência Artificial do IHT - é um estudioso da aprendizagem e da criatividade humanas como processos segundo ele "participativos e sociotecnicamente distribuídos." Sua pesquisa busca entender o que ele chama de "estruturas sociotécnicas de pertencimento necessárias à emergência da aprendizagem e da criatividade nos grupos humanos, concebidos como sistemas complexos." Ele adota uma abordagem transdisciplinar, articulando saberes da ciência da complexidade, ciências da aprendizagem, psicologia social, design participativo, inteligência artificial e psicologia cognitiva. Cientista de dados especializado em modelagem de dados e inteligência artificial algorítmica. Apaixonado por Modelagem Baseada em Agentes, com predileção pelos ambientes Mesa/Python e NetLogo, e pelo desenvolvimento de algoritmos de inteligência artificial. É fundador do Instituto Hélio Teixeira (IHT), do ColaboraLab e do Programa Letramento Tecnológico.

1 COMENTÁRIO

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui