Perguntas de entrevista para Analista de Dados: o guia completo de preparação
O Bureau of Labor Statistics dos EUA projeta um crescimento de 36% no emprego de analistas de dados até 2033 — mais de sete vezes a média de todas as ocupações — com um salário anual médio de $103.500 [1]. Organizações de todos os setores estão contratando analistas para transformar dados brutos em decisões de negócio, mas a lacuna de habilidades permanece significativa: o Relatório da Força de Trabalho 2024 do LinkedIn identificou a análise de dados como a habilidade mais demandada em todas as categorias profissionais pelo terceiro ano consecutivo [2]. Isso significa que os entrevistadores avaliam não apenas a proficiência técnica, mas sua capacidade de comunicar insights, pensar criticamente sobre a qualidade dos dados e gerar resultados de negócio mensuráveis.
Este guia cobre o espectro completo de perguntas de entrevista para Analista de Dados — de SQL e raciocínio estatístico a comunicação com stakeholders e impacto nos negócios — com frameworks de resposta que separam candidatos que apenas consultam dados daqueles que entregam inteligência acionável.
Pontos-chave
- Entrevistas para Analista de Dados testam proficiência em SQL, raciocínio estatístico e comunicação de negócios igualmente
- Espere desafios de codificação ao vivo (SQL ou Python), análises para levar para casa e apresentações de estudos de caso
- Perguntas comportamentais avaliam como você lida com requisitos ambíguos, prioridades conflitantes de stakeholders e problemas de qualidade de dados
- Prepare exemplos de portfólio mostrando análise de ponta a ponta: formulação da pergunta, preparação de dados, análise, visualização e recomendação de negócio
- Conhecimento das métricas-chave do seu setor e do ecossistema de dados é tão importante quanto habilidade técnica
Perguntas técnicas e de SQL
1. Escreva uma consulta SQL para encontrar os 5 principais clientes por valor total de pedidos nos últimos 90 dias, excluindo pedidos cancelados.
O que os entrevistadores procuram: Fluência prática em SQL, atenção a casos extremos e estrutura de consulta limpa.
Framework de resposta: Isso testa habilidades fundamentais de SQL — JOINs, agregação, filtragem e ordenação. Uma resposta forte aborda: (1) filtragem de data correta com CURRENT_DATE - INTERVAL '90 days', (2) exclusão explícita de pedidos cancelados com WHERE, (3) JOIN apropriado, (4) GROUP BY com SUM, e (5) ORDER BY DESC com LIMIT 5 [3]. Discuta casos extremos: pedidos parcialmente cancelados? Data do pedido ou data do pagamento? "Eu escreveria: SELECT c.customer_id, c.name, SUM(o.total_amount) as total_value FROM customers c JOIN orders o ON c.customer_id = o.customer_id WHERE o.order_date >= CURRENT_DATE - INTERVAL '90 days' AND o.status != 'canceled' GROUP BY c.customer_id, c.name ORDER BY total_value DESC LIMIT 5;"
2. Explique a diferença entre as cláusulas WHERE e HAVING em SQL.
Framework de resposta: WHERE filtra linhas antes da agregação; HAVING filtra grupos após a agregação [4]. WHERE não pode referenciar funções de agregação (SUM, COUNT, AVG) enquanto HAVING pode. A ordem de execução SQL é: FROM/JOIN, WHERE, GROUP BY, HAVING, SELECT, ORDER BY, LIMIT.
3. Como lidaria com dados ausentes em um conjunto de dados que está analisando?
Framework de resposta: Primeiro, diagnosticar o mecanismo de ausência [5]: MCAR, MAR ou MNAR. Depois, escolher a estratégia: exclusão, imputação ou sinalização.
4. Explique a diferença entre correlação e causalidade com um exemplo real.
Framework de resposta: Correlação mede a força de uma relação linear; causalidade significa que uma variável influencia diretamente a outra [6]. O piège clássico: vendas de sorvete e afogamentos são correlacionados, mas sorvete não causa afogamentos — ambos são causados pelo calor.
5. Como aborda o design de um dashboard para stakeholders?
Framework de resposta: Comece pelo público e suas decisões, não pelos dados [7]. Identifique perguntas de negócio, determine o público, projete para a cadência de decisões e aplique melhores práticas de visualização [8].
Perguntas estatísticas e analíticas
6. Um gerente de produto diz que o último teste A/B mostra uma melhoria de 2% na taxa de conversão com p-valor de 0,04. Deve implementar a mudança?
Framework de resposta: Significância estatística sozinha é insuficiente [9]. Avalie significância prática, intervalo de confiança, tamanho da amostra e efeitos de segmento.
7. Explique o que é erro Tipo I e Tipo II, e quando priorizar a minimização de cada um.
Framework de resposta: Tipo I (falso positivo) e Tipo II (falso negativo) [10]. O trade-off depende dos custos relativos de cada tipo de erro no contexto de negócio.
8. Como mediria o sucesso de uma nova funcionalidade do produto?
Framework de resposta: Definir a hierarquia de sucesso antes de escrever consultas [11]: métrica primária, métricas secundárias, métricas de proteção e alinhamento com a estrela norte.
Perguntas comportamentais e de comunicação
9. Conte sobre uma vez em que sua análise contradisse o que os stakeholders esperavam.
Framework de resposta: Demonstre coragem para entregar resultados indesejados e habilidade para enquadrá-los construtivamente [12].
10. Descreva uma vez em que trabalhou com dados bagunçados ou não confiáveis.
Framework de resposta: Descreva como identificou os problemas, como limpou os dados documentando decisões e como comunicou limitações na análise final [13].
11. Como prioriza quando múltiplos stakeholders solicitam análises simultaneamente?
Framework de resposta: Priorize por impacto no negócio, urgência da decisão e prontidão dos dados [14].
Perguntas baseadas em cenários
12. Você nota que os usuários ativos diários caíram 15% ontem. Guie-me pela sua investigação.
Framework de resposta: Siga uma árvore diagnóstica [15]: verificar dados, determinar escopo, checar causas conhecidas, examinar métricas correlacionadas, formular e testar hipóteses.
13. Um líder de vendas pede que construa um modelo para prever quais leads converterão.
Framework de resposta: Definir variável alvo, identificar features, avaliar qualidade dos dados, começar simples com regressão logística [16], definir métricas de avaliação, planejar implantação.
14. O marketing afirma que sua campanha de e-mail gerou $500.000 em receita. Como validaria essa afirmação?
Framework de resposta: Questione a metodologia de atribuição [17]: definição de "gerado", contrafactual, incrementalidade e viés de seleção.
Perguntas para o entrevistador
- "Como é a infraestrutura de dados — onde estão os dados e como os analistas os acessam?"
- "Como são definidas as prioridades analíticas?"
- "Pode descrever uma análise recente que mudou uma decisão de negócio?"
- "Qual é a abordagem da equipe para qualidade e governança de dados?"
Lista de verificação de preparação
- Pratique SQL sob pressão de tempo usando LeetCode, HackerRank ou StrataScratch [18].
- Prepare uma apresentação de portfólio com walkthrough de 10 minutos.
- Revise estatística básica — média, mediana, desvio padrão, intervalos de confiança, valores p.
- Conheça suas ferramentas profundamente — Python, R, Tableau ou Power BI.
- Pesquise os dados da empresa — blog da equipe de dados, palestras, descrições de vagas.
Referências
[1] U.S. Bureau of Labor Statistics, "Occupational Outlook Handbook: Data Scientists and Mathematical Science Occupations," BLS, 2024. [2] LinkedIn, "2024 Workforce Report: Most In-Demand Skills," LinkedIn Economic Graph, 2024. [3] Molinaro, D., "SQL for Data Analysis," O'Reilly Media, 2023. [4] Beaulieu, A., "Learning SQL," 3rd Edition, O'Reilly Media, 2020. [5] Little, R. & Rubin, D., "Statistical Analysis with Missing Data," 3rd Edition, Wiley, 2019. [6] Pearl, J. & Mackenzie, D., "The Book of Why: The New Science of Cause and Effect," Basic Books, 2018. [7] Few, S., "Information Dashboard Design," Analytics Press, 2013. [8] Knaflic, C.N., "Storytelling with Data," Wiley, 2015. [9] Wasserstein, R. & Lazar, N., "The ASA Statement on p-Values," The American Statistician, 2016. [10] Agresti, A. & Franklin, C., "Statistics: The Art and Science of Learning from Data," 4th Edition, Pearson, 2017. [11] Croll, A. & Yoskovitz, B., "Lean Analytics," O'Reilly Media, 2013. [12] Davenport, T. & Kim, J., "Keeping Up with the Quants," Harvard Business Review Press, 2013. [13] Dasu, T. & Johnson, T., "Exploratory Data Mining and Data Cleaning," Wiley, 2003. [14] Patil, D.J. & Mason, H., "Data Driven," O'Reilly Media, 2015. [15] Hubbard, D., "How to Measure Anything," 3rd Edition, Wiley, 2014. [16] Provost, F. & Fawcett, T., "Data Science for Business," O'Reilly Media, 2013. [17] Kohavi, R. et al., "Trustworthy Online Controlled Experiments," Cambridge University Press, 2020. [18] Tao, D., "Ace the Data Science Interview," 2023.