Perguntas de entrevista para Analista de Dados: o guia completo de preparação

O Bureau of Labor Statistics dos EUA projeta um crescimento de 36% no emprego de analistas de dados até 2033 — mais de sete vezes a média de todas as ocupações — com um salário anual médio de $103.500 [1]. Organizações de todos os setores estão contratando analistas para transformar dados brutos em decisões de negócio, mas a lacuna de habilidades permanece significativa: o Relatório da Força de Trabalho 2024 do LinkedIn identificou a análise de dados como a habilidade mais demandada em todas as categorias profissionais pelo terceiro ano consecutivo [2]. Isso significa que os entrevistadores avaliam não apenas a proficiência técnica, mas sua capacidade de comunicar insights, pensar criticamente sobre a qualidade dos dados e gerar resultados de negócio mensuráveis.

Este guia cobre o espectro completo de perguntas de entrevista para Analista de Dados — de SQL e raciocínio estatístico a comunicação com stakeholders e impacto nos negócios — com frameworks de resposta que separam candidatos que apenas consultam dados daqueles que entregam inteligência acionável.


Pontos-chave

  • Entrevistas para Analista de Dados testam proficiência em SQL, raciocínio estatístico e comunicação de negócios igualmente
  • Espere desafios de codificação ao vivo (SQL ou Python), análises para levar para casa e apresentações de estudos de caso
  • Perguntas comportamentais avaliam como você lida com requisitos ambíguos, prioridades conflitantes de stakeholders e problemas de qualidade de dados
  • Prepare exemplos de portfólio mostrando análise de ponta a ponta: formulação da pergunta, preparação de dados, análise, visualização e recomendação de negócio
  • Conhecimento das métricas-chave do seu setor e do ecossistema de dados é tão importante quanto habilidade técnica

Perguntas técnicas e de SQL

1. Escreva uma consulta SQL para encontrar os 5 principais clientes por valor total de pedidos nos últimos 90 dias, excluindo pedidos cancelados.

O que os entrevistadores procuram: Fluência prática em SQL, atenção a casos extremos e estrutura de consulta limpa.

Framework de resposta: Isso testa habilidades fundamentais de SQL — JOINs, agregação, filtragem e ordenação. Uma resposta forte aborda: (1) filtragem de data correta com CURRENT_DATE - INTERVAL '90 days', (2) exclusão explícita de pedidos cancelados com WHERE, (3) JOIN apropriado, (4) GROUP BY com SUM, e (5) ORDER BY DESC com LIMIT 5 [3]. Discuta casos extremos: pedidos parcialmente cancelados? Data do pedido ou data do pagamento? "Eu escreveria: SELECT c.customer_id, c.name, SUM(o.total_amount) as total_value FROM customers c JOIN orders o ON c.customer_id = o.customer_id WHERE o.order_date >= CURRENT_DATE - INTERVAL '90 days' AND o.status != 'canceled' GROUP BY c.customer_id, c.name ORDER BY total_value DESC LIMIT 5;"

2. Explique a diferença entre as cláusulas WHERE e HAVING em SQL.

Framework de resposta: WHERE filtra linhas antes da agregação; HAVING filtra grupos após a agregação [4]. WHERE não pode referenciar funções de agregação (SUM, COUNT, AVG) enquanto HAVING pode. A ordem de execução SQL é: FROM/JOIN, WHERE, GROUP BY, HAVING, SELECT, ORDER BY, LIMIT.

3. Como lidaria com dados ausentes em um conjunto de dados que está analisando?

Framework de resposta: Primeiro, diagnosticar o mecanismo de ausência [5]: MCAR, MAR ou MNAR. Depois, escolher a estratégia: exclusão, imputação ou sinalização.

4. Explique a diferença entre correlação e causalidade com um exemplo real.

Framework de resposta: Correlação mede a força de uma relação linear; causalidade significa que uma variável influencia diretamente a outra [6]. O piège clássico: vendas de sorvete e afogamentos são correlacionados, mas sorvete não causa afogamentos — ambos são causados pelo calor.

5. Como aborda o design de um dashboard para stakeholders?

Framework de resposta: Comece pelo público e suas decisões, não pelos dados [7]. Identifique perguntas de negócio, determine o público, projete para a cadência de decisões e aplique melhores práticas de visualização [8].


Perguntas estatísticas e analíticas

6. Um gerente de produto diz que o último teste A/B mostra uma melhoria de 2% na taxa de conversão com p-valor de 0,04. Deve implementar a mudança?

Framework de resposta: Significância estatística sozinha é insuficiente [9]. Avalie significância prática, intervalo de confiança, tamanho da amostra e efeitos de segmento.

7. Explique o que é erro Tipo I e Tipo II, e quando priorizar a minimização de cada um.

Framework de resposta: Tipo I (falso positivo) e Tipo II (falso negativo) [10]. O trade-off depende dos custos relativos de cada tipo de erro no contexto de negócio.

8. Como mediria o sucesso de uma nova funcionalidade do produto?

Framework de resposta: Definir a hierarquia de sucesso antes de escrever consultas [11]: métrica primária, métricas secundárias, métricas de proteção e alinhamento com a estrela norte.


Perguntas comportamentais e de comunicação

9. Conte sobre uma vez em que sua análise contradisse o que os stakeholders esperavam.

Framework de resposta: Demonstre coragem para entregar resultados indesejados e habilidade para enquadrá-los construtivamente [12].

10. Descreva uma vez em que trabalhou com dados bagunçados ou não confiáveis.

Framework de resposta: Descreva como identificou os problemas, como limpou os dados documentando decisões e como comunicou limitações na análise final [13].

11. Como prioriza quando múltiplos stakeholders solicitam análises simultaneamente?

Framework de resposta: Priorize por impacto no negócio, urgência da decisão e prontidão dos dados [14].


Perguntas baseadas em cenários

12. Você nota que os usuários ativos diários caíram 15% ontem. Guie-me pela sua investigação.

Framework de resposta: Siga uma árvore diagnóstica [15]: verificar dados, determinar escopo, checar causas conhecidas, examinar métricas correlacionadas, formular e testar hipóteses.

13. Um líder de vendas pede que construa um modelo para prever quais leads converterão.

Framework de resposta: Definir variável alvo, identificar features, avaliar qualidade dos dados, começar simples com regressão logística [16], definir métricas de avaliação, planejar implantação.

14. O marketing afirma que sua campanha de e-mail gerou $500.000 em receita. Como validaria essa afirmação?

Framework de resposta: Questione a metodologia de atribuição [17]: definição de "gerado", contrafactual, incrementalidade e viés de seleção.


Perguntas para o entrevistador

  1. "Como é a infraestrutura de dados — onde estão os dados e como os analistas os acessam?"
  2. "Como são definidas as prioridades analíticas?"
  3. "Pode descrever uma análise recente que mudou uma decisão de negócio?"
  4. "Qual é a abordagem da equipe para qualidade e governança de dados?"

Lista de verificação de preparação

  1. Pratique SQL sob pressão de tempo usando LeetCode, HackerRank ou StrataScratch [18].
  2. Prepare uma apresentação de portfólio com walkthrough de 10 minutos.
  3. Revise estatística básica — média, mediana, desvio padrão, intervalos de confiança, valores p.
  4. Conheça suas ferramentas profundamente — Python, R, Tableau ou Power BI.
  5. Pesquise os dados da empresa — blog da equipe de dados, palestras, descrições de vagas.

Referências

[1] U.S. Bureau of Labor Statistics, "Occupational Outlook Handbook: Data Scientists and Mathematical Science Occupations," BLS, 2024. [2] LinkedIn, "2024 Workforce Report: Most In-Demand Skills," LinkedIn Economic Graph, 2024. [3] Molinaro, D., "SQL for Data Analysis," O'Reilly Media, 2023. [4] Beaulieu, A., "Learning SQL," 3rd Edition, O'Reilly Media, 2020. [5] Little, R. & Rubin, D., "Statistical Analysis with Missing Data," 3rd Edition, Wiley, 2019. [6] Pearl, J. & Mackenzie, D., "The Book of Why: The New Science of Cause and Effect," Basic Books, 2018. [7] Few, S., "Information Dashboard Design," Analytics Press, 2013. [8] Knaflic, C.N., "Storytelling with Data," Wiley, 2015. [9] Wasserstein, R. & Lazar, N., "The ASA Statement on p-Values," The American Statistician, 2016. [10] Agresti, A. & Franklin, C., "Statistics: The Art and Science of Learning from Data," 4th Edition, Pearson, 2017. [11] Croll, A. & Yoskovitz, B., "Lean Analytics," O'Reilly Media, 2013. [12] Davenport, T. & Kim, J., "Keeping Up with the Quants," Harvard Business Review Press, 2013. [13] Dasu, T. & Johnson, T., "Exploratory Data Mining and Data Cleaning," Wiley, 2003. [14] Patil, D.J. & Mason, H., "Data Driven," O'Reilly Media, 2015. [15] Hubbard, D., "How to Measure Anything," 3rd Edition, Wiley, 2014. [16] Provost, F. & Fawcett, T., "Data Science for Business," O'Reilly Media, 2013. [17] Kohavi, R. et al., "Trustworthy Online Controlled Experiments," Cambridge University Press, 2020. [18] Tao, D., "Ace the Data Science Interview," 2023.

See what ATS software sees Your resume looks different to a machine. Free check — PDF, DOCX, or DOC.
Check My Resume

Tags

perguntas de entrevista analista de dados
Blake Crosley — Former VP of Design at ZipRecruiter, Founder of Resume Geni

About Blake Crosley

Blake Crosley spent 12 years at ZipRecruiter, rising from Design Engineer to VP of Design. He designed interfaces used by 110M+ job seekers and built systems processing 7M+ resumes monthly. He founded Resume Geni to help candidates communicate their value clearly.

12 Years at ZipRecruiter VP of Design 110M+ Job Seekers Served

Ready to build your resume?

Create an ATS-optimized resume that gets you hired.

Get Started Free