Cuando te encuentres en la búsqueda de trabajo como Data Scientist, es probable que tengas algunas inquietudes en relación a la entrevista técnica: ¿cómo es el formato habitual de las entrevistas?, ¿cuál es la forma de evaluar los conocimientos técnicos? En este artículo te contaremos sobre el formato típico de las entrevistas, tips y preguntas claves para prepararte, y haremos una breve evaluación sobre la eficiencia de cada método.

En una primera instancia, podemos dividir las entrevistas en sincrónicas (en vivo) y asincrónicas (asignación de uno o varios ejercicios y envío de resultados). Sin embargo, las mismas suelen estar relacionadas, es decir, puedes llegar a tener una primera entrevista asincrónica y luego otra sincrónica, y pueden combinarse distintos formatos.

Entrevistas sincrónicas

Las entrevistas sincrónicas pueden ser presenciales o mediante videoconferencia. Anteriormente, las entrevistas por videoconferencia constituían un primer contacto con el área de Recursos Humanos, que tenía como finalidad evaluar si el candidato reúne los requisitos básicos del puesto ofrecido y luego se pasaba a instancias presenciales, si el puesto no era remoto. En la actualidad, muchos procesos de selección pasaron a ser enteramente virtuales.

Entrevista teórico-práctica

Formato: El formato de esta entrevista suelen incorporar conceptos teórico-prácticos. Un experto de la compañía te hará preguntas claves para indagar tus conocimientos. La duración puede ser entre 40- 45 minutos. Algunas preguntas pueden ser puramente conceptuales, tales como:

  • ¿Qué es el sobreajuste y cómo se puede evitar?
  • Defina regresión logística.
  • ¿Qué es "conjunto de entrenamiento" y "conjunto de prueba" en un modelo de aprendizaje automático? ¿Cuántos datos asignará para sus conjuntos de entrenamiento, validación y prueba?

Otras preguntas teórico-prácticas pueden ser casos de estudio las cuales debes resolver en una pizarra. Por ejemplo:

  • Imagina que tu trabajo es realizar una clasificación supervisada de tres especies de peces con las siguientes características (features): largo, ancho, peso y color de los peces. Las primeras tres características (features) numéricas difieren en las escalas, y el color es una variable categórica. ¿Cómo harías para pre-procesar esta información para poder implementar un modelo de machine learning? Demostrar la respuesta con ejemplos.
  • Calcula precisión, recall y F1-Score de una matriz de confusión dada.

También pueden incluir preguntas en relación a un proyecto actual de ciencia de datos en el cual estés trabajando. Muchos algoritmos de aprendizaje automático se basan en conceptos de probabilidades y estadísticas, tener conocimiento de estos fundamentos es extremadamente importante, pero al mismo tiempo, deben poder relacionar fórmulas abstractas con problemas del mundo real.

Tips: Repasa los conceptos y herramientas claves de Ciencia de datos y de la aplicación principal del puesto solicitado. Practica frente a un espejo dichos conceptos o con otras personas. Para preguntas técnicas, practica la codificación en una pizarra o editor de texto. Te dejamos un link de towards data science con un listado de preguntas (está en inglés pero puedes usar el traductor de Google).

Eficiencia: media-alta. El hecho de conocer los conceptos teóricos de una herramienta y fundamentalmente poder discutir casos de estudio, da cuenta de qué tan buenos somos aplicándolos correctamente. Un científico de datos es más que un conocedor o aplicador de herramientas. Obviamente que la eficiencia está relacionada con la calidad de las preguntas, las mismas no deberían ser enteramente teóricas dado que no permitiría evaluar las capacidades de la persona entrevistada para resolver problemas al aplicar dichos conocimientos.

Design meeting
Photo by Charles Deluvio / Unsplash

Ejercicio de código en vivo

Formato: se te presentará un ejercicio o caso de estudio para que programes en vivo frente a un experto. A veces estas entrevistas se realizan en simultáneo para un grupo de personas. Esta clase de entrevista permite evaluar tu conocimiento técnico, tus habilidades para resolver problemas y tus prácticas para codear. En este caso debes prepararte para explicar la razón por la cual tomaste ciertas decisiones, y cómo estás diseñando tu código. La extensión puede ser de 45 minutos a una hora.

Tip: Intenta repasar cuáles son las mejores prácticas habituales para el lenguaje que se solicita (python o R). Un código claro, prolijo y comentado dará la pauta de que eres consciente de la importancia de trabajar en equipo. Te recomiendo este artículo de towards data science sobre mejores prácticas de código para un Data Scientist.

Eficiencia: alta. Este formato de entrevista permite evaluar tu conocimiento técnico así como tu manera de tomar decisiones y tu estilo de trabajo.  

Entrevistas asincrónicas

Este tipo de entrevista supone mayor flexibilidad, al poder realizar la entrevista desde cualquier lugar y en cualquier momento. Además, puede ser una instancia para resolver con mayor tranquilidad ya que no tienes en la pantalla a otra persona que te está evaluando. En general se encuentra en la primera etapa del proceso de selección.

Ejercicio de código aplicados a un caso de estudio

Formato: puede que recibas un correo electrónico con la información para registrarte en una plataforma utilizada para realizar la entrevista, o quizás te envíen directamente la consigna y pautas para enviar la resolución del problema. En general consiste de un caso de estudio con un dataset de ejemplo que tendrás que utilizar para resolver la pregunta clave de la consigna. Es normal que en una entrevista posterior te hagan preguntas sobre cómo lo resolviste. Por lo general te darán una semana para resolver este desafío, pero en algunas organizaciones el plazo puede ser más corto.

Tip: si sabes que por tus actividades no llegarás a realizarlo a tiempo avisa con anticipación, no el último día. Si avisas el mismo día que debías entregar se va a entender como una falta de planificación, en cambio de la otra forma sabrán que conoces tus tiempos y puedes organizarte de manera eficiente. Las competencias o challenges de machine learning como los de Kaggle son una excelente manera de exponerse a diferentes tipos de problemas y sus matices. Intenta participar en tantos como puedas y aplica diferentes modelos de aprendizaje automático.

Eficiencia: alta. Son entrevistas versátiles en las que se pueden testear diferentes aspectos. Permitirá evaluar tus habilidades para codear, resolver problemas y tomar decisiones en función a los resultados obtenidos.

Ejercicio de código y preguntas conceptuales

Formato: recibirás un formulario con preguntas vinculadas a competencias, comportamientos, conceptos de programación, fundamentos de ciencia de datos, idiomas u otros conocimientos específicos. Tus respuestas quedan registradas y disponibles para la empresa que realiza el proceso de selección. En muchas ocasiones, estos cuestionarios son generales por lo cual se aclara que no es necesario responder el 100% de las preguntas. Antes de comenzar revisa si tienes un tiempo limitado para responder o si te permiten ir resolviendo de a poco, salir y volver a ingresar.

Tip: Intenta resolver los cuestionarios de forma ordenada, y repasar los conceptos antes de comenzar. Este tipo de entrevistas se asemeja a un examen con libro abierto.

Eficiencia: media-baja. Si bien permite tener una primera noción de las habilidades de la persona entrevistada, muchas veces las consignas de programación están diseñadas para que las resuelvan programadores y no científicos de datos. Por lo cual, no permitirá dar cuenta de las cualidades para resolver problemas. Se debe tener en cuenta que los requisitos de Python o R  para los Data Scientist son diferentes de los de ingenieros y desarrolladores de software. Si sientes que ese es el caso puedes conversarlo con quien te entrevista para entender bien las expectativas respecto del puesto.

Photo by Chris Ried / Unsplash

Resumiendo, la entrevista técnica tiene como objetivo principal evaluar tus conocimientos técnicos (teórico-práctico), y tus habilidades para resolver problemas. Es importante que en las entrevistas también puedas entender cuáles son las expectativas de la organización con respecto al puesto, y el estadío de desarrollo del área de datos en el que se encuentra esa organización, para asegurarte que está alineado con tus expectativas y habilidades. .

Además, te recomendamos trabajar en cuál es tu diferencial, qué valor puedes aportar, y enfocar tu portfolio en esa dirección. Una buena opción es analizar proactivamente un problema que se asemeje a los de la organización en la que quisieras trabajar, por ejemplo si quisieras ingresar a una empresa de e-commerce podrías armar un caso vinculado a esta temática e incluirlo en tu portfolio. Recuerda que puedes utilizar los proyectos de la carrera para construir tu portfolio, si aún no lo has hecho.

Esperamos que estos tips te ayuden a sentir mayor seguridad durante tu próxima entrevista para un puesto de Data Scientist.

¡Hasta la próxima!