Lectura y escritura de archivos en Google Cloud Storage (CSV, Parquet, HTML). Gestionar archivos en Google Cloud Storage (lectura/escritura en distintos……
Realiza operaciones estandarizadas o prescritas bajo una supervisión limitada, así como también sigue instrucciones de estándares, métodos de trabajo o……
Lectura y escritura de archivos en Google Cloud Storage (CSV, Parquet, HTML). Gestionar archivos en Google Cloud Storage (lectura/escritura en distintos……
El objetivo principal de este puesto es apoyar las actividades relacionadas con la protección de los activos de la empresa y la integridad física de los……
The primary purpose of this position is to perform work which involves general engineering methods and tools; but you may also utilize more advanced……
Integer is a global organization providing innovative, high-quality technologies and manufacturing to Medical Device OEM’s to enhance the lives of patients……
Ability to work in a demanding user environment • Up to 10% travel may be required. Career Band Level: M3/P5 FLSA Status: Date Revised: Exempt May 8, 2020 The……
Adheres to Integer’s Values and all safety, environmental, security and quality requirements including, but not limited to: Quality Management Systems (QMS),……
Adheres to Integer Values and all safety, environmental, security, quality, regulatory, and company requirements, including Quality Management Systems (QMS),……
The primary purpose of this position is to perform work which involves engineering methods and tools for supporting the entire software development lifecycle;……
The primary purpose of this position is to perform work which involves general engineering methods and tools; but you may also utilize more advanced……
Buscamos un Data Scientist Middle responsable de analizar, transformar y modelar datos para generar soluciones analíticas que apoyen la toma de decisiones del negocio. Participará en el desarrollo de modelos de similitud, optimización y procesamiento de información, trabajando con grandes volúmenes de datos en entornos cloud (GCP), asegurando calidad, eficiencia y claridad en la comunicación de resultados.
Requisitos
Experiencia práctica en desarrollo con Python 3.10+.
Experiencia en manipulación y análisis de datos con Pandas, Polars y NumPy
Experiencia en técnicas de NLP y similitud de texto
Conocimiento en modelado de problemas de optimización (ILP con PuLP/CBC)
Experiencia en entornos GCP, particularmente BigQuery y Google Cloud Storage
Capacidad para traducir requerimientos de negocio en soluciones técnicas
Deseable conocimiento en temas contables (impuestos y su aplicación)
Habilidades Técnicas Indispensables
Python avanzado (3.10+).
Manipulación avanzada de DataFrames (merge, groupby, apply, iterrows) con Pandas
Uso de Polars (operaciones lazy, expresiones y diferencias frente a Pandas)
Operaciones vectorizadas y manejo de tolerancias numéricas con NumPy
NLP con spaCy (modelo es_core_news_lg) y cálculo de similitud semántica por coseno
Vectorización TF-IDF y cosine similarity con scikit-learn
Formulación de problemas de optimización con Integer Linear Programming (ILP) usando PuLP/CBC
Consultas SQL en BigQuery (queries parametrizadas)
Lectura y escritura de archivos en Google Cloud Storage (CSV, Parquet, HTML)
Habilidades Técnicas Deseables
Experiencia adicional en proyectos de matching y conciliación de datos.
Optimización de rendimiento en procesamiento de grandes volúmenes de información.
Conocimiento en modelos de clasificación o clustering.
Experiencia en automatización de pipelines de datos.
Conocimiento funcional en procesos contables o financieros
Actividades
Analizar y transformar grandes volúmenes de datos utilizando Python y librerías especializadas
Diseñar e implementar modelos de similitud de texto y matching utilizando NLP y técnicas vectoriales
Formular y resolver problemas de optimización mediante ILP
Ejecutar consultas en BigQuery para extracción de datos transaccionales
Gestionar archivos en Google Cloud Storage (lectura/escritura en distintos formatos)
Colaborar con áreas de negocio para traducir requerimientos en soluciones analíticas
Documentar procesos y resultados analíticos.
Asegurar calidad y consistencia de los datos utilizados en los modelos.
Competencias Blandas
Comunicación efectiva para audiencias técnicas y no técnicas