Data Engineer
팩타고라는 FactBlock, DeepVerify, LiveArticle 등 AI 기반의 지식 저장·검증 솔루션을 제공하며,
Data Engineer는 내부 문서 및 외부 데이터를 구조화하고, 안정적인 데이터 인프라를 구축하여 AI 학습 및 검증의 기반을 마련하는 역할을 수행합니다.
주요 업무
다양한 비정형 문서로부터 팩트 추출 및 정규화 파이프라인 구축
FactBlock 구축을 위한 ETL 작업 및 메타데이터 관리
그래프 DB 기반 벡터 데이터 인덱싱 및 검색 구조 설계
검증용 워크플로우 실행에 필요한 시계열/정책 데이터 처리
주요 기술 스택
Python, Pandas, Spark
PostgreSQL, MongoDB, Pinecone, Redis
Apache Airflow or equivalent workflow tools
Cloud 기반 데이터 파이프라인 tools
Databricks tech stacks
우대사항
다양한 데이터 소스(API, PDF, 문서파일 등)를 통합한 경험
MLOps / DataOps 환경 구축 또는 운영 경험
NLP 전처리 및 데이터 어노테이션 자동화 경험
FastAPI, GraphQL 등과의 연동 경험