
Chúng tôi đang tìm kiếm AI Engineer có khả năng triển khai AI thực chiến – không chỉ hiểu bản chất mô hình mà còn thiết kế được pipeline (RAG / Semantic Matching / AI Agent) và đưa hệ thống vào môi trường staging/production một cách ổn định, có kiểm soát.
Vị trí này phù hợp với môi trường sản phẩm B2B Platform tích hợp Expo và AI Matching, nơi AI không dừng ở demo mà phải hoạt động thực tế, tối ưu hiệu năng, chi phí và chất lượng đầu ra.
Ứng viên cần có khả năng hiểu và triển khai thực tế:
Kiến thức cốt lõi:
Embedding, Vector Search, Similarity
Retrieval, Reranking, Chunking, Metadata handling
Prompt engineering, Context window management
Hallucination và các chiến lược giảm thiểu
Triển khai tối thiểu 01 pipeline thực tế:
RAG (Retrieval-Augmented Generation) – knowledge assistant / semantic search
hoặc Semantic Matching / Ranking
hoặc AI Agent (tool-calling / workflow automation)
Thành thạo Python (FastAPI, Django hoặc tương đương)
Có kiến thức Node.js (NestJS / Express) là lợi thế
Xây dựng được:
RESTful API
Background job / worker service
Cơ chế xử lý bất đồng bộ (queue-based processing)
Thành thạo PostgreSQL:
Schema design
Indexing strategy
Query optimization
Làm việc được với MongoDB
Có kinh nghiệm với ít nhất 01 Vector Database:
pgvector / Weaviate / LanceDB
Đóng gói và triển khai hệ thống bằng Docker
Có tư duy vận hành production:
Environment-based configuration (dev/staging/prod)
Logging chuẩn hóa
Error handling & retry strategy
Rollback cơ bản
Hiểu các nguyên tắc:
Stateless service
Horizontal scaling
Worker scaling theo queue workload
Kinh nghiệm triển khai CI/CD (GitHub Actions / GitLab CI)
Monitoring & observability (Prometheus / Grafana / Sentry)
Kinh nghiệm tối ưu:
Latency
Inference cost
Retrieval caching
Có phương pháp đánh giá chất lượng AI:
Retrieval metrics (top-k hit rate)
Response quality (human evaluation / rubric)
Elasticsearch / OpenSearch
Kinh nghiệm domain:
B2B platform
Marketplace
Expo / Event platform
Hiểu kiến trúc event-driven, snapshot, eventual consistency
Có kinh nghiệm với:
LangChain / LlamaIndex
Qdrant / Milvus
Kubernetes (K8s) / GPU inference
Thiết kế và triển khai module AI cho sản phẩm:
AI Search / Semantic Search
AI Matching (buyer–supplier, product–business)
AI Assistant (RFQ generation, tư vấn, Q&A)
Xây dựng AI service / worker:
Data ingestion
Embedding generation & vector storage
Retrieval & ranking pipeline
API response layer
Phối hợp cùng Backend / Frontend / QA:
Định nghĩa API contract
Kiểm soát chất lượng dữ liệu đầu vào
Đảm bảo chất lượng đầu ra AI
Triển khai staging/prod:
Docker-based deployment
Logging & monitoring
Tối ưu latency & cost
Hoàn thành 01 module AI vận hành trên staging hoặc production (service/worker)
Thiết lập logging & monitoring cơ bản
Hoàn thiện tài liệu:
Hướng dẫn chạy local
Hướng dẫn deploy
Quy trình rollback
Đáp ứng tiêu chí:
Latency mục tiêu
Độ ổn định hệ thống
Chất lượng matching / search theo benchmark nội bộ
------------------------------
QUYỀN LỢI
Tôi không phải là người máy
