Senior AI Engineer (LLM / RAG / PRODUCTION)

Chúng tôi đang tìm kiếm AI Engineer có khả năng triển khai AI thực chiến – không chỉ hiểu bản chất mô hình mà còn thiết kế được pipeline (RAG / Semantic Matching / AI Agent) và đưa hệ thống vào môi trường staging/production một cách ổn định, có kiểm soát.

Vị trí này phù hợp với môi trường sản phẩm B2B Platform tích hợp Expo và AI Matching, nơi AI không dừng ở demo mà phải hoạt động thực tế, tối ưu hiệu năng, chi phí và chất lượng đầu ra.

YÊU CẦU CÔNG VIỆC

I. Yêu cầu bắt buộc

1. Nền tảng AI / LLM

Ứng viên cần có khả năng hiểu và triển khai thực tế:

Kiến thức cốt lõi:

Embedding, Vector Search, Similarity
Retrieval, Reranking, Chunking, Metadata handling
Prompt engineering, Context window management
Hallucination và các chiến lược giảm thiểu

Triển khai tối thiểu 01 pipeline thực tế:

RAG (Retrieval-Augmented Generation) – knowledge assistant / semantic search
hoặc Semantic Matching / Ranking
hoặc AI Agent (tool-calling / workflow automation)

2. Backend Engineering

Thành thạo Python (FastAPI, Django hoặc tương đương)
Có kiến thức Node.js (NestJS / Express) là lợi thế

Xây dựng được:

RESTful API
Background job / worker service
Cơ chế xử lý bất đồng bộ (queue-based processing)

3. Database & Data Layer

Thành thạo PostgreSQL:
- Schema design
- Indexing strategy
- Query optimization
Làm việc được với MongoDB
Có kinh nghiệm với ít nhất 01 Vector Database:
- pgvector / Weaviate / LanceDB

4. Deploy & Production Mindset

Đóng gói và triển khai hệ thống bằng Docker
Có tư duy vận hành production:
- Environment-based configuration (dev/staging/prod)
- Logging chuẩn hóa
- Error handling & retry strategy
- Rollback cơ bản
Hiểu các nguyên tắc:
- Stateless service
- Horizontal scaling
- Worker scaling theo queue workload

5. CI/CD, Monitoring & Tối ưu

Kinh nghiệm triển khai CI/CD (GitHub Actions / GitLab CI)
Monitoring & observability (Prometheus / Grafana / Sentry)
Kinh nghiệm tối ưu:
- Latency
- Inference cost
- Retrieval caching
Có phương pháp đánh giá chất lượng AI:
- Retrieval metrics (top-k hit rate)
- Response quality (human evaluation / rubric)

II. Điểm cộng

Elasticsearch / OpenSearch
Kinh nghiệm domain:
- B2B platform
- Marketplace
- Expo / Event platform
Hiểu kiến trúc event-driven, snapshot, eventual consistency
Có kinh nghiệm với:
- LangChain / LlamaIndex
- Qdrant / Milvus
- Kubernetes (K8s) / GPU inference

TRÁCH NHIỆM CÔNG VIỆC

Thiết kế và triển khai module AI cho sản phẩm:
- AI Search / Semantic Search
- AI Matching (buyer–supplier, product–business)
- AI Assistant (RFQ generation, tư vấn, Q&A)
Xây dựng AI service / worker:
- Data ingestion
- Embedding generation & vector storage
- Retrieval & ranking pipeline
- API response layer
Phối hợp cùng Backend / Frontend / QA:
- Định nghĩa API contract
- Kiểm soát chất lượng dữ liệu đầu vào
- Đảm bảo chất lượng đầu ra AI
Triển khai staging/prod:
- Docker-based deployment
- Logging & monitoring
- Tối ưu latency & cost

KỲ VỌNG KẾT QUẢ TRONG 30 NGÀY ĐẦU

Hoàn thành 01 module AI vận hành trên staging hoặc production (service/worker)
Thiết lập logging & monitoring cơ bản
Hoàn thiện tài liệu:
- Hướng dẫn chạy local
- Hướng dẫn deploy
- Quy trình rollback
Đáp ứng tiêu chí:
- Latency mục tiêu
- Độ ổn định hệ thống
- Chất lượng matching / search theo benchmark nội bộ

------------------------------

QUYỀN LỢI

Đóng bảo hiểm xã hội khi ký hợp đồng lao động.
Chính sách nghỉ phép hấp dẫn: có phép từ khi thử việc, 12 ngày phép năm cùng tất cả các ngày nghỉ lễ theo quy định.
Lương tháng 13 (áp dụng từ giai đoạn thử việc) tùy vào tình hình kinh doanh của công ty.
Được cung cấp đầy đủ trang thiết bị cần thiết để làm việc.
Môi trường startup công nghệ năng động, được tiếp cận trực tiếp với pháp lý trong TMĐT B2B.
Pantry đầy đủ: trà, cà phê, snack, lò vi sóng…
Tham gia các hoạt động gắn kết nội bộ, CLB, sự kiện công ty.