中階 RAG 工程師 / AI 應用工程師
薪資範圍:90,000 ~ 140,000 TWD / month
打造醫療專用大語言RAG模型
核心技能更聚焦 → 以「能使用現有技術與最佳化」為重點,不強求從零打造檢索技術或微調 LLM。
避免過多高階技術 → 移除 Knowledge Graph、Fine-tuning 作為必備條件,而改為加分項。
更重視實務應用 → 強調 API 串接、系統整合、效能調校。
核心技能
1. 檢索系統(Retrieval)
- 具備 向量資料庫(Vector DB) 的基本使用經驗,例如 FAISS、ChromaDB、Weaviate 或 Pinecone。
- 能使用 嵌入模型(Embedding Models)(如 OpenAI Embeddings, Cohere, BGE)進行文本向量化。
- 理解 基本檢索技術(如 Top-K, Similarity Search),能選擇適合的檢索方式。
- 能進行 資料切片(Chunking)與索引(Indexing),確保資料能有效檢索。
🔹 加分項:了解 Hybrid Search(結合語義與關鍵字檢索)或 Re-Ranking 技術。
2. 生成系統(Generation)
- 熟悉 LLM API(如 OpenAI, Claude, Mistral, Llama),能將檢索結果整合至 LLM 輸入。
- 具備 Prompt Engineering 能力,能撰寫適當的提示詞(Prompts),提升模型回應品質。
- 了解 Context Augmentation,能有效組織檢索到的資訊,使 LLM 回應更準確。
🔹 加分項:有使用 Chain-of-Thought(CoT) 或 ReAct 來提升 LLM 推理能力的經驗。
3. 系統整合與最佳化(System Optimization)
- 具備基本的 API 串接與系統開發能力,能將 RAG 方案整合到應用中(如 chatbot、文件搜尋)。
- 了解如何透過 記憶機制(Memory) 提升 LLM 長對話的效果,例如短期記憶(Session Memory)。
- 具備 基本效能優化概念,能調整檢索與 LLM 參數以降低延遲(Latency)。
🔹 加分項:有 Cache 機制(如 Redis, Local Caching)來降低 API 召喚成本的經驗。
以下為加分項:
⭐ 有微調 LLM(Fine-tuning)或 Prompt-Tuning 經驗。
⭐ 具備 多步檢索(Multi-Hop Retrieval) 的實作經驗。
⭐ 了解 知識圖譜(Knowledge Graph),能結合結構化知識與 RAG。
⭐ 熟悉 混合檢索(Hybrid Search),能提升查找準確度。
公司地址:
台北市內湖區瑞光路358巷30弄10號八樓其他:
第一階段:履歷篩選📌條件具備向量資料庫(Vector DB)使用經驗(FAISS, ChromaDB, Pinecone, Weaviate)能夠使用嵌入模型進行文本向量化(OpenAI, Cohere, BGE)熟悉基本檢索技術(Top-K, Similarity Search)與資料索引策略有LLM API 使用經驗(OpenAI, Claude, Mistral, Llama)熟悉Prompt Engineering,能最佳化 LLM 生成內容加分項:Hybrid Search、Re-ranking、Memory(短期記憶 / 長期記憶)📌重點篩選✅ 是否有RAG 相關開發經驗(如 chatbot、智能搜尋)?✅ 是否有檢索最佳化 / 生成內容強化經驗?✅ 是否有API 整合與效能優化能力?第二階段:技術測試(Take-home Test + 技術面試)📌目標:測試候選人的檢索、生成與系統整合能力📌時間:3-5 小時(Take-home Test)+ 60-90 分鐘(技術面試)題目 1:檢索系統開發(向量 DB + 嵌入模型)📌情境:公司正在開發一個智慧客服系統,需要實作一個簡單的RAG 檢索模組。請使用FAISS / ChromaDB / Pinecone,完成:載入並索引一批 FAQ 文本(提供 JSON 格式資料)對使用者輸入的問題進行檢索,返回最相關的內容設計檢索策略(Top-K / Similarity Search)並解釋選擇理由🔹考察點是否能正確實作檢索系統?是否能選擇適合的檢索方法?是否有良好的程式結構與可讀性?題目 2:生成系統優化(Prompt Engineering & Context Augmentation)📌情境:在上述智慧客服系統中,檢索的結果需要傳給 LLM 進行回應,請:設計 Prompt,讓 LLM 能產生更準確的回應優化 Context Augmentation 方法,確保 LLM 使用的檢索資料最相關測試不同 Prompt 設計的效果,提供結果分析🔹考察點是否能優化 Prompt 設計?是否能有效利用檢索結果來提升 LLM 回應品質?是否能透過測試來調整最佳 Prompt?題目 3:API 整合與效能最佳化📌情境:公司計劃將RAG 檢索與 LLM 生成模組整合為 API,請:設計一個RESTful API(可用 Flask, FastAPI, Express.js),能夠:接收用戶查詢執行檢索呼叫 LLM API 生成回應如何降低 API 延遲(Latency)?(快取、批量查詢等策略)如何監控 API 使用狀況?(日誌與指標監控)🔹考察點API 設計是否清晰易維護?是否有效能優化與快取策略?是否有監控與錯誤處理機制?第三階段:文化與團隊適配面試📌問題當系統檢索結果不準確時,你如何調整?如何與前端、後端團隊合作,確保 RAG 系統與整體應用兼容?當 LLM 產生幻覺(Hallucination)時,如何減少錯誤回應?如何權衡 API 請求成本與準確性?🔹考察點是否具備團隊合作與溝通能力是否能解決 LLM 產生幻覺的問題是否能根據商業需求調整 RAG 策略-2025-03-04