已關閉

擅長AI生文、爬蟲、資料庫管理，有實際經驗之軟體結構師或團隊(詳需求說明)

案件編號 TK26012503THLK44 ・2026/03/03 更新

預算金額
$300,000
執行地點
可遠端
接案身份
不限
需求說明
A. 合作內容：一、系統項目(共有兩部分)： 1. 圈客行銷部分： (1) 針對台灣地區(第一階段)之「廠商」獲取「台灣地區」及「國外」之準確目標客戶，並對之行銷。 (2) 針對大陸地區(第二階段加入之項目)之「外銷廠商」獲取「國外」之準確目標客戶，並對之行銷。 2. 口碑行銷部分： (1) 針對台灣地區(第一階段)之「廠商」產出合意及有效之評論內容，提供消費者對GoogleMap、FB、IG、小紅書、TikTok等五個平台發出評論。 (2) 針對大陸地區(第二階段加入之項目)之「廠商」產出合意及有效之評論內容，提供消費者對小紅書、TikTok等平台發出評論。二、第一階段預估年營業額1-2億新台幣，第二階段保守預估年營業額新台幣3億以上。三、合作報酬(以承攬開發及維運為前提)： 1. 每月紅利分配：月純淨利之20%。 2. 開發費用：開發完成前50個行業支付費用8萬元新台幣(開發輪廓、重點、細節應注意部分，大致已清楚)。 3. 前後端系統ONCALL維運及程式增修費用：每月支付費用4萬元新台幣。(維運期間每月新增3行業) 四、有能力及意向之夥伴或團隊，請留言LINE ID及電話詳談細節。 B. 能力需求：誠徵精通以下範疇並具實際經驗之合作夥伴或團隊一、按前端(B端)及AI需求爬取及彙整FB、IG、GOOGLEMAP、官網、 amazon.....之內容： 1. 核心技能與經驗： (1) Python或其他爬蟲相關程式語言，至少2年以上實際爬蟲開發經驗。 (2) 閱讀、維護並重構既有爬蟲程式。 (3) 理解 HTTP Request / Response 機制，能處理登入驗證、Headers、Cookies、反爬機制等問題。 (4) 依據現有流程圖為主軸進行程式設計，獨立分析與補充細節，參考已開發程式進行優化與功能擴展。 (5) Web Scraping框架與工具，如Scrapy、BeautifulSoup、Selenium或Puppeteer，並根據需求選擇合適工具。 (6) 基於現有程式碼進行維護、調整與功能迭代，確保系統穩定性與持續改進。 (7) 示警細節與機制、監測平台。 (8) FB/IG自動化創建帳號養、養帳號能力。 (9) VPN上網技術及本系統反爬蟲規劃能力。 (10) 具全端程式及維運能力。 2. 社交媒體爬蟲專長： (1) 爬取Instagram、Facebook等社交平台貼文、短影音（Reels、Stories等）及相關資訊（如留言、按讚數、分享數）。 (2) 熟悉各大社交媒體平台限制規避技巧，確保資料抓取的穩定性與合法性。 (3) 處理動態網頁（JavaScript渲染）與反爬蟲機制（如CAPTCHA、IP封鎖）的挑戰。 (4) 以GraphQL 獲取資料。 3. WhatsApp： (1) 爬取amazon消費者相關資料。 (2) 以WhatsApp帳號發送訊息至messenger。 4. 以FB及IG帳號獲取除FB及IG內容外之「該特定受眾群之資訊及特性」。二、自然語言處理（NLP）與語言學，包括： 1. 語意分析、詞向量（word embeddings）、語境理解、語法結構（Syntax）、語義（Semantics）、語用（Pragmatics）。 2. 有效運用關鍵詞、上下文、格式化輸入來影響 AI 輸出。三、 AI 及大型語言模型（LLM）知識，包括： 1. Transformer、GPT、BERT 等 LLM 的基本原理與工作方式。 2. 模型的限制（如幻覺、偏見、資訊不完整）並以設計之 prompt 避免問題。 3. 以Zero-shot、Few-shot Learning等prompt 技巧，提升 LLM 回應的準確性。 4. Prompt 設計與優化技巧： (1) 精確性（Precision）：以簡單、明確的語言表達需求。 (2) 上下文設計（Context Design）：提供適量資訊，確保 AI 理解目標。 (3) 約束與格式化（Constraints & Formatting）：要求特定輸出格式，如 JSON、Markdown、表格。 (4) 測試與調優（A/B Testing）：針對不同 prompt 設計變體，找出最佳效果。 5. 程式設計與 API 整合： (1) Python 及各大公司 API / LangChain 等框架。 (2) 撰寫腳本（.sh）來自動化 prompt 測試與分析 AI 輸出結果。 (3) 會使用正則表達式、文本處理技巧來提取與過濾 AI 產生的內容。 6. 資料分析與評估： (1) 分析 AI 回應的準確度、一致性、創造性，找出最佳 prompt 模式。 (2) 設計 AB 測試比較不同 prompt 的效果。 7. 領域知識（Domain Knowledge）： (1) 針對不同應用場景（如程式碼生成、醫療診斷、法律、行銷、不同產業）調整 Prompt。 (2) 具備 UX / UI 設計思維，確保 AI 輸出對使用者有價值。 8. 版本控制與協作： (1) 有專案合作經驗，看得懂其他人專案的程式碼。 (2) Git / GitHub。 (3) HACKMD：技術文件撰寫、記錄進度（Prompt、流程）、設計原則與最佳實踐。 9. 安全與道德考量： (1) 確保 Prompt 避免產生有害內容（如偏見、虛假資訊）。 (2) 瞭解 AI 法規與道德風險，如歧視、隱私保護、內容審查。四、資料庫系統設計、優化、與管理 (1) 關聯式資料庫（如MySQL、PostgreSQL）的設計與應用，設計資料結構與索引，針對大規模資料儲存與查詢的優化。 (2) 熟悉Linux 環境，部署與排程（ cron、systemd、Docker，具 Kubernetes (k8s)）。 (3) 設計高效的資料結構與索引，支援跨行業、多帳號的社交媒體資料存儲與快速檢索。 (4) 資料清理與正規化，確保爬取資料的一致性與可用性。 (5) 管理管理資料庫。五、軟性技能與其他要求 1. 程式碼品質與文件紀錄：熟悉版本控制工具（如Git），撰寫乾淨、可讀的程式碼，並保持詳細的文件紀錄，確保程式碼易於理解與維護。 2. 資料隱私與合規性：深入了解資料隱私與法律規範（如GDPR、平台使用條款），確保爬蟲行為符合法規要求，並能在設計爬蟲系統時考慮倫理與法律約束。 3. 按既定程序與架構進行：理解既定程序與架構需求，並能密切合作，具備良好的達成能力。 4. 理解業務需求並將其轉化為技術實現。 5. 持續學習與技術更新：對新技術與社交平台API更新的保持敏感，持續學習以適應快速變化的爬蟲環境。 6. 快速理解既有程式邏輯並進行維護、功能調整、錯誤修復及效能優化。 7. Microsoft Azure雲端服務，在Azure環境中部署與擴展爬蟲系統，相關工具（如Azure Functions、Azure Blob Storage）。 8. 容器化技術（如Docker），以支援爬蟲系統的部署與管理。 9. 基本資料分析能力，將爬取資料進行初步結構化處理，方便後續分析應用。 10. 版本控制與監控：Git / GitHub 程式版本管理&錯誤監控與日誌管理（如 Sentry、ELK，或可自製監控腳本）。六、創意思維與問題解決能力&持續學習與研究： 1. 應對社交平台反爬蟲機制的變化或資料庫效能瓶頸。 2. 能夠拆解複雜問題，轉化為 AI 可理解的輸入格式。 3. 透過迭代測試找到最有效的 Prompt 組合。 4. 思考如何讓 AI 生成更具創意、符合需求的內容。 5. 跟蹤 AI / NLP 最新技術（如 OpenAI 發布的新模型、論文、第一手知道Deepseek消息等等）。 6. 持續優化 Prompt 設計，以適應 AI 的進步與應用需求。 7. 查閱論文研究解決問題，優秀的問題解決能力。

登入後即可完整查看

擅長AI生文、爬蟲、資料庫管理，有實際經驗之軟體結構師或團隊(詳需求說明)

預算金額

執行地點

接案身份

需求說明

ａｉ流程自動化

熟稔爬蟲程式於網頁拮取數值並統計形成趨線圖

視覺/自動化/爬蟲..等

自動化抓取資料

python代寫

熟稔爬蟲程式於網頁拮取數值統計形成趨線圖