การค้นหาข้อมูลจากไฟล์จำนวนมากในระบบองค์กรไม่เคยง่ายขนาดนี้มาก่อน…
Google เปิดตัวความสามารถใหม่ใน Gemini API ที่ชื่อว่า File Search ระบบที่ใช้ AI เข้าใจความหมายของข้อมูลในไฟล์ต่างๆ เพื่อให้คุณค้นเจอ “สิ่งที่ใช่” แม้จะไม่ได้พิมพ์คำตรง ๆ
File Search คืออะไร?
ฟีเจอร์ File Search คือความสามารถใหม่ของ Gemini API ที่ช่วยให้การทำ Retrieval Augmented Generation (RAG) เป็นเรื่องง่าย ด้วยการ:
- อัปโหลดไฟล์ แล้วระบบจะทำการ chunking (ตัดเป็นท่อน) และ embedding (แปลงเป็นเวกเตอร์ความหมาย)
- ทำให้ AI เข้าใจบริบทของข้อมูลและค้นหาตรงกับสิ่งที่คุณถามได้ดีขึ้น
- รองรับไฟล์มากมาย เช่น PDF, Word, Excel, Markdown, HTML, JSON, Python, Java, SQL และอีกเพียบ
สามารถอัปโหลดไฟล์โดยใช้ method uploadToFileSearchStore หรือใช้ importFile หากคุณต้องการแยกขั้นตอน
สำหรับตัวอย่างการใช้งานหรือการตั้งคำถาม Gemini สามารถดูได้ที่ Gemini API
แล้วทำงานอย่างไร?
เบื้องหลัง File Search คือการใช้ Semantic Search ซึ่งต่างจากการค้นหาด้วยคีย์เวิร์ดแบบเดิม AI จะเข้าใจ “ความหมาย” ของคำถามแล้วนำไปจับกับ embedding ที่ได้จากไฟล์ เรียกว่าค้นแบบ “เข้าใจ” ไม่ใช่แค่ตรงคำ
- Embeddings ที่ใช้คือ gemini-embedding-001
- ระบบ chunking ควบคุมได้ เช่น 200 tokens ต่อ chunk พร้อม overlap 20 tokens
ภาพ – การจัดทำดัชนีและการค้นหาไฟล์
ที่มา – Gemini API
ฟีเจอร์เด่น
- รองรับไฟล์ขนาดสูงสุด 100 MB
- จัดเก็บใน File Search Store ถาวร (ต่างจาก Files API ที่อยู่ได้ 48 ชม.)
- แยกหมวด store ได้ตามโปรเจกต์
- ค้นเจอพร้อม citation กลับมายังแหล่งข้อมูลในไฟล์ได้ทันที
ราคาและข้อจำกัด
- คิดค่าบริการแค่ ตอนสร้าง embedding ($0.15 (ประมาณ 5 บาทไทย) /ล้าน token)
- ค้นข้อมูลไม่เสียค่าใช้จ่ายเพิ่มเติม (เฉพาะค่าคอนเท็กซ์ token ตามปกติ)
- พื้นที่จัดเก็บฟรี แบ่งตาม Tier สูงสุด 1TB
ฟีเจอร์ File Search API ถือเป็นก้าวสำคัญของ Gemini ที่ช่วยให้ธุรกิจสามารถใช้ RAG (Retrieval-Augmented Generation) ได้ง่ายขึ้นบนฐานข้อมูลจริงในองค์กร ไม่ว่าจะเป็นเอกสาร PDF, โค้ด, ข้อมูล Excel หรือไฟล์ Markdown ก็สามารถตอบคำถามจากเนื้อหานั้นได้ตรงจุดกว่าเดิมมาก!
บริการ Google Workspace จาก hostatom สามารถดูรายละเอียดได้ที่
Google Workspace (G Suite) ดูแลโดยทีมงานคนไทย 24/7| hostatom
ที่มา: Gemini API


