Google เปิดตัว Gemini 1.5 Flash-8B โมเดล AI ขนาดเล็กแบบ GA

Google ประกาศพร้อมให้บริการ Gemini 1.5 Flash-8B แบบ General Availability โมเดล AI ขนาดเล็กที่มีประสิทธิภาพสูง พร้อมเพิ่ม Rate limit 2 เท่า

Google ได้ประกาศเปิดตัว Gemini 1.5 Flash-8B ในรูปแบบ General Availability (GA) ซึ่งเป็นเวอร์ชันที่มีขนาดเล็กและรวดเร็วกว่าโมเดล Gemini 1.5 Flash เดิม โดย Gemini 1.5 Flash-8B มีราคาถูกลงถึง 50% และยังคงมีประสิทธิภาพใกล้เคียงกับรุ่นต้นฉบับในหลายด้าน โดยเฉพาะในงานที่เกี่ยวข้องกับการแชท, การถอดความเสียง และการแปลภาษาที่มีบริบทยาว

โมเดลใหม่นี้ได้รับการปรับแต่งให้เหมาะสมกับการใช้งานในอุปกรณ์ที่มีทรัพยากรจำกัด เช่น สมาร์ทโฟนและเซ็นเซอร์ โดยมี Latency ที่ลดลงสำหรับคำสั่งขนาดเล็ก ทำให้สามารถตอบสนองได้รวดเร็วยิ่งขึ้น นอกจากนี้ Google ยังได้เพิ่มอัตราการใช้งานเป็นสองเท่า โดยนักพัฒนาสามารถส่งคำขอได้สูงสุดถึง 4,000 ครั้งต่อนาที ซึ่งเหมาะสำหรับงานที่มีปริมาณสูงและต้องการการประมวลผลที่รวดเร็ว

ที่สำคัญ Gemini 1.5 Flash-8B ถือเป็นโมเดล Gemini ที่มีต้นทุนต่อประสิทธิภาพต่ำที่สุดที่เคยเปิดตัว ทำให้เป็นทางเลือกที่น่าสนใจสำหรับองค์กรที่ต้องการใช้ประโยชน์จาก AI แต่มีข้อจำกัดด้านงบประมาณ นักพัฒนาสามารถเข้าถึง Gemini 1.5 Flash-8B ได้ฟรีผ่าน Gemini API และ Google AI Studio ซึ่งเป็นแพลตฟอร์มที่ให้บริการนี้

ที่มา : https://siliconangle.com/2024/10/03/googles-lightweight-gemini-1-5-flash-8b-hits-general-availability/

Scroll to Top