ในปี 2023 ยักษ์ใหญ่เทคโนโลยีต่าง ๆ พัฒนา AI ออกมามากมาย โดยแต่ละค่ายมีจุดเด่นที่แตกต่างกันไป บทความนี้จะพาไปรู้จัก 4 AI ตัวเด่นจากค่าย Microsoft, Google, OpenAI และ Meta
Microsoft
Microsoft จับมือกับ OpenAI พัฒนา AI 2 ตัวด้วยกัน ได้แก่ GPT-4 และ DALL-E 3 โดย GPT-4 เป็นโมเดลภาษาขนาดใหญ่ที่สามารถตอบคำถาม เขียนบทความ และสร้างโค้ดได้ ส่วน DALL-E 3 เป็นโมเดลสร้างภาพจากคำอธิบาย โดยทั้งสองโมเดลนี้จะถูกนำไปใช้กับ Copilot ซึ่งเป็นแชทบอทที่ช่วยให้ผู้ใช้ทำงานได้มีประสิทธิภาพมากขึ้น
GPT-4 เป็นโมเดลภาษาขนาดใหญ่ที่มีจำนวนพารามิเตอร์ (parameters) สูงถึง 1.76 ล้านล้าน ซึ่งถือเป็นโมเดลภาษาขนาดใหญ่ที่สุดในโลกในปัจจุบัน GPT-4 สามารถเรียนรู้จากข้อมูลข้อความจำนวนมหาศาล ทำให้สามารถเข้าใจและสร้างภาษามนุษย์ได้อย่างใกล้เคียงกับมนุษย์จริง ตัวอย่างเช่น GPT-4 สามารถตอบคำถามที่ซับซ้อนได้ถูกต้อง เขียนบทความที่มีเนื้อหาสร้างสรรค์ และสร้างโค้ดที่ถูกต้องตามหลักภาษาศาสตร์
DALL-E 3 เป็นโมเดลสร้างภาพจากคำอธิบายที่มีจำนวนพารามิเตอร์สูงถึง 1.2 พันล้าน ซึ่งถือเป็นโมเดลสร้างภาพจากคำอธิบายที่ดีที่สุดในโลกในปัจจุบัน DALL-E 3 สามารถสร้างภาพจากคำอธิบายได้เหมือนจริงและสวยงาม ตัวอย่างเช่น DALL-E 3 สามารถสร้างภาพจากคำอธิบาย เช่น “ภาพวาดของสุนัขตัวใหญ่สีดำกำลังนอนอยู่บนโซฟา” หรือ “ภาพวาดของเมืองหลวงของประเทศไทย”
Google เปิดตัว Gemini ซึ่งเป็นโมเดล AI ขนาดใหญ่ที่สามารถรับสารตั้งต้นที่เป็นข้อความ ภาพ เสียง โค้ด และวิดีโอ แล้วแสดงผลกลับออกมาได้หลากหลายรูปแบบ โดย Gemini จะถูกนำไปใช้กับ Bard ซึ่งเป็นแชทบอทที่ฉลาดและสร้างสรรค์กว่า ChatGPT ของ OpenAI
Gemini เป็นโมเดล AI ขนาดใหญ่ที่มีจำนวนพารามิเตอร์สูงถึง 1.8 พันล้าน ซึ่งถือว่ามีขนาดใหญ่กว่า GPT-4 ของ OpenAI เล็กน้อย Gemini สามารถเรียนรู้จากข้อมูลหลากหลายรูปแบบ ทำให้สามารถเข้าใจและประมวลผลข้อมูลได้หลากหลายมิติ ตัวอย่างเช่น Gemini สามารถแปลภาษาได้หลายภาษา เขียนบทความได้หลายรูปแบบ และสร้างภาพได้หลายสไตล์
Bard เป็นแชทบอทที่ขับเคลื่อนด้วย Gemini Bard ฉลาดและสร้างสรรค์กว่า ChatGPT ของ OpenAI ในด้านต่อไปนี้
- ความเข้าใจภาษามนุษย์ Bard สามารถเข้าใจภาษามนุษย์ได้ดีกว่า ChatGPT ตัวอย่างเช่น Bard สามารถตอบคำถามที่ซับซ้อนได้ถูกต้อง และสามารถสนทนากับมนุษย์ได้อย่างราบรื่น
- ความสามารถในการสร้างสรรค์ Bard สามารถสร้างสรรค์สิ่งใหม่ ๆ ได้ดีกว่า ChatGPT ตัวอย่างเช่น Bard สามารถเขียนบทความที่มีเนื้อหาสร้างสรรค์ และสามารถวาดภาพได้สวยงาม
OpenAI
OpenAI พัฒนา GPT-4 ซึ่งเป็นโมเดลภาษาขนาดใหญ่ที่มีความสามารถในการตอบคำถาม เขียนบทความ และสร้างโค้ดได้ โดย GPT-4 ยังสามารถรับ Prompt ที่เป็นรูปภาพ แล้วตอบคำถามที่เกี่ยวกับภาพดังกล่าวได้ นอกจากนี้ OpenAI ยังมี DALL-E 3 ซึ่งเป็นโมเดลสร้างภาพจากคำอธิบายที่ได้รับความนิยมอย่างมาก
GPT-4 มีข้อดีดังนี้
- ประสิทธิภาพสูง GPT-4 สามารถทำงานได้มีประสิทธิภาพสูง ตัวอย่างเช่น GPT-4 สามารถเขียนบทความที่มีเนื้อหาสร้างสรรค์ได้ในเวลาเพียงไม่กี่นาที
- ความยืดหยุ่นสูง GPT-4 สามารถนำไปใช้งานในหลาย ๆ ด้าน ตัวอย่างเช่น GPT-4 สามารถใช้ในการสร้างแชทบอท การพัฒนาเกม และการสร้างเนื้อหาต่าง ๆ
DALL-E 3 มีข้อดีดังนี้
- ความสมจริง DALL-E 3 สามารถสร้างภาพที่สมจริงและสวยงาม ตัวอย่างเช่น DALL-E 3 สามารถสร้างภาพจากคำอธิบาย เช่น “ภาพวาดของสุนัขตัวใหญ่สีดำกำลังนอนอยู่บนโซฟา” หรือ “ภาพวาดของเมืองหลวงของประเทศไทย”
- ความหลากหลาย DALL-E 3 สามารถสร้างภาพได้หลากหลายสไตล์ ตัวอย่างเช่น DALL-E 3 สามารถสร้างภาพแนวสมจริง แนวการ์ตูน หรือแนวแฟนตาซี
Meta
Meta พัฒนา Llama 2 ซึ่งเป็นโมเดลภาษาขนาดใหญ่ที่เปิดให้ใช้งานและดาวน์โหลดได้ฟรี ทั้งสำหรับเพื่อการวิจัย และเพื่อการใช้งานเชิงพาณิชย์ โดย Llama 2 สามารถใช้งานได้คล้ายกับ ChatGPT ในการช่วยเขียน วิเคราะห์ แปลเอกสาร จดหมาย คอนเทนต์ หรือใช้พัฒนาแชทบอทใช้ในองค์กร
Llama 2 มีข้อดีดังนี้
- ความคุ้มค่า Llama 2 เป็นโมเดลภาษาขนาดใหญ่ที่เปิดให้ใช้งานและดาวน์โหลดได้ฟรี
- ความยืดหยุ่น