4 AI จากยักษ์ใหญ่เทคโนโลยี มีอะไรเด่นบ้าง มาดูกัน!

4 AI จากยักษ์ใหญ่เทคโนโลยี มีอะไรเด่นบ้าง

ในปี 2023 ยักษ์ใหญ่เทคโนโลยีต่าง ๆ พัฒนา AI ออกมามากมาย โดยแต่ละค่ายมีจุดเด่นที่แตกต่างกันไป บทความนี้จะพาไปรู้จัก 4 AI ตัวเด่นจากค่าย Microsoft, Google, OpenAI และ Meta

Microsoft

Microsoft จับมือกับ OpenAI พัฒนา AI 2 ตัวด้วยกัน ได้แก่ GPT-4 และ DALL-E 3 โดย GPT-4 เป็นโมเดลภาษาขนาดใหญ่ที่สามารถตอบคำถาม เขียนบทความ และสร้างโค้ดได้ ส่วน DALL-E 3 เป็นโมเดลสร้างภาพจากคำอธิบาย โดยทั้งสองโมเดลนี้จะถูกนำไปใช้กับ Copilot ซึ่งเป็นแชทบอทที่ช่วยให้ผู้ใช้ทำงานได้มีประสิทธิภาพมากขึ้น

GPT-4 เป็นโมเดลภาษาขนาดใหญ่ที่มีจำนวนพารามิเตอร์ (parameters) สูงถึง 1.76 ล้านล้าน ซึ่งถือเป็นโมเดลภาษาขนาดใหญ่ที่สุดในโลกในปัจจุบัน GPT-4 สามารถเรียนรู้จากข้อมูลข้อความจำนวนมหาศาล ทำให้สามารถเข้าใจและสร้างภาษามนุษย์ได้อย่างใกล้เคียงกับมนุษย์จริง ตัวอย่างเช่น GPT-4 สามารถตอบคำถามที่ซับซ้อนได้ถูกต้อง เขียนบทความที่มีเนื้อหาสร้างสรรค์ และสร้างโค้ดที่ถูกต้องตามหลักภาษาศาสตร์

DALL-E 3 เป็นโมเดลสร้างภาพจากคำอธิบายที่มีจำนวนพารามิเตอร์สูงถึง 1.2 พันล้าน ซึ่งถือเป็นโมเดลสร้างภาพจากคำอธิบายที่ดีที่สุดในโลกในปัจจุบัน DALL-E 3 สามารถสร้างภาพจากคำอธิบายได้เหมือนจริงและสวยงาม ตัวอย่างเช่น DALL-E 3 สามารถสร้างภาพจากคำอธิบาย เช่น “ภาพวาดของสุนัขตัวใหญ่สีดำกำลังนอนอยู่บนโซฟา” หรือ “ภาพวาดของเมืองหลวงของประเทศไทย”

Dall E 3
Microsoft Copilot
Chat GPT 4

Google

Google เปิดตัว Gemini ซึ่งเป็นโมเดล AI ขนาดใหญ่ที่สามารถรับสารตั้งต้นที่เป็นข้อความ ภาพ เสียง โค้ด และวิดีโอ แล้วแสดงผลกลับออกมาได้หลากหลายรูปแบบ โดย Gemini จะถูกนำไปใช้กับ Bard ซึ่งเป็นแชทบอทที่ฉลาดและสร้างสรรค์กว่า ChatGPT ของ OpenAI

Gemini เป็นโมเดล AI ขนาดใหญ่ที่มีจำนวนพารามิเตอร์สูงถึง 1.8 พันล้าน ซึ่งถือว่ามีขนาดใหญ่กว่า GPT-4 ของ OpenAI เล็กน้อย Gemini สามารถเรียนรู้จากข้อมูลหลากหลายรูปแบบ ทำให้สามารถเข้าใจและประมวลผลข้อมูลได้หลากหลายมิติ ตัวอย่างเช่น Gemini สามารถแปลภาษาได้หลายภาษา เขียนบทความได้หลายรูปแบบ และสร้างภาพได้หลายสไตล์

Bard เป็นแชทบอทที่ขับเคลื่อนด้วย Gemini Bard ฉลาดและสร้างสรรค์กว่า ChatGPT ของ OpenAI ในด้านต่อไปนี้

  • ความเข้าใจภาษามนุษย์ Bard สามารถเข้าใจภาษามนุษย์ได้ดีกว่า ChatGPT ตัวอย่างเช่น Bard สามารถตอบคำถามที่ซับซ้อนได้ถูกต้อง และสามารถสนทนากับมนุษย์ได้อย่างราบรื่น
  • ความสามารถในการสร้างสรรค์ Bard สามารถสร้างสรรค์สิ่งใหม่ ๆ ได้ดีกว่า ChatGPT ตัวอย่างเช่น Bard สามารถเขียนบทความที่มีเนื้อหาสร้างสรรค์ และสามารถวาดภาพได้สวยงาม
Google Gemini

OpenAI

OpenAI พัฒนา GPT-4 ซึ่งเป็นโมเดลภาษาขนาดใหญ่ที่มีความสามารถในการตอบคำถาม เขียนบทความ และสร้างโค้ดได้ โดย GPT-4 ยังสามารถรับ Prompt ที่เป็นรูปภาพ แล้วตอบคำถามที่เกี่ยวกับภาพดังกล่าวได้ นอกจากนี้ OpenAI ยังมี DALL-E 3 ซึ่งเป็นโมเดลสร้างภาพจากคำอธิบายที่ได้รับความนิยมอย่างมาก

GPT-4 มีข้อดีดังนี้

  • ประสิทธิภาพสูง GPT-4 สามารถทำงานได้มีประสิทธิภาพสูง ตัวอย่างเช่น GPT-4 สามารถเขียนบทความที่มีเนื้อหาสร้างสรรค์ได้ในเวลาเพียงไม่กี่นาที
  • ความยืดหยุ่นสูง GPT-4 สามารถนำไปใช้งานในหลาย ๆ ด้าน ตัวอย่างเช่น GPT-4 สามารถใช้ในการสร้างแชทบอท การพัฒนาเกม และการสร้างเนื้อหาต่าง ๆ

DALL-E 3 มีข้อดีดังนี้

  • ความสมจริง DALL-E 3 สามารถสร้างภาพที่สมจริงและสวยงาม ตัวอย่างเช่น DALL-E 3 สามารถสร้างภาพจากคำอธิบาย เช่น “ภาพวาดของสุนัขตัวใหญ่สีดำกำลังนอนอยู่บนโซฟา” หรือ “ภาพวาดของเมืองหลวงของประเทศไทย”
  • ความหลากหลาย DALL-E 3 สามารถสร้างภาพได้หลากหลายสไตล์ ตัวอย่างเช่น DALL-E 3 สามารถสร้างภาพแนวสมจริง แนวการ์ตูน หรือแนวแฟนตาซี
Chat GPT 4
Dall E 3

Meta

Meta พัฒนา Llama 2 ซึ่งเป็นโมเดลภาษาขนาดใหญ่ที่เปิดให้ใช้งานและดาวน์โหลดได้ฟรี ทั้งสำหรับเพื่อการวิจัย และเพื่อการใช้งานเชิงพาณิชย์ โดย Llama 2 สามารถใช้งานได้คล้ายกับ ChatGPT ในการช่วยเขียน วิเคราะห์ แปลเอกสาร จดหมาย คอนเทนต์ หรือใช้พัฒนาแชทบอทใช้ในองค์กร

Llama 2 มีข้อดีดังนี้

  • ความคุ้มค่า Llama 2 เป็นโมเดลภาษาขนาดใหญ่ที่เปิดให้ใช้งานและดาวน์โหลดได้ฟรี
  • ความยืดหยุ่น
Llama 2