ข้ามไปยังเนื้อหาหลัก

Google I/O 2026: จุดเริ่มต้นของยุค Agentic Gemini

ตั้งแต่ Gemini 3.5 Flash และ Gemini Omni ไปจนถึง Antigravity 2.0 และ Gemini Spark นี่คือสิ่งสำคัญจากคีย์โน้ต I/O 2026 ที่เน้นเอเจนต์ของ Google
อัปเดตแล้ว 20 พ.ค. 2569  · 12 นาที อ่าน

สาระสำคัญที่เชื่อมโยงเกือบทุกประกาศในวันแรกของงาน Google I/O 2026 คือเรื่องเดียวกัน: เอเจนต์ ไม่ใช่แชตบอต ไม่ใช่ผู้ช่วย แต่เป็นเอเจนต์ที่คงอยู่ ทำงานตามภารกิจได้จริง รันเบื้องหลังและผสานเข้ากับผลิตภัณฑ์ทั้งหมดของ Google อย่างแนบแน่น ซีอีโอ Sundar Pichai เรียกอย่างชัดเจนว่านี่คือ “ยุค Agentic Gemini” และประกาศต่าง ๆ ก็สนับสนุนกรอบคิดนั้น

Google ยังตอบรับการสมัครสมาชิก Claude Max ของ Anthropic และ ChatGPT Pro ของ OpenAI ด้วยการเปิดตัวแพ็กเกจ Google AI Ultra ใหม่ในงาน I/O ที่มีราคาเดียวกันที่ $100/เดือน และเป็นประตูสู่การใช้งานฟีเจอร์แบบเอเจนต์บางส่วนที่กล่าวถึงด้านล่าง

ในบทความนี้ ฉันจะพาคุณไล่ดูประกาศที่สำคัญที่สุดสำหรับผู้ปฏิบัติงาน AI และนักพัฒนา โดยจะโฟกัสที่อัปเดตซึ่งใช้งานได้แล้วหรือคาดว่าจะพร้อมใช้งานในเร็ว ๆ นี้ 

Gemini 3.5 Flash

Gemini 3.5 Flash เป็นรุ่นโมเดลเด่นจากงาน I/O 2026 ทำผลงานได้เหนือกว่า Gemini 3.1 Pro บนเบนช์มาร์กด้านเอเจนต์และการเขียนโค้ด ขณะเดียวกัน Google อ้างว่ารันได้เร็วกว่าโมเดลแถวหน้ารุ่นอื่น ๆ 4 เท่าเมื่อวัดจากจำนวนโทเค็นเอาต์พุตต่อวินาที แม้เรายังยืนยันไม่ได้ในตอนนี้ แต่ก็ถือเป็นข้ออ้างที่ท้าทายทีเดียว

ในแง่เบนช์มาร์ก เห็นการก้าวกระโดดชัดเจน โดยเฉพาะใน MCP Atlas, CharXiV Reasoning และ Finance Agent v2 ซึ่ง Gemini 3.5 Flash นำอยู่ทั้งหมด โดยรวมแล้ว 3.5 Flash ดูจะแข่งขันได้กับ Claude Opus 4.7 และ GPT-5.5

เบนช์มาร์ก

3.5 Flash

3 Flash

3.1 Pro

Claude Sonnet 4.6

Opus 4.7

GPT-5.5

Terminal-bench 2.1

76.2%

58.0%

70.3%

--

66.1%

78.2%

SWE-Bench Pro

55.1%

49.6%

54.2%

--

64.3%

58.6%

MCP Atlas

83.6%

62.0%

78.2%

69.5%

79.1%

75.3%

OSWorld

78.4%

65.1%

76.2%

72.5%

78.0%

78.7%

Finance Agent v2

57.9%

42.6%

43.0%

51.0%

51.5%

51.8%

CharXiv Reasoning

84.2%

80.3%

83.3%

72.4%

82.1%

84.1%

Humanity's Last Exam

40.2%

33.7%

44.4%

33.2%

46.9%

41.4%

ARC-AGI-2

72.1%

33.6%

77.1%

58.3%

75.8%

84.6%

ด้านต้นทุนก็น่าสนใจ Google อ้างว่าองค์กรที่ประมวลผลราว 1 ล้านล้านโทเค็นต่อวัน อาจประหยัดได้กว่าปีละ 1 พันล้านดอลลาร์ หากย้าย 80% ของงานจากโมเดลแถวหน้าอื่น ๆ มาใช้ 3.5 Flash นี่เป็นการเจาะกลุ่มลูกค้าองค์กรของ OpenAI และ Anthropic โดยตรง Gemini 3.5 Flash พร้อมใช้งานแล้ววันนี้ผ่าน Gemini API, Google AI Studio และแอป Gemini ส่วน Gemini 3.5 Pro ใช้งานภายในแล้วและคาดว่าจะตามมาเดือนหน้า

รายละเอียดเพิ่มเติม แนะนำให้อ่าน บทความ Gemini 3.5 Flash ของเรา ซึ่งเจาะลึกโมเดลใหม่นี้มากขึ้น

Gemini Omni

Gemini Omni คือโมเดลสื่อสร้างสรรค์แบบกำเนิดที่รองรับมัลติโหมดโดยกำเนิดของ Google รับอินพุตได้ทุกรูปแบบทั้งข้อความ รูปภาพ เสียง และวิดีโอ และสามารถสร้างเอาต์พุตเป็นวิดีโอ โมเดลแรกในตระกูลนี้คือ Gemini Omni Flash พร้อมใช้งานแล้ววันนี้ในแอป Gemini, Google Flow และ YouTube Shorts

จุดเด่นด้านสถาปัตยกรรมคือ Omni รวมสแตกที่เคยแยกกัน (Veo สำหรับวิดีโอ, Imagen สำหรับภาพ, ระบบเสียงแยกต่างหาก) เข้าด้วยกันเป็นโมเดลเดียว หมายความว่าเมื่อทำงานข้ามมัลติโหมด การแก้ไขจะสอดคล้องกันมากขึ้นและมีอาร์ติแฟกต์จากไปป์ไลน์น้อยลง Google ยังไม่เผยตัวเลขเบนช์มาร์กสำหรับ Omni ในการเปิดตัวครั้งนี้ จึงต้องรอการประเมินอิสระต่อไป การเข้าถึง API สำหรับนักพัฒนาและลูกค้าองค์กรจะตามมาในไม่กี่สัปดาห์หลังงาน I/O

เราได้ทดสอบและเขียนรีวิวฉบับเต็มไว้ใน บทความ Gemini Omni ผลลัพธ์การสร้างวิดีโอชุดแรกยังมีเข้าบ้างไม่เข้าบ้าง (อย่างน้อยเมื่อเทียบกับมาตรฐานสูงที่เครื่องมืออย่าง Seedance 2.0 ตั้งไว้) แต่คาดว่า Gemini Omni Pro ที่ทรงพลังกว่าจะเปิดตัวในเร็ว ๆ นี้

Antigravity 2.0

Antigravity คือแพลตฟอร์มพัฒนาแบบเอเจนต์มาก่อนของ Google และการออกรุ่น 2.0 ในงาน I/O ถือเป็นการขยายครั้งสำคัญ เดิมถูกวางตำแหน่งเป็นสภาพแวดล้อมการเขียนโค้ด ตอนนี้กลายเป็นแพลตฟอร์มเต็มรูปแบบสำหรับพัฒนา ดีพลอย และจัดการกลุ่มเอเจนต์ AI อัตโนมัติ ไฮไลต์คือแอปเดสก์ท็อปแบบสแตนด์อโลนใหม่ซึ่งเป็นฮับกลางสำหรับจัดออร์เคสเทรตเอเจนต์ ให้รันเอเจนต์หลายตัวขนานกันบนงานต่าง ๆ ได้พร้อมกัน

ระบบนิเวศสำหรับนักพัฒนาตอนนี้มี 4 พื้นผิวที่ชัดเจน:

  • แอปเดสก์ท็อป Antigravity 2.0: จัดออร์เคสเทรตเอเจนต์หลายตัวแบบขนานและรองรับงานเบื้องหลังตามกำหนดการ เชื่อมกับ Google AI Studio, Android และ Firebase
  • Antigravity CLI: พื้นผิวแบบเนทีฟในเทอร์มินัลสำหรับสร้างและรันเอเจนต์โดยไม่ต้องใช้ GUI โดย Google แนะนำให้ผู้ใช้ Gemini CLI ย้ายมาที่นี่
  • Antigravity SDK: การเข้าถึงเชิงโปรแกรมไปยังเฟรมเวิร์กเอเจนต์เดียวกับที่ขับเคลื่อนผลิตภัณฑ์ของ Google เอง รองรับพฤติกรรมเอเจนต์แบบกำหนดเองที่โฮสต์บนโครงสร้างพื้นฐานของคุณ
  • Antigravity ใน Gemini Enterprise Agent Platform: เชื่อมต่อ Antigravity เข้ากับโปรเจกต์ Google Cloud โดยตรงสำหรับเวิร์กโหลดระดับองค์กร

ยังมีฟีเจอร์ใหม่ที่มีประโยชน์สำหรับเอเจนต์หลักด้วย ไฮไลต์คือสามารถสร้าง ซับเอเจนต์แบบโมดูลาร์ ได้ตามต้องการ โดยแต่ละตัวรันแบบขนาน มีการแยกเวิร์กสเปซ และสืบทอดการตั้งค่าเครื่องมือและสิทธิ์ของเอเจนต์แม่ งานที่รันยาวจะทำแบบอะซิงก์ จึงไม่บล็อกลูปของเอเจนต์อีกต่อไป

คล้ายกับ Claude Code Hooks JSON Hooks ให้ผู้ใช้ผูกสคริปต์เชลล์แบบกำหนดเองในจุดสำคัญของการทำงาน (ก่อน/หลังเรียกใช้เครื่องมือ เรียกโมเดล หรือเมื่อถึงเงื่อนไขหยุด) เพื่อบันทึกล็อก ปรับแต่งอาร์กิวเมนต์ หรือฉีดอินสตรักชัน Scheduled Tasks ให้ตั้งพรอมป์ตแบบ cron สำหรับการรันเอเจนต์ตามช่วงเวลาได้ เช่น สรุป PR รายวันหรือเช็กดีพลอยรายชั่วโมง โดยผลลัพธ์จะแสดงในแถบข้างเพื่อส่งต่องานให้มนุษย์มีส่วนร่วมได้อย่างลื่นไหล

ด้านการจัดการ Antigravity แนะนำ "โปรเจกต์" เป็นหน่วยจัดระเบียบที่กำหนดขอบเขตการตั้งค่า ทรัพยากร และสิทธิ์ต่อกลุ่มเอเจนต์ แทนที่จะต้องขอสิทธิ์ระดับกว้างสุดสำหรับทุกอย่าง แผงข้างแบบใหม่รองรับการจัดกลุ่มบทสนทนาตามโปรเจกต์ สถานะ หรือความใหม่ พร้อม การรองรับ Git worktree แบบเนทีฟ ในตัว เลย์เอาต์แบบยึดโปรเจกต์นี้เทียบได้กับการจัดการเวิร์กสเปซหลายหน้าต่างของ Cursor และคิวงานของ Codex แต่มีการจำกัดสิทธิ์รายโปรเจกต์ที่แน่นหนากว่า

สร้าง Git worktree แบบเนทีฟได้อย่างง่ายเมื่อเริ่มบทสนทนาใหม่

การป้อนเสียง ผ่านโมเดลเสียงของ Gemini และ คำสั่งสแลชใหม่ (/goal สำหรับการรันแบบอัตโนมัติ, /grill-me สำหรับถามเจาะก่อนเริ่มงาน, /schedule สำหรับพรอมป์ตแบบ cron, /browser สำหรับเปิดใช้เบราว์เซอร์แบบ opt-in) ช่วยเติมเต็มประสบการณ์ผู้ใช้

Antigravity 2.0 เปิดให้ผู้ใช้เริ่มใช้งานได้ตั้งแต่วันนี้ แผน Google AI Ultra ($100/เดือน) ให้โควตาการใช้งานใน Antigravity สูงกว่าแผน Google AI Pro ถึง 5 เท่า

Managed Agents ใน Gemini API

ควบคู่กับ Antigravity 2.0 Google ประกาศ Managed Agents ใน Gemini API ซึ่งนำความสามารถแบบเอเจนต์เข้ามาที่ชั้น API โดยตรงสำหรับนักพัฒนาที่ต้องการสร้างแอปพลิเคชันแบบขับเคลื่อนด้วยเอเจนต์โดยไม่ต้องบริหารโครงสร้างออร์เคสเตรชันเอง นี่คือส่วนเติมเต็มระดับ API ให้กับประสบการณ์บนเดสก์ท็อปของ Antigravity

ในทางปฏิบัติสำหรับนักพัฒนา ตอนนี้สามารถกำหนดพฤติกรรมเอเจนต์ การเชื่อมต่อเครื่องมือ และเวิร์กโฟลว์หลายขั้นตอนผ่าน Gemini API และให้โครงสร้างพื้นฐานของ Google จัดการการรันให้ได้ ศักยภาพนี้อาจพลิกเกมสำหรับทีมที่สร้างแอปโปรดักชันซึ่งต้องการการทำงานภารกิจระยะยาวโดยไม่ต้องตั้งและดูแลเฟรมเวิร์กเอเจนต์เอง การเข้าถึงทำได้ผ่าน Google AI Studio และลูกค้าองค์กรเข้าถึงผ่าน Gemini Enterprise Agent Platform

ข้อควรระวังอย่างตรงไปตรงมา: ฟีดแบ็กนักพัฒนาช่วงแรกจากการรายงานงาน I/O ระบุว่าเอกสารสำหรับโฟลว์เอเจนต์ที่ซับซ้อนและการจัดการข้อผิดพลาดยังมีน้อย ขีดจำกัดอัตราและการจัดสรรโควตาก็ถูกมองว่าเป็นจุดฝืด ทั้งสองประเด็นน่าจะดีขึ้นตามเวลา แต่ควรรับรู้ก่อนตัดสินใจสร้างบนสแตกนี้

Gemini Spark

Gemini Spark (อย่าสับสนกับ LLM ล่าสุดของ Meta อย่าง Muse Spark) คือเอเจนต์ AI ส่วนบุคคลตัวใหม่ของ Google และเป็นประกาศเชิงคอนซูเมอร์ที่สุดในกลุ่มเอเจนต์ มันรันตลอด 24/7 บนเครื่องเสมือนเฉพาะใน Google Cloud หมายความว่าไม่ต้องเปิดแล็ปท็อปไว้ก็ทำงานต่อได้ Spark ขับเคลื่อนด้วย Gemini 3.5 และเฟรมเวิร์ก Antigravity ทำให้จัดการภารกิจระยะยาวเบื้องหลังได้

ชุดฟีเจอร์ช่วงเปิดตัวประกอบด้วย:

  • การผสานกับ เครื่องมือของ Google เอง (Workspace, Gmail, Calendar) ตั้งแต่เปิดตัว โดยรองรับเครื่องมือบุคคลที่สามผ่าน MCP ในสัปดาห์ถัดไป
  • โต้ตอบผ่าน แอป Gemini และเร็ว ๆ นี้ผ่านอีเมลและแชต
  • ทำงานได้โดยตรงภายใน Chrome ในฐานะเลเยอร์เบราว์เซอร์แบบเอเจนต์ ภายในฤดูร้อนนี้
  • ดูความคืบหน้างานแบบสดผ่าน Android Halo พื้นที่ UI ใหม่บน Android ภายในปลายปีนี้

เมื่อเทียบกับระบบเอเจนต์ของ OpenAI และความสามารถการใช้เครื่องมือของ Anthropic Spark แตกต่างที่การรันแบบคงอยู่ 24/7 บนโครงสร้างพื้นฐาน Google Cloud ผสานลึกกับชุดเครื่องมือเพื่อการทำงานของ Google หากงานของคุณอยู่ใน Google Workspace อยู่แล้ว นี่คือข้อได้เปรียบที่มีนัยสำคัญ แต่หากไม่ใช่ คุณค่าก็อาจไม่เด่นชัด

ประเด็นความเป็นส่วนตัวเป็นข้อกังวลที่สมเหตุสมผล เอเจนต์ที่ติดตามกล่องจดหมาย ปฏิทิน และเอกสารของคุณอย่างต่อเนื่อง ย่อมทำให้เกิดคำถามจริงจังเกี่ยวกับการเก็บข้อมูลและความสอดคล้องตามกฎระเบียบในอุตสาหกรรมที่กำกับดูแล ตัวอย่างคำถามที่ฉันถามตัวเองคือ “หน่วยความจำของเอเจนต์เกิดอะไรขึ้นเมื่อพนักงานลาออก?” Google ยังไม่ได้ให้คำตอบเชิงรายละเอียด Spark กำลังปล่อยให้ผู้ทดสอบที่เชื่อถือได้ในสัปดาห์นี้ และจะเปิดเบต้าให้ผู้สมัครสมาชิก Google AI Ultra ($100/เดือน) ในสหรัฐอเมริกาสัปดาห์ถัดไป

Managed Agents เทียบกับ Gemini Spark

Search agents และโหมด AI

โหมด AI ใน Search เปิดตัวเมื่อ I/O ครั้งก่อน ผ่านมาหนึ่งปี ตอนนี้มีผู้ใช้งานมากกว่าพันล้านคนต่อเดือนแล้ว และ Google กำลังก้าวต่อด้วยความสามารถแบบเอเจนต์ใหม่สองอย่าง

อย่างแรกคือเอเจนต์ข้อมูลใน Search: เอเจนต์เบื้องหลังแบบปรับให้เหมาะกับผู้ใช้ ซึ่งตั้งค่าให้ติดตามหัวข้อและผยองข้อมูลที่เกี่ยวข้องในจังหวะที่เหมาะสม ฟีเจอร์นี้จะทยอยปล่อยฤดูร้อนนี้ เริ่มจากผู้สมัคร Google AI Pro และ Ultra

อย่างที่สองคือ UI แบบกำเนิดใน Search ขับเคลื่อนด้วย Gemini 3.5 Flash และ Antigravity Search จะสร้างเลย์เอาต์แบบกำหนดเอง ภาพโต้ตอบ และแม้แต่แดชบอร์ดหรือมินิแอปถาวรสำหรับคำค้นที่ซับซ้อนและกินเวลานาน ความสามารถ UI แบบกำเนิดจะเปิดให้ผู้ใช้ทุกคนฟรีในฤดูร้อนนี้ ส่วนแดชบอร์ดถาวรและแอปแบบกำหนดเองจะเปิดให้ผู้ใช้ Pro และ Ultra ในสหรัฐฯ ก่อน

นี่คือความกังวลจริงสำหรับผู้จัดพิมพ์และผู้เชี่ยวชาญ SEO (เช่นเดียวกับตอนเปิดตัว AI Overview และโหมด AI) เมื่อคำตอบที่สร้างด้วย AI แก้ปัญหาคำค้นของผู้ใช้ได้ครบถ้วนใน Search ก็ไม่มีเหตุผลให้คลิกไปยังเว็บไซต์ต้นทาง เราเห็นแล้วว่าเกิดอะไรขึ้น: ทั้ง AI Overviews และโหมด AI ช่วงแรกทำให้ทราฟฟิกลดลงอย่างมีนัยในอุตสาหกรรม Google ยังไม่มีแนวทางชัดเจนในการแบ่งรายได้หรือการันตีทราฟฟิกให้ผู้จัดพิมพ์ที่เนื้อหาถูกนำไปใช้สร้างคำตอบเหล่านี้

Google Flow

Google Flow ซึ่งเปิดตัวครั้งแรกใน I/O 2025 ในฐานะเครื่องมือสร้างภาพยนตร์ด้วย AI ก้าวหน้าครั้งใหญ่ด้วย 3 อัปเดตหลัก:

  • เอเจนต์วางแผนที่ฉลาดขึ้น เอเจนต์ Flow ที่อัปเดตสามารถวางแผนและเหตุผลผ่านโปรเจกต์สร้างสรรค์หลายขั้นตอน คุณให้ข้อมูลอินพุต (เช่น คอนเซ็ปต์ ภาพอ้างอิง สคริปต์คร่าว ๆ) และมันจะช่วยพาคุณจากการระดมไอเดียสู่การสร้างและตัดต่อ ในสภาพแวดล้อมเดียว เอเจนต์ใหม่พร้อมให้ทุกคนใช้งานวันนี้
  • วิดีโอแบบเนทีฟผ่าน Gemini Omni ตอนนี้ Flow รองรับการสร้างและตัดต่อวิดีโอแบบเนทีฟผ่านโมเดล Omni อธิบายการเปลี่ยนแปลงคลิปจากคลังภาพของคุณด้วยภาษาธรรมดาและไล่แก้ไขแบบสนทนา ความคงเส้นคงวาของตัวละครก็ดีขึ้น เอกลักษณ์และเสียงจึงคงอยู่ข้ามฉาก เหมาะโดยเฉพาะเมื่อสร้างหนังสั้นหรือแคมเปญโฆษณาที่มีตัวละครซ้ำ
  • Vibe coding สำหรับเครื่องมือแบบกำหนดเอง แทนที่จะจำกัดอยู่กับเครื่องมือที่ Flow มีให้ ตอนนี้คุณสร้างเครื่องมือเองได้บนแพลตฟอร์ม Google สาธิตตัวอย่างอย่างเช่นออกแบบเอฟเฟกต์วิดีโอแบบกำหนดเอง สร้างเครื่องมือแอนิเมชันวาดมือ และเวิร์กโฟลว์ซ้อนข้อความ ทั้งหมดทำได้โดยไม่ต้องออกจาก Flow

เมื่อรวมกัน อัปเดตเหล่านี้วางตำแหน่ง Flow ให้เป็นมากกว่าผู้ช่วยสร้างสรรค์ แต่กำลังก้าวสู่แพลตฟอร์มสำหรับสร้างเวิร์กโฟลว์สร้างสรรค์ โดยแอปบนมือถือกำลังอยู่ในเบต้าบน Android และจะตามมาบน iOS เร็ว ๆ นี้

การขยาย SynthID

SynthID ระบบวอเตอร์มาร์ก AI แบบมองไม่เห็นของ Google ได้วอเตอร์มาร์กภาพและวิดีโอกว่า 100 พันล้านรายการ และเนื้อหาเสียงรวมเทียบเท่า 60,000 ปี ตั้งแต่เปิดตัวเมื่อสามปีก่อน ไฮไลต์จาก I/O ที่สำคัญไม่ใช่สเกล แต่คือพาร์ทเนอร์: OpenAI, Kakao และ Eleven Labs กำลังนำ SynthID ไปใช้เคียงคู่ Nvidia ที่เข้าร่วมเมื่อปีที่แล้ว

การยอมรับข้ามอุตสาหกรรมคือสิ่งที่ทำให้เรื่องนี้มีความหมาย มาตรฐานวอเตอร์มาร์กใช้ได้ผลก็ต่อเมื่อแพร่หลายพอที่ “ไม่มีวอเตอร์มาร์ก” จะกลายเป็นสัญญาณที่มีประโยชน์ Google ยังขยายการยืนยัน Content Credentials (มาตรฐาน C2PA) ไปยัง Search และ Chrome เพื่อให้ผู้ใช้เห็นว่าคอนเทนต์มาจาก AI หรือกล้อง และถูกแก้ไขด้วยเครื่องมือกำเนิดหรือไม่ การผสาน SynthID กับ C2PA ทำให้ที่มา (provenance) มีสองชั้นอิสระ ซึ่งเป็นแนวทางที่ถูกต้องเพราะแต่ละชั้นถูกถอดได้ง่ายหากอยู่ลำพัง

เกียรติกล่าวถึง

ประกาศอื่น ๆ จาก I/O ที่ควรกล่าวถึงอย่างรวดเร็ว:

  • Docs Live: ฟีเจอร์เน้นเสียงสำหรับ Google Docs ให้คุณพูดไอเดียทิ้งไว้ แล้วให้ Gemini จัดโครงสร้างเป็นเอกสาร จะทยอยปล่อยให้ผู้สมัครในฤดูร้อนนี้ และฟีเจอร์เสียงจะมาที่ Gmail และ Keep พร้อมกัน
  • Google Pics: เครื่องมือสร้างและแก้ไขภาพด้วย AI ตัวใหม่ที่สร้างบนโมเดล Nano Banana มองทุกองค์ประกอบเป็นอ็อบเจ็กต์เดี่ยว ไม่ใช่ภาพแบน ๆ เปิดให้ผู้ทดสอบที่เชื่อถือได้แล้ว และจะปล่อยให้ผู้สมัคร Google AI Pro และ Ultra ภายในฤดูร้อนนี้
  • Android Halo: พื้นที่ UI ใหม่บน Android สำหรับดูอัปเดตสดและความคืบหน้างานจากเอเจนต์อย่าง Gemini Spark จะมาภายในปลายปีนี้
  • Daily Brief: เอเจนต์พร้อมใช้ในแอป Gemini ที่รวบรวมสรุปยามเช้าแบบส่วนบุคคลจากอีเมล ปฏิทิน และงานของคุณ พร้อมขั้นตอนถัดไปที่แนะนำ ไม่มีการประกาศค่าบริการแยก คาดว่าเป็นส่วนหนึ่งของประสบการณ์ในแอป Gemini
  • TPU 8t และ 8i: TPU เจเนอเรชันที่ 8 ของ Google ใช้วิธีชิปคู่ โดย 8t ปรับเหมาะสำหรับการพรีเทรนขนาดใหญ่ (พลังประมวลผลดิบเกือบ 3 เท่าจากเจเนอเรชันก่อน ขยายสเกลได้มากกว่า 1 ล้าน TPU ทั่วโลก) และ 8i ปรับเหมาะสำหรับอินเฟอเรนซ์ ทั้งคู่ให้ประสิทธิภาพต่อวัตต์ดีกว่าเดิมสูงสุด 2 เท่า
  • Gemini for Science: ชุดเครื่องมือ AI ที่เชื่อม Antigravity กับฐานข้อมูลวิทยาศาสตร์ชีวภาพหลักกว่า 30 แหล่ง Science Skills พร้อมใช้งานวันนี้บน GitHub และใน Antigravity โดยตรง

ข้อคิดส่งท้าย

Google I/O 2026 คือการเดิมพันบนเอเจนต์ในฐานะทิศทางหลักของ AI โดยมี Gemini 3.5 Flash และ Antigravity 2.0 เป็นโครงสร้างพื้นฐานรองรับเกือบทุกสิ่งที่ประกาศ สิ่งที่ใช้ได้ทันทีตอนนี้คือ Gemini 3.5 Flash (ผ่าน Gemini API และ AI Studio) เอเจนต์ Flow ใหม่ Gemini Omni Flash และแอปเดสก์ท็อป Antigravity 2.0 ส่วน Gemini Spark เอเจนต์ใน Search และฟีเจอร์ UI แบบกำเนิดใน Search จะทยอยปล่อยช่วงฤดูร้อน โดยส่วนใหญ่จะอยู่หลังแพ็กเกจ AI Ultra ราคา $100/เดือน (อย่างน้อยในระยะแรก)

สำหรับฉัน การอัปเกรด Antigravity คือการเปิดตัวที่น่าสนใจที่สุด เพราะมัน ทำงานสองระดับพร้อมกัน: ในฐานะแอปของนักพัฒนาแบบสแตนด์อโลน มันท้าชน Codex และ Claude Code ได้โดยตรง; ในฐานะแพลตฟอร์ม ADK และ Managed Agents API ที่อยู่ใต้ฝาก็ท้าทายเฟรมเวิร์กออร์เคสเตรชันอย่าง LangChain, AutoGen และ Agents SDK ของ OpenAI การผสานกับ Gemini และเลเยอร์ดีพลอยบน Google Cloud คือจุดแตกต่าง (และความเสี่ยงต่อการล็อกอิน) ในทั้งสองด้าน

Google I/O 2026 คำถามที่พบบ่อย

Gemini 3.5 Flash เปรียบเทียบกับ GPT-5.5 และ Claude Opus 4.7 อย่างไร?

Gemini 3.5 Flash นำในหลายเบนช์มาร์กแบบเอเจนต์อย่าง MCP Atlas (83.6%) และ Finance Agent v2 (57.9%) ขณะที่ GPT-5.5 เด่นกว่าใน SWE-Bench Pro และ ARC-AGI-2 ส่วน Claude Opus 4.7 ยังแข็งแกร่งที่สุดบน Humanity's Last Exam (46.9%) สรุปคือมันแข่งขันได้กับโมเดลแถวหน้า พร้อมรันเร็วกว่าและถูกกว่ามากเมื่อสเกลขึ้น ตามชื่อที่สื่ออยู่แล้ว รุ่น Pro ที่ทรงพลังยิ่งกว่าคาดว่าจะปล่อยในเร็ว ๆ นี้

Google Antigravity ต่างจาก Claude Code หรือ Codex อย่างไร?

Google Antigravity 2.0 คือแพลตฟอร์มพัฒนาแบบเอเจนต์ก่อน ที่ให้จัดออร์เคสเทรตเอเจนต์ AI หลายตัวแบบขนาน ผ่านแอปเดสก์ท็อป CLI SDK และ API ระดับองค์กร แตกต่างจาก Claude Code (เอเจนต์เขียนโค้ดแบบเทอร์มินัล) หรือ Codex (ระบบคิวงาน) ตรงที่ Antigravity ให้การจำกัดสิทธิ์ตามโปรเจกต์ที่แน่นกว่า การสร้างซับเอเจนต์ และการผสานโดยตรงกับ Google Cloud และ Firebase บทบาทคู่ทั้งในฐานะเครื่องมือนักพัฒนาและแพลตฟอร์ม SDK ทำให้มันใกล้เคียงเฟรมเวิร์กออร์เคสเตรชันมากกว่าผู้ช่วยเขียนโค้ดเดี่ยว ๆ

แผน Google AI Ultra ราคา $100/เดือน คุ้มกว่า ChatGPT Pro หรือ Claude Max หรือไม่?

ทั้งสามแพลนมีราคา $100/เดือน แต่ความคุ้มค่าขึ้นกับระบบนิเวศที่ใช้งาน ตัวแตกต่างของ Google AI Ultra คือการเข้าถึง Gemini Spark (เอเจนต์คงอยู่ 24/7) โควตาใช้งาน Antigravity สูงกว่า 5 เท่า และการผสานลึกกับ Google Workspace หากเวิร์กโฟลว์ของคุณอยู่ใน Gmail, Docs และ Calendar อยู่แล้ว Ultra ได้เปรียบชัดเจน แต่ถ้าต้องการตัวช่วยโค้ดดิ้งหรือความยืดหยุ่นระดับ API เป็นหลัก ChatGPT Pro หรือ Claude Max อาจตอบโจทย์กว่า

Gemini Omni คืออะไร และจัดการการสร้างวิดีโออย่างไร?

Gemini Omni คือโมเดลมัลติโหมดโดยกำเนิดของ Google ที่รับอินพุตได้ทั้งข้อความ รูปภาพ เสียง และวิดีโอ และสร้างเอาต์พุตเป็นวิดีโอ โดยรวมระบบที่เคยแยกกัน (Veo สำหรับวิดีโอ, Imagen สำหรับภาพ) เข้าด้วยกันเป็นโมเดลเดียว ซึ่งควรช่วยให้การแก้ไขข้ามโมดมีความสอดคล้องมากขึ้น รุ่นแรก Omni Flash พร้อมใช้งานแล้ว และคาดว่า Omni Pro ที่ทรงพลังยิ่งกว่าจะตามมาเร็ว ๆ นี้ ขณะนี้ยังไม่มีเบนช์มาร์กอิสระเผยแพร่ คุณภาพการใช้งานจริงจึงยังอยู่ระหว่างประเมิน

หัวข้อ

เรียนรู้เกี่ยวกับระบบนิเวศ AI ของ Google!

Tracks

Google Workspace กับ Gemini

4 ชม.
คุณจะได้เรียนรู้เกี่ยวกับฟีเจอร์สำคัญของ Gemini และวิธีนำไปใช้เพื่อเพิ่มประสิทธิภาพและความคล่องตัวในการทำงานใน Google Workspace
ดูรายละเอียดRight Arrow
เริ่มหลักสูตร
ดูเพิ่มเติมRight Arrow