[AI] Cuộc đua công nghệ tạo ra trợ lý hoàn hảo

Vào ngày 18/5 vừa qua tại trụ sở chính của Google - Mountain View, một người đàn ông xuất hiện từ trong chiếc cốc cà phê khổng lồ với trang phục chiếc áo khoác 7 sắc cầu vồng khá sặc sỡ. Đây cũng là cách họ giới thiệu đến cho công chúng thành tựu mới nhất của công ty trong lĩnh vực AI. Nhạc sĩ và Youtuber - Marc Rebiilet đã giới thiệu công cụ tạo AI MusicFX của Google tại sự kiện I/O của công ty công nghệ trong tuần vừa qua.

Trong khoảng thời gian đầu, Rebillet mô tả cách thức hoạt động của công cụ MusicFX DJ tự tạo ra những đoạn nhạc bằng những câu lệnh như: tên nhạc cụ hay tên của những bộ synth cực kì quen thuộc đối với dân làm nhạc. Được biết Rebillet đã nghiên cứu một công cụ âm nhạc AI có thể tạo các bản nhạc được đồng bộ hóa dựa trên các lời nhắc như "Viola" và "8o8 hip-hop beat", một "BOT" được cá nhân hóa nhằm giúp bạn làm việc, sáng tạo hoặc giao tiếp tốt hơn và sử dụng công cụ một cách hiệu quả nhất.

Trong khi đó, tại buổi ra mắt sản phẩm của OpenAI vào thứ Hai, giám đốc công nghệ - Mira Murati và các đồng nghiệp của cô đã cho trình diễn các mô hình AI mới của họ - GPT4o, nó có thể thực hiện được các câu lệnh trực tiếp thời gian thực trong một cuộc trò chuyện và tương tác với người dùng bằng cách sử dụng giọng điệu và giọng nói được nhân cách hóa để phân tích văn phản, hình ảnh, video và mã.Murati đã nói rằng : "Điều này cực kỳ quan trọng vì chúng tôi đang hướng tới tương lai của sự tương tác giữa con người và máy móc."

Các trợ lý ảo thông minh đã được thử nghiệm trong gần một thập kỷ vừa qua, những tiến bộ mới nhất này cho phép  tương tác bằng giọng nói mượt mà và nhanh hơn rất nhiều. Việc này chứng tỏ rằng loại mô hình ngôn ngữ cực kì lớn (LLM) đã hỗ trợ rất nhiều tới các mô hình AI chính vì thế mà mới xảy ra cuộc cạnh tranh khốc liệt giữa các nhà công nghệ nhằm phát triển thế giới và giới thiệu công nghệ AI tới với người tiêu dùng.

Chỉ trong vòng hai ngày, cả Google lẫn OpenAI đều giới thiệu hàng loạt những công cụ AI được nâng cấp, với “đa tính năng”, nhận diện được gần như mọi dạng dữ liệu đầu vào, từ văn bản, code lập trình, giọng nói, hình ảnh cho tới cả video clip. Rồi chúng còn có cả khả năng ghi nhớ để lên kế hoạch phục vụ con người, cũng như thực hiện những tác vụ phức tạp như dịch thuật theo thời gian thực.

Dưới đây là đoạn clip trình diễn của trợ lý ảo AI Astra đang thử nghiệm của Google được vận hành trên công cụ AI Gemini

Chúng ta có thể thấy công cụ này phản hồi khá nhanh chóng với những lệnh bằng giọng nói của người dùng, dựa trên những hình ảnh mà thiết bị cung cấp như kính thông minh hoặc camera điện thoại. Nó xác định được các dòng code lập trình, nhận ra khu vực King's Cross ở London qua ống kính camera, rồi nhắc người dùng vị trí họ bỏ quên cặp kính thông minh.

Giám đốc điều hành của Google - Sundar Pichai cho biết đây là "những hệ thống thông minh", "với khả năng lý luận, lên kế hoặc và có trí nhớ, có khả năng xử lý logic, vận hành xuyên suốt các phần mềm và hệ thống, để làm thay công việc cho con người".

 SP-SocialShare-Update.width-1300.jpg

Cũng như Google và OpenAI, Apple được kỳ vọng sẽ là người chơi chính trong cuộc đua này. Những người trong ngành dự đoán rằng một đợt nâng cấp đáng kể cho trợ lý giọng nói Siri của Apple sắp diễn ra khi mà công ty đang tung ra thị trường các loại ChipAI mới, được thiết kế nội bộ và có khả năng cung cấp năng lượng cho các mô hình sáng tạo trên thiết bị.

Còn về phần của Meta, họ đã ra mắt trợ lý AI trên các nền tảng như Facebook, Instagram và WhatsApp của mình trên rất nhiều các quốc gia vào tháng tư. Những startup như Rabbit và Humane cũng đang rất cố gắng thâm nhập vào lĩnh vực này bằng cách thiết kế các sản phẩm hoạt động như những người trợ giúp AI độc lập.

Theo Mustafa Suleyman - Giám đốc điều hành của Microsoft AI đã từng sáng lập DeepMind: "Không còn nghi ngờ gì nữa, đây là thời điểm cho trí tuệ nhân tạo phục vụ cho cá nhân. Silicon Valley luôn luôn nói công nghệ là một công cụ giúp làm mọi việc hiểu quả và nhanh hơn. Nhưng cũng tháy ấn tượng, những công cụ ấy giờ đang nằm trong tay những nhà sản xuất sản phẩm thương mại. Công nghệ đã trưởng thành đủ để trở thành nền tảng phát minh ra những thứ mới, và giờ là lúc chúng ta được nhìn thấy sản phẩm."

Trong gần một thập kỷ qua, chúng ta có thể thấy các ông lớn về công nghệ đã cạnh tranh với nhau để đưa AI đến với người tiêu dùng thông qua các trợ lý ảo như Siri của Apple, Cortana của Microsoft và Alexa của Amazon hiện đang được tích hợp rất nhiều trên các loại thiết bị khác nhau.

Vào năm 2016 với việc Pichai đã vẽ ra bức tranh về một thế giới hậu điện thoại thông minh, nơi trí thông minh được nhúng vào mọi thứ, từ loa đến kính Google đã tiết lộ cho công chúng được biết về công nghệ AI. Và chỉ sau 8 năm trôi qua, điện thoại thông minh vẫn là phương tiện truyền thông truy cập web chủ yếu của người tiêu dùng, việc công nghệ AI thời điểm đó vẫn chưa được người dùng quan tâm nhiều là vì độ trễ phản hồi và lượng tương tác, thông tin mà AI có được chưa kể đến các lỗi nhận diện giọng nói của người dùng, dẫn tới việc xử lý sai hoặc không xử lý được lệnh con người đưa ra.

Google Assistant: No More Support for Third-Party List Apps | Bring! Blog

Năm 2017, sự xuất hiện của công nghệ cốt lõi của các chatbot như ChatGPT, Gemini và Claude, được gọi là máy biến áp, đã cải tiến đáng kinh ngạc nhưng như thế vẫn là chưa đủ với người dùng. Theo nhà phân tích công nghệ Ben Thompson, người viết bản tin có ảnh hưởng lớn trong ngành Stratechery:

"Khi bạn vượt qua ngưỡng tốc độ và độ trễ, đó là lúc điều đó thật thú vị. Niềm vui và sự vui vẻ khi bạn nhận được phản hồi ngay lập tức khác hẳn so với việc ngồi chờ đợi. Thì nó giống như một trò lừa trong tiệm," 

Thompson chỉ ra một cải tiến của Google và chế độ tìm kiếm trực tuyến có sự trợ giúp của AI, gọi là Search Generative Experience, đưa ra những thông tin AI tạo sinh bên cạnh danh sách đường link tổng hợp từ câu lệnh tìm kiếm truyền thống: " tốc độ càng lúc càng nhanh và chất lượng ổn định, nên tôi đang sử dụng tính năng này nhiều hơn, dùng ChatGPT ít hơn. Google hiểu rõ điều này hơn ai hết, rằng ngay cả vài mili giây nhanh hơn hay chậm hơn cũng tạo ra khác biệt trong cách người dùng ở lại với một dịch vụ."

Một phiên bản mới của mẫu ChatGPT4o có thể dịch trôi chảy qua giữa tiếng Ý và tiếng Anh trong cuộc trò chuyện theo thời gian thực. Thompson cũng cho rằng, cải tiến lớn nhất với OpenAI là trải nghiệm người dùng và sản phẩm ChatGPT. Những gì được trình diễn là thứ cần để thu hút người tiêu dùng, thay vì chỉ thu hút những doanh nghiệp.

Việc giá cổ phiếu của công ty Apple đã giảm khá nhiều trong năm nay so với Alphabet và Amazon đã khiến Apple phải nhanh chóng tìm kiếm các bước phát triển mới trong ngành công nghiệp AI. Các nhà đầu tư đương nhiên đang háo hức chờ đợi xem tại WWDC 2024 Apple sẽ đem tới sự kiện này những sản phẩm nâng cấp AI nào cho các hệ điều hành và các thiết bị công nghệ mà họ đã bán ra thị trường. Sự chậm chân này chính là lý do khiến cho giá cổ phiếu của Apple giảm so với đà tăng trưởng của Microsoft lẫn Alphabet.

Trong tuần này, OpenAI thông báo họ đã ký thỏa thuận với Apple để tạo ra một ứng dụng máy tính để bàn cho máy MacOS có ứng dụng ChatGPT riêng. Cùng lúc , những thông tin không chính thức cũng nói rằng Apple đang tìm cách ứng dụng cho những mô hình GPT mà OpenAI phát triển hoặc Gemini do Google quản lý cho những chiếc iphone. Đồng thời Apple cũng đang thuê các chuyên gia và đưa ra các tài liệu nghiên cứu cung cấp cái nhìn sâu sắc về công việc việc đằng sau hật trường xây dựng các mô hình AI.

Bàn tay của một người đang cầm chiếc điện thoại thông minh có ChatGPT GPT-4o trên màn hình

Lợi thế của Apple là họ đang có số lượng người dùng sản phẩm thương mại của mình rất lớn, với hơn 2,2 tỷ thiết bị đang hoạt động trên khắp thế giới, việc này giúp Apple có thể định hướng quá trình mọi người tích hợp các công cụ tổng hợp như trợ lý ảo vào cuộc sống hàng ngày của người tiêu dùng.

Nhà phân tích Dan Ives của Wedbush đã dự đoán Apple có thể sẽ xây dựng "công nghệ Siri cấp độ tiếp theo với sự hợp tác của OpenAI. Siri giờ đây sẽ trở thành một trợ lý ảo đủ khả năng xử lý những tác vụ cực kỳ phức tạp trên iphone, sau đó có thể biến thành một dịch vụ thu phí hàng tháng để trang trải cho chi phí vận hàng datacenter của Apple, việc này cũng giống với những gì mà họ đang làm với iClound, Apple TV+ hay Apple Music.

Theo SensorTower, vào thứ 2 tuần trước sau khi OpenAI công bố GPT 4o, các nhà phân tích thị trường của Bank of America đã nhắc lại xếp hạng cổ phiếu của Apple, nói rằng công bố của OpenAI có tiềm năng ứng dụng cho trợ lý ảo và những tính năng AI phục vụ cho các nhà phát triển ứng dụng trên app Store. Hệ sinh thái ứng dụng này đang đem về cho Apple một lượng tiền khá ổn: 6-7 tỷ USD mỗi năm.

Bất chấp việc các công ty AI đang nỗ lực tạo ra các robot tiêu dùng có thể hỗ trợ các công việc hàng ngày, có thể phải mất thời gian nữa chúng mới trở thành hiện thực hàng ngày. Việc tạo nội dung do AI tạo ra vẫn còn đang ở giai đoạn sơ khai và đôi khi dễ mắc lỗi và "ao giác" hoặc bịa đặt thông tin sai lệch. Điều này có thể trở thành một vấn đề lớn nếu trợ lý đang hoàn thành các nhiệm vụ liên quan đến công việc mà độ chính xác, thay vì tính sáng tạo là rất quan trọng. 

Câu lệnh 'Hey Siri' sắp biến mất

Giám đốc điều hành của Google DeepMind - Demis Hassabis khi trả lời phỏng vấn với các phóng viên có nói rằng: "Chúng tôi luôn muốn xây dựng một tác nhân phổ quát hữu ích trong cuộc sống hàng ngày. Công việc của chúng tôi là biến tầm nhìn này thành hiện thực đã có từ rất nhiều năm. Đó là lý do tại sao chúng tôi tạo ra [chatbot] Gemini đa phương thức ngay từ đầu."

Theo Mustafa Suleyman, thử thách kế tiếp là mở rộng vận hành trợ lý AI cho hàng tỷ thiết bị trên toàn thế giới:" Đó sẽ là một ngành cạnh tranh vô cùng khốc liệt, khi mọi người quan tâm tới cả thương hiệu lẫn khả năng vận hành. Apple và Google, vì thế sẽ có lợi thế rất lớn."

Nhưng Bret Taylor, chủ tịch hội đồng quản trị của OpenAI, đồng thời là giám đốc điều hành của một công ty khởi nghiệp về đại lý AI mới Sierra, cho biết việc thay thế các giao diện người tiêu dùng hiện tại đã mang lại cơ hội cho nhiều công ty. Ông nói:" Trong những thay đổi lớn về công nghệ, các công ty khởi nghiệp có thể nối bật và thành công vì hiện tại không nhất thiết phải có công ty dẫn đầu thị trường."

Nhà khoa học AI trưởng của Meta - Yann Lecun nói rằng họ sẽ cần mở rộng mô hình của mình để quy mô trợ lý được đem ra bên ngoài từng quốc gia riêng lẻ ở phương tây.

Tại một sự kiện Meta ở London vào tháng trước ông có nói rằng :"Trong tương lai mới, mọi tương tác với thế giới kỹ thuật số sẽ thông qua một loại trợ lý aI nào đó. Chúng tôi sẽ nói chuyện với những trợ lý AI này mọi lúc. Toàn bộ chế độ ăn uống kỹ thuật số của chúng ta sẽ được điều khiển bởi hệ thống AI"

Theo FT

Bài viết liên quan

Bài viết mới nhất

Sản Phẩm Khuyến Mãi

Trở về đầu trang

Thêm sản phẩm vào giỏ hàng thành công!