Project89: Thiết kế khung AI Agent hiệu suất cao, có thể mở rộng

robot
Đang tạo bản tóm tắt

Phân tích Project89: Thiết kế khung AI Agent thế hệ tiếp theo, mô-đun hóa, hiệu suất cao

Project89 đã áp dụng một cách hoàn toàn mới để thiết kế Khung Agent, đây là một Khung Agent hiệu suất cao dành cho phát triển trò chơi, có tính mô-đun tốt hơn và hiệu suất tốt hơn so với Khung Agent hiện tại.

Bài viết này sẽ đi sâu vào việc giới thiệu những nâng cấp của khung này so với khung Agent truyền thống về mặt kiến trúc.

Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

Nền tảng nhà phát triển

Người sáng lập Project89 trước đó đã tham gia phát triển dự án Magick, một phần mềm sử dụng AI để lập trình. Anh ấy là nhà phát triển xếp thứ tư trong dự án này.

Tại sao nên sử dụng ECS để thiết kế Khung tác nhân

ECS(Entity-Component-System) là một mô hình kiến trúc thường được sử dụng trong phát triển trò chơi và hệ thống mô phỏng. Nó tách biệt hoàn toàn dữ liệu và logic, nhằm quản lý hiệu quả các thực thể và hành vi của chúng trong các cảnh quy mô lớn có thể mở rộng.

Kiến trúc ECS bao gồm ba khái niệm cốt lõi:

  1. Entity( thực thể): chỉ là một ID, không chứa bất kỳ dữ liệu hoặc logic nào.

  2. Component( thành phần ): dùng để lưu trữ dữ liệu hoặc trạng thái cụ thể của thực thể.

  3. Hệ thống(系统): Chịu trách nhiệm thực hiện các logic liên quan đến một số thành phần.

Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo có tính mô-đun và hiệu suất cao

Trong ArgOS, mỗi Agent được coi là một Entity, có thể đăng ký các thành phần khác nhau, như:

  • Thành phần đại lý: Lưu trữ thông tin cơ bản của đại lý
  • Thành phần Cảm nhận: Lưu trữ dữ liệu bên ngoài được cảm nhận
  • Thành phần bộ nhớ: Lưu trữ dữ liệu trí nhớ của Agent
  • Thành phần Hành động: Lưu trữ dữ liệu Hành động cần thực hiện

Các hệ thống hoạt động độc lập, không có mối quan hệ gọi giữa các hệ thống khác nhau. Mỗi hệ thống sẽ thực hiện một lần trong một chu kỳ quy định, ví dụ:

  • Hệ thống nhận thức có thể thực hiện mỗi 2 giây một lần
  • Hệ thống bộ nhớ có thể thực hiện mỗi giây một lần
  • Hệ thống Plan có thể thực hiện hàng ngàn lần.
  • Hệ thống hành động có thể thực hiện mỗi 2 giây

Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

Kiến trúc Hệ thống ArgOS

ArgOS chia System thành ba cấp độ:

  1. Có ý thức(HỆ THỐNG)

    • Bao gồm RoomSystem, PerceptionSystem, v.v.
    • Tần suất cập nhật cao ( như mỗi 10 giây )
    • Xử lý cảm nhận thời gian thực, suy nghĩ, thực hiện hành động khác
  2. Tiềm thức(HỆ THỐNG TIỀM THỨC)

    • Bao gồm GoalPlanningSystem, PlanningSystem
    • Tần suất cập nhật thấp ( như mỗi 25 giây )
    • Xử lý mục tiêu, tạo ra và lập kế hoạch v.v.
  3. Vô thức(UNCONSCIOUS)hệ thống

    • Hiện tại chưa được kích hoạt
    • Tần suất cập nhật chậm hơn (50 giây trở lên )

Mối quan hệ giữa các hệ thống rất phức tạp, nhưng đã được thực hiện độc lập thông qua thiết kế theo lớp.

Giải cấu trúc Project89: Thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

Phân tích cấu trúc tổng thể của ArgOS

Kiến trúc cốt lõi của ArgOS được chia thành các lớp sau:

  1. Thành phần: bao gồm Agent, Action, Goal, v.v.
  2. Hệ thống: bao gồm PerceptionSystem, ThinkingSystem, v.v.
  3. Quản lý: bao gồm RoomManager, StateManager, v.v.
  4. Thời gian chạy: Chịu trách nhiệm lập lịch cho System và Manager

Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

Các thành phần (Component) có thể được chia thành các loại sau:

  1. Danh tính cốt lõi: như Agent, PlayerProfile, v.v.
  2. Hành vi và trạng thái: như Hành động, Mục tiêu, Kế hoạch, v.v.
  3. Cảm nhận và trí nhớ: như Perception, Memory, v.v.
  4. Các loại môi trường và không gian: như Room, Environment, v.v.
  5. Ngoại hình và tương tác: chẳng hạn như Appearance, Relationship, v.v.
  6. Hỗ trợ hoặc bảo trì: như Cleanup, DebugInfo, v.v.

Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

Lớp Manager chịu trách nhiệm quản lý tài nguyên, chẳng hạn như truy cập cơ sở dữ liệu, xử lý xung đột trạng thái, v.v.

Việc tương tác với cơ sở dữ liệu thường được StateManager xử lý, các hệ thống thực hiện thao tác thông qua nó, tránh việc viết SQL trực tiếp.

Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

Điểm đổi mới trong kiến trúc

  1. Các hệ thống hoạt động độc lập, không có mối quan hệ gọi lẫn nhau, đã实现 được việc tách biệt chức năng.
  2. Dễ dàng mở rộng và cắt gọn chức năng
  3. Hiệu suất vượt trội so với kiến trúc hướng đối tượng truyền thống, phù hợp hơn với xử lý đồng thời.
  4. Thiết kế phân tầng hệ thống ( có ý thức, tiềm thức, vô thức ) sắp xếp hợp lý chu kỳ thực hiện

Nói chung, đây là một khung làm việc cực kỳ mô-đun và hiệu suất cao, cung cấp các lựa chọn kiến trúc mới cho việc phát triển Agent.

Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

Giải cấu trúc Project89: một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

AGENT5.71%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 7
  • Đăng lại
  • Chia sẻ
Bình luận
0/400
MEVHunterNoLossvip
· 07-22 17:41
Khả năng này có thể chạy được bao nhiêu tps?
Xem bản gốcTrả lời0
quiet_lurkervip
· 07-20 03:23
Mình đã chơi ecs này từ lâu rồi.
Xem bản gốcTrả lời0
SchrodingerWalletvip
· 07-19 19:21
Đây chẳng phải là một loại AI cao cấp hơn sao?
Xem bản gốcTrả lời0
DisillusiionOraclevip
· 07-19 18:58
Nếu có sức mạnh, thì không bằng tạo ra một AI tổng quát trước.
Xem bản gốcTrả lời0
MetaMaskVictimvip
· 07-19 18:58
Làm phức tạp như vậy không bằng chatgpt.
Xem bản gốcTrả lời0
HashRatePhilosophervip
· 07-19 18:57
Lại vẽ bánh nữa rồi
Xem bản gốcTrả lời0
Anon4461vip
· 07-19 18:47
Không có sức lực, chỉ tin vào arxiv.
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)