Google DeepMind團隊於2024年再次引領科技潮流,發表了具有革命性的AI模型——Genie,能夠透過文字及圖片直接生成2D遊戲,標誌著2D遊戲開發進入全新時代。
Genie模型概述
Genie,一款擁有110億參數的強大AI模型,能夠基於用戶提供的圖片和文字提示,生成具有高度交互性的2D平台遊戲。這一技術的推出,為AI領域帶來了前所未有的突破。
Genie的核心組件
Genie由三大核心組件組成:潜在動作模型、視頻tokenizer以及動態模型。這三者的緊密協作,賦予了Genie生成虛擬世界的能力,不僅能夠預測下一帧畫面,還能根據玩家操作生成相應的遊戲畫面。
訓練與應用
Genie通過分析網絡上超過20萬小時的2D遊戲視頻進行訓練,目前尚處於研究預覽階段。除了遊戲生成,Genie還能應用於設計和創作領域,為創作者提供無限的想象空間。
尚對公眾開放
雖然Genie目前未向公眾開放,但其未來應用前景令人期待。Google DeepMind團隊表示,Genie不僅能夠創造遊戲,還能教授其他AI模型或超級助理關於3D世界的知識,甚至有望幫助實體機器人更好地理解並與環境互動。
對AI發展的意義
Genie的推出,不僅為遊戲開發領域帶來了新的可能性,也為實現通用人工智慧(AGI)邁出了堅實的一步。通過無人監督的學習方式,Genie展示了AI對現實世界物理規律的深入理解,為AI技術的進一步發展奠定了基礎。
資料來源: Google Deepmind- Genie