从 OpenAI 首笔收购说起,AGI 应用的第一性原理
隐私
元宇宙
游戏
什么样的 AI 应用能命中未来?
撰文:宋嘉吉、孙爽
摘要
市场认为,AI 应用「乱花渐欲迷人眼」,难以判断什么样的应用才能命中未来用户的需求。在本篇报告中,我们谨以 AI 领头羊 OpenAI 首笔收购涉及的游戏为例,阐述我们眼中 AGI 应用创新的第一性原理。
OpenAI 官宣首笔收购——Global Illumination(GI)。近日 OpenAI 宣布已经收购美国初创企业 GI。GI 开发了沙盒大型多人在线角色扮演游戏 Biomes,它也被称为开源版《我的世界》(MC),有如下特性:
1)体素建模:降本增效。体素建模以牺牲视觉效果为代价,换取了操作门槛低、模型易修改、游戏世界真实性强的特点。破圈级体素游戏 MC 基于该技术带来的高度自由性吸引无数玩家追捧,2016 年 6 月微软公开 MC 月活用户量就达 4000 万,远高于《魔兽世界》的高峰月活量 1200 万。
2)开源: 低成本丰富游戏内容。《人生重开模拟器》原始版本存在上百漏洞,后在社区共同编译下以零成本完成了游戏的更新迭代,百度指数超过同期手游《哈利波特:魔法觉醒》。类似的,Biomes 上架 GitHub 后可玩性进一步增强,玩家可在社区中免费下载其他玩家制作的丰富模组。
3)UGC:助力应用快速推开。根据 Octoly 于 2016 年 8 月发布的数据,与 MC 相关的视频在 Youtube 上的累积播放量达到 353 亿次,其中来自 MC 官方的视频只占 1%。明星玩家依托互联网平台发布视频吸引粉丝,也反过来提升了游戏的黏着度。Biomes 官方注重游戏社区的运营,在推特上积极营业,转发用户体验和游戏的最新动态。
什么是第一性原理?第一性原理的思维方式首先强调质疑,其次强调实验。马斯克跳出传统的基于规则和搜索系统,让车去思考,推出全球第一个端到端 AI 系统 FSD V12;航天业中 Space X 创造性地采用批量制造工业品的做法,采用可回收技术将单次星舰发射成本压缩至 200 万美元,重型火箭发射报价低于 1 亿美元,颠覆了航天发射市场的价格底线。
手机游戏的第一性原理:从按键游戏到触屏游戏。功能机时代的主流游戏为贪吃蛇、俄罗斯方块、扫雷等,游戏体验高度统一。随着智能机时代的到来,玩家的人脑意识可以直接转为手指滑动动作,通过触屏、滑动手指操作的三消、跑酷、卡牌类游戏引领风潮,对游戏体验的提升效果显著。
AI 智能体,AGI 的开始。OpenAl 联创 Andrej Karpathy 曾表示 AI 智能体是未来 Al 的前沿方向,大家普遍认为 AIGC 的诞生是为了降本,而我们认为,随着我们越来越接近 AGI,AI 将不再局限于「copilot」助手,而成为构建未来人类社会的基础框架。我们认为 AI 的第一性原理正是以 AI 为本。我们看好斯坦福小镇等由「AI 生成内容」和「拥有自然语言界面」的游戏应用,看好小镇居民等具有类人类意识的 AI 智能体,它们将让人类体验到更新奇的内容世界,或许未来是用户加入 AI 自驱动的赛博空间。
投资建议:
1)算力:看好光通信及边缘算力,看好新易盛、中际旭创、天孚通信、太辰光、德科立、锐捷网络、寒武纪、美格智能、紫光股份、中兴通讯、恒为、中贝通信等;
2)模型层:关注国内外大模型的边际变化,建议关注科大讯飞、昆仑万维、百度;
3)应用层:看好游戏的迭代创新,看好恺英网络、神州泰岳、盛天网络、紫天科技等;
4)数据层:看好中国移动、中国电信、中国联通以及浩瀚深度、新华网、人民网等。
风险提示:伦理风险、技术发展不及预期、政策法律监管风险。
1 OpenAI 官宣首笔收购——Global Illumination
1.1 AIGC 是什么?
8 月 16 日,OpenAI 在官网发布了第一次公开收购声明,宣布已经收购美国初创企业 Global Illumination,并将后者整个团队纳入麾下。
Global Illumination 是一家致力于用人工智能构建创意工具、基础设施和数字体验的公司,该公司曾为 Instagram、Facebook、YouTube、Google、Pixar、Riot Games 等知名公司提供服务,并开发了沙盒大型多人在线角色扮演游戏(MMORPG)Biomes。
国盛区块链研究院在 2021 年 8 月就发布过深度报告《元宇宙是「方块」搭成的?》,在其中专门讨论了体素建模类游戏的优势和前景,之后 Roblox 同样以体素风格开启 UGC 游戏时代,如今 OpenAI 的首次收购又聚焦于此,我们认为并非偶然。由此,我们和产业界朋友进行了头脑风暴,由此形成本文的独特视角——AGI 应用的第一性原理。从今年年初开始火爆全球的 AI,是与过去不同的,确切地应该称之为 AGI 或 AIGC,其惊艳之处还是在于内容生成,这将是我们思考的起点。
2 Global Illumination 的产品是什么?——「开源版《我的世界》」
2.1 要素一:体素游戏
2.1.1 什么是体素游戏
Voxel(Volume-Pixe)即体积像素,是一种把电脑中二维空间的最小单位「像素」3D 化的概念。像素的最小单位可以看作是一个个小正方型,体素的最小单位也可以看作是一个个小正方体。用这种构成方式制作的模型就是体素模型,做成的游戏就是体素游戏
2.1.2 体素游戏的优势是什么?
目前市面上的主流三维游戏以三维建模为主,即模型是由三维三角形网格构建,如大受欢迎的「王者荣耀」和「GTA 5」,以此为用户提供精美、逼真的视觉体验。但精美如「GTA 5」仍然无法逃离穿模的命运,这是因为三维建模技术实际上只搭建了一个逼真的中空模型,从而在造成视觉上的假象。另外,该技术建造的模型是一个无法分割的整体,已完成的模型无法模仿真实宇宙法则随着时间推移进行细微的改变。
体素建模极大降低成本的同时提高了真实度。在当前追求画面逼真度的主流趋势下,体素游戏牺牲视觉效果,坚持用方块来构建游戏世界。相较于传统建模,体素建模具有操作门槛低、模型易修改的特点,且不同于三维建模仅是在视觉上做出三维立体的感受,体素建模所搭建的世界是真实三维立体的。方块堆叠的搭建方式和真实世界中一砖一瓦搭建类似,这使得用户可以在游戏世界中真实「搬砖」创造物体。
破圈级体素游戏《我的世界》。以最著名的体素游戏 Minecraft(我的世界,简称 MC)为例,玩家通过收集不同材质的方块,例如木头、矿石等,进行各种创造,小到斧头、桌子、栅栏,大到房屋、农场等。MC 高度的自由性吸引了无数玩家的追捧,2016 年 6 月,微软公开 MC 月活用户量达 4000 万,而占据 MMORPG 市场半壁江山的《魔兽世界》的高峰月活量也仅为 1200 万。
2.2 要素二:开源、UGC
2.2.1 开源:低成本丰富游戏内容
「三无」游戏热度超越热门 IP 手游。2021 年 9 月 3 日开源游戏《人生重开模拟器》在百度贴吧发布,在无预热、无广告、无营销的情况下,其百度搜索指数仍然一度超过同期著名 IP 改编的游戏《哈利波特:魔法觉醒》。
社区力量推动游戏版本更新。《人生重开模拟器》玩法简单,玩家只需要在游戏开局前完成智力、颜值等属性的分配,并选择人生加成条件,在几十秒乃至几秒内完成一次模拟人生的轻量化体验。该游戏的策划和开发仅由两个人完成,原始版本存在许多漏洞,登录 GitHub 后在网友的测试和编译下,以零成本完成了游戏的更新迭代。
社区自产免费模组丰富游戏内容。Biomes 被称为开源版 MC,玩家可以直接在浏览器中进行建造、觅食等活动,自由探索一个由不同生物群系组成的世界。游戏上架 GitHub 后可玩性进一步增强,玩家可在社区中免费下载其他玩家制作的地下生态、深海生态等模组。
2.2.2 UGC:助力应用快速推开
User Generated Content(UGC,用户生成内容)概念最早起源于互联网领域,即用户将自己原创的内容通过互联网平台进行展示或者提供给其他用户。UGC 是一种用户使用互联网的新方式,即由原来的以下载为主变成下载和上传并重。
随着互联网快速发展,分享平台迅速增加。其中好友社交形平台有 Facebook、QQ 动态、微信朋友圈;视频分享形平台有 YouTube、优酷、哔哩哔哩、抖音等;照片分享网络有 Flickr、又拍网;社区论坛形平台有百度贴吧、天涯社区、知乎等,另外还有流行度更广、及时性更强的平台如微博、Twitter 等。
Youtube 在 MC 崛起的过程中功不可没。根据在线视频研究机构 Octoly 于 2016 年 8 月发布的数据,与 MC 相关的视频在 Youtube 上的累积播放量达到 353 亿次,在同类视频中居首,其中来自 MC 官方的视频只占 1%。
明星玩家依托互联网平台发布视频吸引粉丝,也反过来提升了游戏的黏着度。Biomes 官方同样注重游戏社区的运营,在推特上积极营业,转发用户体验和游戏的最新动态。
3 关于 AI 应用的第一性原理的思考
3.1 为什么是「第一性原理」?
第一性原理由特斯拉创始人马斯克推广开来。他表示,「当你想要做一些新的东西时,必须要运用第一性原理来思考」。第一性原理的思维方式首先强调质疑,不能墨守成规,其次强调实验,用实践去验证。
3.1.1 特斯拉无人驾驶中的「第一性原理」
全球第一个端到端 AI 系统在直播中亮相。2023 年 8 月,马斯克在网上直播了特斯拉 FSD V12 版本的路测情况。在直播中,马斯克驾驶着一辆老款 Model S,全程开启 FSD 模式,成功通过了环岛、施工路段等复杂路况。虽然途中发生一次闯红灯失误,但并不影响 FSD V12 版本划时代的地位:它是全球第一个端到端的 AI 自动驾驶系统。
第一性思维:跳出规则,让车去思考。传统的车辆自动驾驶通过传感器获取周围环境和障碍物的信息,然后根据工程师预设的行驶规则来控制车辆,存在规则不完善、规则优先级不明确的问题。FSD V12 跳出代码规则的框架,设计机制与人类视觉的工作机制相同——眼睛和大脑,即完全依靠车载摄像头和神经网络来识别道路和交通情况。
3.1.2 SpaceX 火箭中的「第一性原理」
可回收技术颠覆航天发射市场的价格底线。在 SpaceX 入局前,美国联合发射联盟事实性垄断了美国的政府、军用载荷航天发射,一次发射报价 1.5 亿美元起步。随着特斯拉公司创始人马斯克提出可重复使用火箭的概念并成功实现,猎鹰重型火箭报价低于 1 亿美元,美国乃至于全球的航天发射市场发生翻天覆地的变化。
第一性思维:用造工业品的思维来做航天。在此之前,航天业界从没想过以可回收为目标制造和发射火箭。以总装环节为例,业界普遍认为只有在高等级净化车间才能生产出合格的产品,而关于 Space X 的公开视频显示,猎鹰火箭的总装车内各种设备、工具、用料杂乱摆放,显然并非净化车间。正是在火箭发射中站在第一性原理思考,即在航天业中采用批量制造工业品的做法,从而将单次火箭发射成本压缩至 200 万美元。
3.2 手机游戏中的第一性原理:以按键和触屏游戏为例
3.2.1 功能机时代:按键类线性游戏
贪吃蛇、俄罗斯方块、扫雷等是功能机时代的主流游戏,玩家通过按键点击,实现对游戏进程的把控。这类属于基础线性游戏,其游戏情节设置单一、体验固定,玩家需要按照设定好的路线和步骤来推进游戏而不能自由选择不同路径,这导致游戏体验是高度统一的,所以玩家游戏动力相对较弱,玩法单一。
3.2.2 智能机时代:触屏类线性游戏
随着智能机时代的到来,通过触屏、滑动手指操作的三消、跑酷、卡牌类游戏引领风潮。这是由于通过滑动手指操控游戏进程,可缩短玩家经过游戏意识判断操控动作、进而再转为按键点击进行动作操控的流程。智能机触屏的普及,玩家人脑意识可以直接转为手指滑动动作,对游戏体验的提升效果显著。但由于这类游戏仍然属于固定情节,因此导致玩家的游戏体验仍属于高度受控的。
3.3 利用 AI 应用的第一性原理,提升人机交互体验
3.3.1 用 AI 生成内容,形成高度拟人化 AI 智能体
旅行青蛙游戏情节丰富,以高度拟人化体验增提高游戏可玩性。旅行青蛙作为 2018 年火爆出圈的小游戏,没有出众的游戏画面效果或丰富的游戏角色,而是单纯通过设置丰富的游戏情节,如一日三餐、各地旅行、寄明信片、牌照等一些列高度拟人化的游戏体验,来拢获游戏玩家心智。自 2017 年 12 月 21 日上架后一个月的时间内,该游戏在全球 App Store 中积累了 1000 万次下载。但由于情节、道具仍是固定的,所以旅行青蛙仍属于拟人化的线性游戏,玩家持续游玩的兴趣不强。根据 TapTap 按照近期下载热度计算的热门榜,《旅行青蛙:中国之旅》已经脱离放置类前 50 名的榜单。
斯坦福小镇通过 NPC 自驱将 AI 智能体带入大众视野,标志 AGI 的开始。斯坦福大学和谷歌联合发表了一篇名叫《GenerativeAgents: Interactive Simulacra of Human Behavior》的论文,学者们构建了一个由 25 名 AI 居民组成的虚拟小镇,小镇拥有咖啡馆、超市、公园、学校等设施,居民们根据预设目标自行驱动自己的生活轨迹,并且可以与其他居民产生联动交互。在这样的环境下,游戏将不再是固定的情节和结局,每位玩家都将通过与生成式 AI 的不同互动,得到不一样的游戏体验,非线性游戏时代由此到来。
3.3.2 自然语言界面改变人机交互模式
自然语言界面将人机互动从按键点击、搜索转变为人类自然语言与机器的对话。在过去,人们若想要通过网络搜寻信息,只能通过搜索引擎进行单一提问,再得到回答后进行第二次提问,以此类推;若想通过屏幕进行点餐,只能通过多种按键点击的操作实现目的。而随着大语言模型的发展,通过机器对自然语言的理解与处理,自然语言界面开始从处处改变人类生活,人们可以用人类自然语言完成与机器的对话,减少了人脑中将意识转变为语言、再将语言转变为按键操作或不同问题的拆分等流程,直接形成从「结果」到「结果」的对话与输出。
大家普遍认为,AIGC 的诞生是为了降本,帮助使用者在文字、图像、编程、视频和游戏策划等工作中节省心思。我们认为,降本只是生成式 AI 为人类上演的「牛刀小试」。随着我们越来越接近 AGI,AI 将不再局限于「copilot」助手,它将成为构建未来人类社会的基础框架。
AI 智能体,AGI 的开始。此前 OpenAI 的 Andrej Karpathy 就表示 AI 智能体是未来 AI 的前沿方向,我们认为,深入研究 AI 智能体是探索 AGI 的必经之路,AI 智能体的「记忆检索」和「反思自己的所作所为」两大核心原理引导着智能体进行各种高度拟人化的行动,而拟人化正是 AGI 的重要应用方向。以数字人为例,2D 数字人已经开始普及,但产业界更多关注能否提高数字人的交互性?能否用数字人构建多人场景?能否让数字人在交互中逐渐具备真实本人在专业领域的认知?未来的 AI 智能体正在这条路上探索。
投资建议
结合二级市场,近期 AI 板块在 Q2 大幅上涨之后出现回调,市场热度也出现明显下降。我们认为,作为未来科技领域的焦点赛道,不可高估短期而低估长期。根据第一性原理看 AIGC,下一步,更大的机会在哪里?
从投资角度看,我们总结如下:
1)算力层
一方面重视全球布局的行业领跑者,这类企业离本轮创新更近,更容易享受行业红利。与此前的 5G 行情有所不同,本来 AIGC 是完全由「从零到一」创新需求驱动的全球投资上行,因此,个股的订单上修、业绩释放是行业变化的结果而非起因。如果市场能接受 AIGC 逐渐成为工作、生活必不可少的工具,那么各种硬件加单将是必然结果,主要以光模块、交换路由设备、服务器、PCB 为代表。
另一方面,重视国产化趋势,AIGC 是下一轮全球科技创新的焦点,国内提倡数字经济也将聚焦与此,我们已经着手建立「东数西算」算力网络、算力租赁,叠加 5G、物联网的产业链优势,在 AIGC 时代大有可为。需要重视的是,AIGC 对超算网络的算力、功耗比提出了更高要求,会把更多材料、网络架构技术的商用时点拉近,这一趋势将会越来越明显。
2)模型层
大模式层面的竞争将持续,当前 OpenAI 对模型层面除了参数的考虑外,更多聚焦于进一步训练、合规与伦理,防止歧视与偏见。而在垂直领域则百花齐放,开源生态中,Meta 甚至直接给出可商用的 LLaMA2。投资层面,经过上半年的「百模大战」后,我们将进一步聚焦大模型的边际变化。大模型仍是互联网巨头的兵家必争之地,具备搜索、云计算能力的企业具备先发优势。
3)应用层
看好工具型应用 + 游戏、电商方向。我们认为本轮 AIGC 最大的变化在于 AI 的通识化和显性化,让其服务于大众用户。工具型应用因其本身覆盖面广,例如搜索引擎、Office 套件、视频会议系统等,上述也是微软与 OpenAI 首先拓展的领域,代表了主流玩家的策略。而游戏和电商则属于年轻人集中、变现能力较强且迭代迅速的领域,对于具备 IP 优势的企业将强化其变现能力,且向元宇宙的进化路径更为明确。
4)数据层
数据是 AI 训练的「粮食」,一来依靠数据的数量和质量,二来依靠 AGI 训练的方法论。年初我们就提出数据要素 +AI 的方向,认为数据要素的流转只是过程,而通过 AI 赋能千行百业才是更高效的方式。「风浪越大鱼越贵」,AIGC 时代数据的价值将进一步彰显。同时,在此一并讨论的就是 AI 的安全、伦理与隐私,我们认为这将是贯穿 AGI 发展始终的问题,AGI 越发达,这一问题就越凸显,如同面对一个赛博世界的新大陆,所有人都是摸着石头过河,但方向是明确的。
具体看来,我们建议关注以下方向:
算力:看好光通信及算力租赁,看好中际旭创、新易盛、天孚通信、太辰光、德科立、锐捷网络、寒武纪、美格智能、紫光股份、中兴通讯等;同时算力租赁业务顺势而起,看好恒为科技、中贝通信;
模型层:关注国内外大模型的边际变化,建议关注百度、科大讯飞、昆仑万维;
应用层:看好游戏的迭代创新,看好恺英网络、神州泰岳、盛天网络、紫天科技等;
数据层:看好中国移动、中国电信、中国联通以及浩瀚深度、人民网、新华网等。
风险提示
伦理风险:AI 驱动的人工智能交互过程中,可能出现伦理风险。
技术发展不及预期:AIGC 技术发展以及底层硬件技术不及预期,如:超级计算机、算力的发展不及预期。
政策法律监管风险:目前数字人和 AIGC 都处于发展初期,在知识版权等问题上还有许多尚不明确的地方。随着相关法律的逐步完善,或出现法律监管的问题。
本文节选自国盛证券研究所已于 2023 年 9 月 4 日发布的报告《AGI 应用的第一性原理——从 OpenAI 首笔收购说起》,具体内容请详见相关报告。
免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代表Bi123的观点或立场